Mučenje vode - Analogija s analitikom ide predaleko

analitika kapanja

Podaci, poput vode, dolaze u mnogim oblicima. Ljudski um evoluirao je tako da filtrira većinu podataka koji nam dolaze jer ih jednostavno ima toliko.

Kad otvorite oči i uši, podataka ima svugdje. Boja zida, zvuk klima uređaja i miris kave vašeg susjeda tretiraju se poput vlage. Voda je cijelo vrijeme u zraku, ali nije korisno obraćati joj puno pažnje.

Kad se voda kondenzira u maglu, prisiljava vas da je vidite i otežava razumijevanje svijeta oko sebe. Nepotpuni skupovi podataka, oštećeni podaci, loša znanost, lažni zaključci i kognitivna pristranost čine da se izgubite u magli.

Podaci padaju poput kiše. Kad je malo, to je divlje nezadovoljavajuće - tek toliko da vaš automobil uprlja i zbuni razgovor. Zateknete kako brišete mjesto s naočala dok netko izlijeva neku slučajnu točku podataka, prikupljenu iz nekog opskurnog izvora.

  • Ustajala voda u plitkom ribnjaku je opasno. Podaci prikupljeni iz nepouzdane opskrbe, niti pročišćeni ili normalizirani i ostavljeni da miruju, lako mogu dovesti do pogrešnih zaključaka.
  • A postojana kapljica vode može biti taman toliko da napuni menzu ili održi šumski ekosustav. Samo tri podatkovne točke (broj poslanih e-poruka, otvorenih i kliknutih) mogu održati marketinški program.
  • A zdraviji protok podataka u obliku malog potoka može se koristiti za kupanje. Stalni protok podataka omogućuje usporedbu i povijesnu usporedbu. Optimizacija odredišne ​​stranice može se postići stalnim podacima o pretvorbi.
    A skromna rijeka može pogoniti mlin za piljenje drva ili mljevenje pšenice. Stroju za preporuke potreban je samo pouzdan doprinos nekolicine pritoka kako bi se povećala vrijednost kolica.
  • A vodopad može pokrenuti ogromni vodeni kotač, a dovoljan priljev informacija može pokretati sustav dinamičnog sadržaja u stvarnom vremenu.
  • A rijeka koji je dovoljno širok i dubok može podržati čitavu industriju prijevoza. Dovoljno podataka može plutati teglenicama i teretnim brodovima u obliku zbirke kolačića s oglašivačkih mreža, agregatora podataka programa vjernosti i posrednika podataka.

Kada podaci stignu u očekivanim količinama u predviđenim vremenima, mogu se prikupiti, kanalizirati i staviti u upotrebu. Sustavi za navodnjavanje, brane i rezervoari pružaju osjećaj kontrole i omogućuju izgradnju sve šire infrastrukture s kanalima, bravama i branama. Skladišta podataka izgrađena su na manje pouzdanim tokovima.

Čistoća je uz bogoljubnost

Čista voda je vitalna za uspjeh života, navodnjavanje, pokretanje elektrana itd. Definicija „čista“ može se promijeniti u svrhu; u redu je ako u vodi ima algi koja hladi elektranu i nije prihvatljivo ako u pitkoj vodi ima više od 10 dijelova na milijardu arsena.

Podaci su isti. U prijavi za izravnu poštu nije važno da li imate naslov osobe (gospodin, gospođa, gospođa) ... osim ako ne šaljete poštu liječnicima. Ali prljavi podaci svaki put će vas saplesti.

Kao glavni američki znanstvenik za podatke, DJ Patil, stavite to na sastanku na vrhu CTO-a u prvom krugu, „Ako od samog početka ne razmišljate o tome kako održavati podatke čistima, onda ste f ^ ¢ & ed. Garantiram. Pokušaj čišćenja nakon činjenice potrajat će najmanje mjesecima. "

Ako vodu zagrijete do točke vrenja, ona može pokrenuti cijelu industrijsku revoluciju. Čini se da podaci rade istu stvar. Od trenutka kada su računala mogla pohranjivati ​​i računati, podaci se prikupljaju onoliko brzo koliko se za to može stvoriti oprema za pohranu.

Jezero podataka

Dok se podaci s ovih pritoka provlače kroz mlinove motore, sve završava u jezeru, iza brane. Kako se podaci puštaju kontrolirano, oni pokreću turbine podatkovne industrije; oni divovski motori obrade podataka s imenima poput Googlea i Facebooka. Ovdje neće biti suše.

I, konačno, postoji dubok bazen vode koji čeka analitičara da zaroni. Skuba i koplje u ruci, analitičar istražuje dubinu, mapira novo tlo i otkriva nove vrste. Vrlo je uzbudljivo vrijeme biti istraživač podataka.

Zato se toliko mnogo njih pojavilo za Summit eMetrics od 2002. Sljedeća prilika je u Bostonu, od 27. rujna do 1. listopada 2015.

Prijava na eMetrics Summit

Bridge Too Far

A što je s moći podataka za urezivanje sljedećeg Velikog kanjona? Što je s ledenjačkim topljenjem strukturiranih podataka? Kako se odnosimo prema otpadnoj vodi u svijetu koji postaje sve više svjestan privatnosti?

To su pitanja za neko drugo vrijeme i voda ispod mosta.

Što vi mislite?

Ova web stranica koristi Akismet za smanjenje neželjene pošte. Saznajte kako se podaci vašeg komentara obrađuju.