Znanstvenici podataka: Nove rock zvijezde svijeta tehnologije

Autor: Robert Simon
Datum Stvaranja: 24 Lipanj 2021
Datum Ažuriranja: 1 Srpanj 2024
Anonim
High Density 2022
Video: High Density 2022

Sadržaj


Izvor: Onradio / iStockphoto

Oduzeti:

Uloga znanstvenika podataka brzo postaje najtraženija karijera u tehnološkom svijetu. Pitali smo vrhunskog znanstvenika podataka Jakea Porwaya iz New York Timesa o tome kako je dobio posao i njegove savjete za uspjeh na terenu.

Uloga znanstvenika podataka brzo postaje najtraženija karijera u tehnološkom svijetu. Tvrtke poput Google,, Amazon i LinkedIn koriste znanstvenike s podacima kako bi im pomogle održati tu inovativnu prednost u eri digitalnih podataka. A sada ljubitelji podataka i tehnologije teže postati znanstvenici, na isti način na koji neki glazbenici teže postati rock zvijezde. Možda zato neki ljudi znanstvenicima podataka nazivaju novim rock zvijezdama tehnološke ere.

Nažalost, ova je uloga još uvijek toliko nova da postoji još uvijek nepoznanica oko nje, što znači da mnogi znanstvenici žele da svoje autobuse voze krivim putem. Da li znanstvenici s podacima zaslužuju reputaciju rock zvijezde? Zaronimo u svijet znanosti o podacima intervjuom s Jakeom Porwayem, znanstvenikom o podacima iz istraživačko-razvojnog laboratorija u The New York Timesu.


Znanstvenici: Tech Rock zvijezde?

Pa zašto se znanstvenici podataka nazivaju novim rock zvijezdama tehnološkog svijeta? Ova analogija zapravo ide dublje od želje za podacima koji zvuče kao ultracool. Baš poput rock zvijezde, karijera podataka znanstvenika uključuje raznolikost, umjetničku slobodu i prilagodljivost. Kao i rock zvijezde svijeta zabave, i najbolji znanstvenici podataka uglavnom prikupljaju ljude iz svih područja industrije podataka i tehnologije.

Ono što znanstvenik podataka čini vrlo je raznoliko; baš kao što glazbenici koriste različite instrumente, alate i tehnike za sviranje glazbenih stilova koji su različiti poput jazza i death metala, tako znanstvenik s podacima također ovladava određenim alatom i poljem. Tu je uključen i njihov stil. A ni taj nije pravi ili pogrešan način obavljanja posla - riječ je o utjecaju koji posao ima na druge ljude.

Kad su Beatlesi pisali svoje pjesme, nije samo jedna osoba diktirala kako treba svirati svaku notu na svakom instrumentu. Skupili su se i zaglavili; kroz kreativno otkriće pronašli su pjesme koje su djelovale. Isto je i za znanstvenike podataka. Moraju osjetiti ritam, ući u žlijeb i uskladiti rješenje. To je moguće samo uz pravu količinu umjetničke slobode isprobati bilo koje pristupe, alate i tehnike koje vam padnu na pamet u ovom trenutku - i spretnost da napravite promjene kada vam se nešto čini kao da nije ključno.


Jednom kada istraživač podataka ovlada temeljnim osnovama, postaje prilagodljiv i stiče samopouzdanje za pružanje rješenja u drugim područjima. O ovim temeljnim osnovama razgovaramo više. Poanta ovdje je da jednom kada savladate znanost o podacima možete preuzeti ulogu na bilo kojem polju koje želite, jer podaci su posvuda.

Krajnji je cilj znanstvenika podataka stvoriti ogromne količine vrijednosti za što veći broj ljudi. Dok istraživač podataka radi iza kulisa, to nije za razliku od igranja širokoj publici: Što bolje radite posao, više ljudi nađete - i više nagrade vidite.

Znanstvenici s podacima što rade?

Pa što točno rade znanstvenici s podacima? Provjerimo to primjerom na kojem bismo se svi mogli odnositi.

Bez grešaka, bez stresa - Vaš korak po korak vodič za stvaranje softvera koji mijenja život bez uništavanja života

Ne možete poboljšati svoje programiranje kad nikoga nije briga za kvalitetu softvera.

Recimo da jednog dana shvatite da nemate istu količinu energije kao i dan ranije. Tako ste si postavili cilj: imati više energije tijekom dana. To je prilično širok i dvosmislen cilj. Stoga je prvi korak znanstvenika podataka uklanjanje neke te nejasnoće i kvantificiranje mjerljivosti tih ciljeva. Postoje metode za to. Nećemo ovdje ulaziti u pojedinosti, ali samo ćemo reći da teoretizirate da ne spavate dovoljno i stoga sebi dajete pod-cilj da osam sati spavate svake večeri.

Iako je ovaj cilj malo mjerljiviji i manje dvosmislen, on ima svoje izazove. Ne možete stvarno pokrenuti tajmer nakon što zaspite, a čak i ako pokrenete tajmer nakon što skočite u krevet, možda nećete zaspati odmah. Osim toga, teško je objasniti vremena koja se probude usred noći. Na kraju, postoje različite vrste sna, kao što su dubok san i lagani san. Suština je u tome da je teško točno izmjeriti san, a samim tim i teže izmjeriti njegov utjecaj na vaše razine energije.

Pa što možeš učiniti? Pa, kao istraživač podataka tražite najnovije tehnologije i otkrijte da postoje uređaji za nadzor spavanja.A ako ste takav uređaj koristili za mjerenje i digitalno snimanje sna, bili biste u mogućnosti dobiti preciznije podatke o snu i prikupiti te podatke s vremenom kako biste nacrtali graf.

Samo ovo vam može dati bolji uvid u ono što se događa. Vizualni prikaz dat će vam svijest, jasnoću i smjer. Moći ćete vidjeti postižete li svoj cilj osam sati sna noćno i, što je još važnije, moći ćete poduzeti mjere ako niste.

To je osnovni posao istraživača podataka: donijeti nove načine mjerenja i prikazivanja podataka kako bi se onima koji je gledaju pružila veća svijest, jasnoća i smjer.

No dobar znanstvenik s podacima tu ne staje. Jednom kada se podaci prikupe, oni se mogu integrirati s bilo kojom drugom izmjerenom aktivnošću koju obavljate tijekom dana. Integrirajte ga sa svojom produktivnošću na temelju podataka vašeg sustava upravljanja zadacima. Integrirajte ga sa svojim raspoloženjima na temelju tvita i ažuriranja statusa. Integrirajte ga sa svojim zdravljem na temelju posjeta teretani ili gubitka kilograma. Uz već dostupnu količinu podataka i lakoću prikupljanja podataka mogućnosti su beskrajne.

Kako biti znanstvenik podataka

Zanima vas karijera u polju podataka o znanosti? Budući da je podatkovna znanost toliko nova, zamolili smo vrhunskog znanstvenika za uvid u teren. Jake Porway znanstvenik je podataka u New York Timesu i osnivač DataKind-a (izvorno poznat kao Podaci bez granica), koji se podudara s neprofitnim organizacijama kojima je potrebna podatkovna znanost sa slobodnim i pro-bono znanstvenicima podataka. Porway ima pozadinu informatike i doktorande. u statistikama iz UCLA-e. Evo što je rekao o tome kako se upustiti u znanost o podacima, kako ih izvesti i kako izbjeći ključne pogreške na terenu.

1. Steknite prave vještine

Prema Porwayu, ulazak u polje svodi se na tri ključne stvari:

  • Praktične vještine računanja
  • Statističke vještine
  • Želja za učenjem

"Morate biti u mogućnosti pisati skripte za brisanje podataka, kao i kodirati algoritme koje vam se stvori u glavi", kaže Porway. "Trebali biste znati svoju osnovnu statistiku (i više, u idealnom slučaju) ako ćete zaista moći procijeniti rade li modeli koje gradite ili algoritmi koje pišete rade ono što želite."

2. Uspostavite vezu

Prije nego što se pridružio laboratoriji za istraživanje i razvoj New York Timesa, Porway se bavio strojnim učenjem i računalnim vidom te je proveo puno vremena nabavljajući robote na prepoznavanju minskih i letećih aviona (koliko je cool da?). Tek kad je započeo posao u The New York Timesu, morao se proširiti na šire znanstvene zadatke, naime Project Cascade koji prati veze publikacije preko društvenih medija.

Najvažnija stvar na terenu, kaže Porway, jest učenje.

"Uključite se u projekt znanosti o podacima!" Porway kaže. "Preuzmite neke podatke, pokupite neki R i počnite se igrati ... Idem reći da se usredotočite na korištenje nečeg poput R uz osnovnu knjigu statistika koja će vas voditi kroz istraživanje nekih podataka. Strojno učenje i računalne vještine doći će uz to naravno, to ovisi o vašem dosadašnjem iskustvu - ako ste već statističar, pokupite malo Pythona!) "

Tada je vrijeme za uspostavljanje nekih veza. Porway preporučuje lokalnu skupinu za upoznavanje - jer biti dio znanstvene zajednice podataka "je najbrži način da saznate ono što ne znate." A na polju koje se stalno razvija, to je važno.

3. Uđite u igru

Porway ima doktorat. u statistikama s UCLA-a, ali on naglašava da vam za dobar posao nije potreban.

"To bi moglo pomoći, ali nemojte misliti da morate otići i napraviti još pet godina škole kako biste mogli sebe nazivati ​​znanstvenikom podataka", rekao je Porway.

Znanost podataka relativno je novo područje. To znači da oni koji žele izaći na teren trebaju mu pristupiti otvoreno.

"Znanstvenik podataka u Foursquareu izgledat će mnogo drugačije od znanstvenika podataka u Goldman Sachsu", kaže Porway.

4. Zamijenite svoju novu ulogu

Znanost podataka je sve o razjašnjavanju ciljeva, ispitivanju pretpostavki, ocjeni dokaza i ocjeni zaključaka. Ali tu je jedan mali dio zagonetke koji mnogi ljudi previdje. Možete li pogoditi o čemu se radi? Prema Porwayu, tajni sastojak je kritičkog razmišljanja.

"To zaista razlikuje hakere od pravih znanstvenika, po meni", kaže Porway. "Bili biste zadivljeni koliko sam puta vidio da netko izrađuje model i izvještava o rezultatima ne shvaćajući da nisu kritički razmišljali o tome odakle podaci dolaze ili je njihov eksperiment dizajniran pravilno. Morate MORO biti u stanju propitivati ​​svaki korak vašeg procesa i svakog broja koji ste osmislili. "

Put do velikih podataka

Porway kaže da mu je, kad je uvidio sposobnost korištenja ogromne količine podataka za podučavanje strojeva, to razbuktalo njegov um. Njegova strast - i njegovo obrazovanje i vještine - pomoglo mu je da se domogne vrhunskog posla u znanosti o podacima. Ako želite zbližiti velike podatke, složite se s nekim knjigama, preuzmite neke podatke i počnite se igrati. Nikad ne znate što će se gomila neobrađenih podataka pojaviti.

Kompletni transkript intervjua potražite na stranici DataScientists.Net.