Uloga posla: znanstvenik podataka

Autor: Roger Morrison
Datum Stvaranja: 28 Rujan 2021
Datum Ažuriranja: 11 Svibanj 2024
Anonim
Zaštita podataka o ličnosti
Video: Zaštita podataka o ličnosti

Sadržaj


Izvor: Sergey Khakimullin / iStockphoto

Oduzeti:

Znanstvenici s podacima imaju široke poslove koji se ovisno o aplikaciji znatno razlikuju. Ali jedno im je zajedničko nastojanje da se podaci dobro iskoriste.

Što znanstvenik podataka radi u vezi s umjetnom inteligencijom i strojnim učenjem? Mnogi profesionalci koji se svakodnevno bave ovakvim projektima rekli bi da je teško teško jednostavno odgovoriti. Bolje bi pitanje bilo: Što podaci znanstvenici NE rade?

Znanstvenik podataka je sastavni dio AI ili ML procesa, u smislu da svi ti projekti ovise o velikim podacima ili složenim ulazima. Znanstvenik podataka je osnovni karijerist koji zna kako raditi s podacima da bi se dobili rezultati.

Međutim, postoje neki načini za razgovor o tome što znanstvenik podataka radi, koje kvalifikacije su mu potrebne i koja je njegova uloga u tom procesu.

Čitati: 6 ključnih pojmova o znanosti o podacima kojima možete savladati putem online učenja


Različite definicije, različite dužnosti

Mnogi stručnjaci koji opisuju rad znanstvenika s podacima govore o njemu u širokom smislu.

"U malim tvrtkama ili kada rade na novom tržištu, uloga podatkovnog znanstvenika je pretvoriti relativno nove (ali očite) izvore podataka u stvari koje rješavaju problem krajnjeg korisnika, a što prije ne bi bilo moguće, tamo gdje korištene tehnologije nisu postojale ", kaže Antonio Hicks, direktor računa Mercury Global Partnersa. "Idealan kandidat je netko tko je dio matematičara, dio softverski inženjer, a dio poduzetnik."

Drugi potječu s ovom osnovnom idejom, spominjući što su podaci znanstvenici potrebni za rješavanje projekata modeliranja.

"Najvažnija osobina podataka koju znanstvenik treba je duboka znatiželja o svijetu oko sebe - bilo da odgovore na pitanja ili grade modele, ključna je želja za razumijevanjem problema ispred njih", kaže Erin Akinci, menadžer podataka znanstvenika kod Asane. "Odatle će većini ljudi trebati vještine matematike i programiranja kako bi pronašli rješenja, ali specifične vrste matematike i programiranja uvelike variraju ovisno o području stručnosti u znanosti o podacima."


Bez grešaka, bez stresa - Vaš korak po korak vodič za stvaranje softvera koji mijenja život bez uništavanja života

Ne možete poboljšati svoje programiranje kad nikoga nije briga za kvalitetu softvera.

"Izvrsni znanstveni rad ima više veze s načinom na koji znanstvenik razmišlja o problemu nego alatima koji ga koriste za rješavanje", dodaje Charlie Burgoyne, osnivač i izvršni direktor Valkyrie Intelligence. Valkyrie je konzultantska savjetodavna tvrtka sa svojim impresivnim projektima pod krilima poput Mark I, namjenskog mrežnog uređaja koji pojačava obuku i testiranje neuronske mreže, poboljšavajući što je moguće s prethodnim platformama strojnog učenja temeljenog na oblaku.

"Tržište zahtijeva znanstvenike koji su iskusni u razvoju Pythona, dizajnu neuronske mreže i sposobnosti preoblikovanja skladišta podataka u najnoviju arhitekturu baze podataka", kaže Burgoyne. "Međutim, te su sposobnosti uloženi stolovi za talentiranog znanstvenika. Ono što je manje očito jest sposobnost znanstvenika za neustrašivu znatiželju, agresivnu domišljatost i privrženost znanstvenoj metodi. "

Vještine znanstvenika s podacima

Dakle, što se tiče praktičnih vještina, znanstvenicima s podacima potrebno je malo kreativnosti i spretnosti što se tiče modeliranja. Oni također mogu imati veliku korist od „tvrdih vještina“, poput kodiranja iskustva u Python-u, C ++ ili drugim uobičajenim jezicima primijenjenim na ML projekte.

"Python i C ++ su bitni i sposobni su kombinirati vještine kodiranja s analizom i obradom podataka i statistike osnovne vještine zbog kojih će se znanstvenik podataka istaknuti kao jak kandidat ili zaposlenik", kaže Val Streif iz Pramp-a, internetske platforme za intervju za softverske inženjere, programere i znanstvenike podataka. "Iako bi se za neke programske vještine moglo voditi računanjem uparivača podataka s programerom, puno je lakše ako obje vještine kombinirate u jednoj, iz perspektive tvrtke."

Ostali stručnjaci dodaju R, Hadoop, Spark, Sas i Java na popis, kao i tehnologije poput Tableau, Hive i MATLAB.

Svi oni čine impresivan nastavak, ali neki od onih koji imaju iskustva s zapošljavanjem znanstvenika kažu da su i druge, "ljudske" strane, također. (Jedna vrsta znanstvenika podataka je znanstvenik o podacima o građanima. Saznajte više u Ulozi građana o podacima podataka u svijetu velikih podataka.)

"Tradicionalno, pojedinci s raznovrsnim obrazovanjem o liberalnoj umjetnosti čine izvrsne znanstvenike s podacima", kaže Burgoyne, praveći razliku između inženjera koji su na gradilištu i znanstvenika s podacima, čiji rad može biti mnogo konceptualniji. Nastavlja:

Stručnost u tradicionalnom polju STEM s komplementarnim fokusom na humanističkim, umjetničkim ili poslovnim područjima daje one kvalitete zbog kojih je izvrstan znanstvenik orijentiran prema industriji. Mora se reći da je ono što je jednako važno za sposobnost organizacije da iskoristi te kvalitete i da na svoj produktivan način oblikuje svoj žar i metode. Primijetio sam da kada je inicijativa za znanost o podacima neuspješna, organizacija će biti jednako krivnja kao i znanstvenici. Znanstvenici nisu inženjeri. Oni nisu vođeni da izvršavaju i grade. Potaknuti su da otkriju i razumiju. Organizacije koje shvate ovu razliku dobro su nagrađene za obrađivanje oba polja.

Što se tiče podataka na koje se znanstvenici obično odnose, to ima veze sa temeljnim ciljevima tvrtke. Neke tvrtke jure za decentraliziranim internetom - neke se igraju putem IoT-a ili SaaS-a. Drugi pokušavaju uvesti u napredni "user-friendly" ili "etički" ili "transparentni" AI.

U svakom slučaju, znanstvenici s podacima vjerojatno će premostiti jaz između tvrdih mjernih podataka na podacima koje koriste, bez obzira na to koji su to tehnološki skupi i slobodnog rada na koncipiranju AI / ML funkcionalnosti.

"Angažiramo znanstvenike koji upravljaju prikupljanjem i čišćenjem podataka, kao i prevođenje tih podataka u značajne informacije", kaže Michael Hupp, menadžer za Data Science i Analytics u G2 Crowd. Razrađuje:

To obično znači upravljanje bilo kojim važnim algoritmima koji upravljaju podacima tvrtke i tečno upravljaju ključnim analitičkim alatima i jezicima, ali posljednjih godina uključuju i nova područja poput obrade prirodnog jezika, strojnog učenja, drugih oblika analize omogućenih AI. Najuspješniji znanstvenici podataka su oni koji kombiniraju svoje naporne vještine sa sposobnošću brzog učenja i sposobnosti učinkovitog komuniciranja uvida koji otkrivaju kako bi bili od značaja za njihov posao.

Pomoću ove vrste uvida mladim profesionalcima ili studentima lakše je shvatiti hoće li im znanstvenik podataka biti dobra uloga i kako steći vještine. STEM učenje postaje dostupnije u školama širom zemlje, ali ne postoji zamjena za strast za kodiranjem i tehnologijom i sposobnost za učenje u letu.