Znanost o podacima ili strojno učenje? Evo kako uočiti razliku

Autor: Laura McKinney
Datum Stvaranja: 3 Travanj 2021
Datum Ažuriranja: 1 Srpanj 2024
Anonim
Khác nhau giữa trí tuệ nhân tạo (AI), Machine Learning và Deep Learning |Tri thức nhân loại
Video: Khác nhau giữa trí tuệ nhân tạo (AI), Machine Learning và Deep Learning |Tri thức nhân loại

Sadržaj


Izvor: Elnur / Dreamstime.com

Oduzeti:

Znanost podataka i strojno učenje razlikuju se na ključne načine. Na neki način, jedno se može posmatrati kao podskup drugog. Oba su važna u trenutnom napretku informatike.

U ovom novom svijetu umjetne inteligencije i upravljanja podacima lako je zbuniti se nekim pojmovima koji se najčešće koriste u IT svijetu.

Na primjer, znanost o podacima i strojno učenje imaju puno veze jedno s drugim. Nije iznenađujuće da bi mnogi ljudi koji samo poznaju te discipline teško promišljaju kako se one međusobno razlikuju.

Evo najboljeg načina za odvajanje znanosti o podacima od strojnog učenja, kao princip i kao tehnološki pristup.

Znanost podataka i strojno učenje: široka i uska terminologija

Prije svega, podatkovna znanost je zaista široka, sveobuhvatna kategorija tehnologije koja obuhvaća mnogo različitih vrsta projekata i kreacija. (Više o tome što se uključuje u posao znanosti o podacima potražite u Ulogu za posao: Data Scientist.)


Znanost podataka u osnovi je praksa rada s velikim podacima. Pojavilo se to kako je Mooreov zakon i širenje učinkovitijih uređaja za pohranu dovelo do ogromnih količina podataka koje su prikupljale tvrtke i druge stranke. Tada su velike podatkovne platforme i alati poput Hadoopa počeli redefinirati računarstvo mijenjajući način rada podataka. Sada, uz oblak i kontejnerizaciju, kao i potpuno nove modele, veliki podaci postali su glavni pokretač načina na koji radimo i živimo.

Znanost podataka u svom najjednostavnijem obliku je način na koji upravljamo tim podacima, od njihovog čišćenja i rafiniranja do upotrebe u obliku uvida.

Definicija strojnog učenja mnogo je uža. U strojnom učenju tehnologije uzimaju podatke i stavljaju ih kroz algoritme, kako bi simulirali ljudske kognitivne procese opisane kao "učenje". Drugim riječima, računalo je uzela podatke i uvježbala se na njima da može dati vlastite rezultate. , gdje se čini da se tehnologija naučila iz procesa koje programeri postavljaju.


Setovi vještina podataka i strojnih učenja

Drugi način za uspoređivanje znanosti o podacima i strojnog učenja je sagledavanje različitih vještina koje su profesionalcima najvrjednije u bilo kojem od ovih područja.

Bez grešaka, bez stresa - Vaš korak po korak vodič za stvaranje softvera koji mijenja život bez uništavanja života

Ne možete poboljšati svoje programiranje kad nikoga nije briga za kvalitetu softvera.

Postoji opći konsenzus da znanstvenici s podacima uživaju duboke analitičke i matematičke vještine, praktično iskustvo s tehnologijama baza podataka i znanje programskih jezika poput Pythona ili drugih paketa koji se koriste za analizu velikih podataka.

"Svatko tko je zainteresiran za izgradnju snažne karijere u (data science) trebao bi steći ključne vještine u tri odjela: analitika, programiranje i znanje o domenama", piše Srihari Sasikumar iz Simplilearn. „Prolazak jedne razine dublje, sljedeće vještine pomoći će vam da stvorite nišu kao znanstvenik podataka: Snažno znanje Pythona, SAS-a, R (i) Scale, praktično iskustvo u kodiranju SQL baze podataka, sposobnost rada s nestrukturiranim podacima iz različiti izvori poput video i društvenih medija, razumiju brojne analitičke funkcije (i) znanje strojnog učenja. "

Na strani strojnog učenja stručnjaci često navode vještine modeliranja podataka, vjerojatnost i statističko znanje te šire vještine programiranja kao korisne alate u alatu alata strojnog učenja.

Kako uočiti strojno učenje

Ovdje je ključno to što sve vrste podataka obuhvaćaju znanost o podacima, ali to nije strojno učenje, osim ako niste postavili vrlo strog režim rada kako bi računalo moglo naučiti iz njegovih ulaza.

Kad se to uspostavi, to omogućava neke iznenađujuće sposobne sustave koji mogu imati široki utjecaj na naš život.

"Mnogo toga što radimo s strojnim učenjem događa se ispod površine", izjavio je navodno osnivač Amazona, Jeff Bezos, ističući neke od primjena ovih vrsta sustava. „Strojno učenje pokreće naše algoritme za predviđanje potražnje, rangiranje pretraživanja proizvoda, preporuke za proizvode i ponude, položaje u trgovini, otkrivanje prijevara, prijevode i još mnogo toga. Iako je manje vidljiv, velik dio utjecaja strojnog učenja bit će ove vrste - tiho ali značajno poboljšavajući temeljne operacije. "

Jedan od najkorisnijih primjera ovdje je pojava neuronske mreže - to je uobičajena i popularna metoda namještanja procesa strojnog učenja.

U svom najosnovnijem obliku, neuronska mreža sastoji se od slojeva umjetnih neurona. Svaki pojedinačni umjetni neuron ima funkciju jednaku biološkom neuronu - ali umjesto sinapsi i dendrita, on ima ulaze, funkciju aktiviranja i moguće izlaze.

Neuronska mreža napravljena je tako da djeluje poput ljudskog mozga, a profesionalci za strojno učenje često koriste ovaj model za stvaranje rezultata strojnog učenja.

Međutim, to nije jedini način strojnog učenja. Neki više rudimentarnih projekata strojnog učenja jednostavno uključuju prikazivanje računala širokom rasponu fotografija (ili ga opskrbljuju drugim neobrađenim podacima), unošenje ideja kroz postupak korištenja nadziranog strojnog učenja i podataka o etiketama, te mogućnost da računalo na kraju može razlikovati između razni oblici ili predmeti u vizualnom polju. (Za osnove strojnog učenja potražite na Strojnom učenju 101.)

Dvije rezovne discipline

Zaključno, strojno je učenje vrijedan dio znanosti o podacima. No, znanost o podacima predstavlja granicu vaze i kontrastu u kojoj se odvija strojno učenje.

Na neki način mogli biste reći da se strojno učenje nikada neće dogoditi bez velikih podataka. Veliki podaci sami po sebi nisu stvorili strojno učenje - umjesto toga, nakon što smo skupili toliko podataka da gotovo nismo znali što s njima, vrhunski umovi smislili su ove bio-simulacijske procese kao način napunjen pružanja uvida.

Još jedna dobra stvar koju ovdje treba imati na umu je da se znanost podataka može primijeniti na dva glavna načina - možemo prigrliti strojno učenje i umjetnu inteligenciju, prepuštajući računalima da misle umjesto nas, ili možemo vratiti znanost podataka u pristup koji je više usmjeren na ljude gdje računalo jednostavno daje rezultate i mi kao ljudi donosimo odluke.

To vodi neke stručnjake, uključujući neke od današnjih najboljih inovatora, koji traže živahnije računovodstvo načina na koji koristimo te tehnologije.

"(AI) je sposoban za gotovo više nego što gotovo svi znaju, a stopa poboljšanja je eksponencijalna", citiran je Elon Musk, upozoravajući da strojno učenje i AI programi zahtijevaju nadzor.

U svakom slučaju, i znanost o podacima i strojno učenje osnovni su dio napretka koji danas kao društva postižemo u tehnologiji.