![Koji su ključni načini za automatizaciju i optimizaciju procesa znanosti podataka? googletag.cmd.push (funkcija () {googletag.display (div-gpt-ad-1562928221186-0);}); P: - Tehnologija Koji su ključni načini za automatizaciju i optimizaciju procesa znanosti podataka? googletag.cmd.push (funkcija () {googletag.display (div-gpt-ad-1562928221186-0);}); P: - Tehnologija](https://a.continuousdev.com/technology/what-are-some-key-ways-that-the-iot-is-affecting-health-care-googletagcmdpushfunction-googletag.displaydiv-gpt-ad-1562928221186-0-q.jpg)
Sadržaj
P:
Koji su ključni načini za automatizaciju i optimizaciju procesa znanosti podataka?
A:
Procesi znanosti o podacima u vezi s strojnim učenjem i AI mogu se podijeliti u četiri različite faze:
- prikupljanje podataka i istraživanje,
- izrada modela,
- implementacija modela i
- mrežno vrednovanje i usavršavanje.
Iz mog iskustva, najviše ometaju faze prikupljanja podataka i faze implementacije modela u bilo kojem procesu znanosti o podacima temeljenom na strojnom učenju, a evo dva načina za njihovu optimizaciju:
1. Uspostavite visoko dostupnu prodavaonicu podataka.
U većini organizacija podaci se ne pohranjuju na jednom središnjem mjestu. Uzmimo samo podatke koji se odnose na kupce. Imate podatke o kontaktima s klijentima, korisničku podršku, povratne informacije o kupcima i povijest pregledavanja kupaca ako je vaša tvrtka web aplikacija. Svi su ti podaci prirodno raštrkani, jer služe u različite svrhe. Mogu se nalaziti u različitim bazama podataka, a neke mogu biti u potpunosti strukturirane, a neke nestrukturirane, pa mogu biti pohranjene i kao obične datoteke.
Nažalost, raspršenost ovih skupova podataka vrlo je ograničavajući se na znanost o radu podataka jer je osnova svih NLP, strojnog učenja i AI problema. podaci, Dakle, posjedovanje svih tih podataka na jednom mjestu - prodavaonici - najvažnije je u ubrzavanju razvoja i korištenja modela. S obzirom da je ovo presudan dio za sve procese znanosti podataka, organizacije bi trebale zaposliti kvalificirane inženjere podataka koji će im pomoći u izgradnji njihovih baza podataka. Ovo se lako može pokrenuti kao jednostavna odlaganja podataka na jedno mjesto i polako prerasti u dobro osmišljeno spremište podataka, u potpunosti dokumentirano i podložno ispitivanju pomoću uslužnih alata za izvoz podskupina podataka u različite formate za različite svrhe.
2. Izložite svoje modele kao uslugu neprekidne integracije.
Uz omogućavanje pristupa podacima, također je važno biti u mogućnosti integrirati modele koje su razvili znanstvenici podataka u proizvod. Integriranje modela razvijenih u Pythonu s web aplikacijom koja radi na Rubyju može biti vrlo teško. Uz to, modeli mogu imati dosta ovisnosti o podacima koje vaš proizvod možda neće moći pružiti.
Jedan od načina da se to riješi je da postavite snažnu infrastrukturu oko svog modela i izložite dovoljno funkcionalnosti koja su potrebna vašem proizvodu da bi se model mogao koristiti kao "web usluga". Na primjer, ako vašoj aplikaciji treba klasifikacija osjećaja na recenzije proizvoda , sve što trebate učiniti je pozivanje na web uslugu, pružanje relevantne i usluga će vratiti odgovarajuću klasifikaciju osjećaja koje proizvod može izravno koristiti. Ova je integracija jednostavno u obliku API poziva. Ako razdvojite model i proizvod koji ga upotrebljavate, stvarno je lako za nove proizvode koje osmislite da možete koristiti i ove modele s malo gnjavaže.
Sada je postavljanje infrastrukture oko vašeg modela čitava druga priča i zahtijeva velika početna ulaganja vaših inženjerskih timova. Jednom kada je infrastruktura tamo, to je samo pitanje stvaranja modela na način koji se uklapa u infrastrukturu.