Današnji veliki izazovi podataka potiču od raznolikosti, a ne volumena ili brzine

Autor: Judy Howell
Datum Stvaranja: 28 Srpanj 2021
Datum Ažuriranja: 23 Lipanj 2024
Anonim
Današnji veliki izazovi podataka potiču od raznolikosti, a ne volumena ili brzine - Tehnologija
Današnji veliki izazovi podataka potiču od raznolikosti, a ne volumena ili brzine - Tehnologija

Sadržaj


Oduzeti:

Previše IT odjela baca sve što imaju oko pitanja obujma i brzine podataka, zaboravljajući riješiti temeljno pitanje raznolikosti podataka.

Izazov upravljanja i iskorištavanja velikih podataka dolazi iz tri elementa, rekao je Doug Laney, potpredsjednik istraživanja u Gartneru. Laney je prije više od desetljeća primijetio da veliki podaci predstavljaju takav problem za tvrtku, jer unosi teško upravljani volumen, brzinu i raznolikost. Problem je u tome što previše IT odjela baca sve što imaju o pitanju obujma i brzine podataka, zaboravljajući riješiti temeljno pitanje raznolikosti podataka.

Još 2001., Laney je napisao da će "vodeća poduzeća sve više koristiti centralizirano skladište podataka da bi definirali zajednički vokabular poslovanja koji poboljšava unutarnju i vanjsku suradnju. Pitanje tog vokabulara - i varijabilnost koja sprečava kompanije da ga stvaraju - ostaje i dalje najmanje obrađeni aspekt velike zagonetke podataka. (Provjerite što drugi stručnjaci imaju za reći. Pogledajte stručnjake za velike podatke koje treba slijediti.)


Tri Vs velikih podataka

Brojna su poduzeća pronašla metode za korištenje povećanog volumena i brzine podataka. na primjer, može analizirati ogromne količine podataka. Naravno, ti se podaci često iznova i iznova prikazuju u istim parametrima. To je potaknulo tehnološke inovacije, poput baza podataka baze stupaca, koje danas široko koriste druge tvrtke koje se suočavaju s jednako velikim trgovinama sličnih podataka.

U pogledu brzine pripitomljavanja, dobavljači poput Splunka pomažu poduzećima u analiziranju brzo stvorenih podataka putem zapisnika koji bilježe nekoliko tisuća događaja u sekundi. Ova analiza velikih razmjera događaja usmjerena je na slučajeve uporabe sigurnosti i praćenja performansi. Kao i kod izazova za količinu podataka, i izazov brzini uvelike je riješen sofisticiranim tehnikama indeksiranja i distribuiranom analitikom podataka koji omogućuju razmjenu kapaciteta za obradu s povećanom brzinom podataka.

Međutim, kada je u pitanju raznolikost, previše se poduzeća još uvijek suočava s velikim problemom u pristupu analitikama velikih podataka. Ovaj problem pokreću tri faktora: Prvo, zbog rasta, akvizicije i tehnoloških inovacija koje dodaju nove sustave u okoliš, poduzeća su zaključana u visoko heterogenom okruženju, a ta se heterogenost s vremenom samo povećava. Poduzeća trebaju pratiti mnoštvo tipova sustava i upravljati desecima tisuća vrsta podataka, kao i iste podatke koji su predstavljeni pomoću različitih nomenklatura i formata.


Drugo, ti sustavi i vrste podataka u mnogim slučajevima navode i relevantne podatke i informacije koje se mogu bez problema filtrirati kao nevažne za problem koji se rješava. Potrebno je pouzdano identificirati utjecajne informacije.

Treća dimenzija izazovu sorte je stalna varijabilnost ili promjena okoliša. Sustavi se nadograđuju, uvode novi sustavi, dodaju se novi tipovi podataka i uvodi nova nomenklatura. To dodatno opterećuje našu sposobnost da ukrotimo izazov za raznolikost podataka. To dodaje dodatni sloj izazovu sorte. (Za više uvida, provjerite krupne podatke: kako su ih uhvatili, drobili i koristili za donošenje poslovnih odluka.)

Rješavanje problema raznolikosti podataka

Da bi riješili problem s raznolikošću podataka, poduzeća moraju započeti s IT domenom, jer ona često predstavlja i najgore prekršitelje i najgore žrtve problema s raznolikošću. Prvi je korak započeti s sveobuhvatnom definicijom ili taksonomijom svih IT elemenata ili imovine. To pruža polaznu osnovu ili osnovu za upućivanje na bilo što u ili o IT-u i omogućava tvrtkama da upravljaju sve većom heterogenošću naspram poznate taksonomije ili terminologije.

Bez grešaka, bez stresa - Vaš korak po korak vodič za stvaranje softvera koji mijenja život bez uništavanja života

Ne možete poboljšati svoje programiranje kad nikoga nije briga za kvalitetu softvera.

Sljedeći korak je prepoznavanje brojnih načina na kojima je isti objekt predstavljen u različitim sustavima zapisa. To omogućava IT stručnjacima da pregledaju svoje heterogeno okruženje i visoko filtriraju i komprimiraju podatke u relevantne i upravljive komade.

Konačno, informatički menadžeri moraju usvojiti postupak stalnog ispitivanja okoliša radi promjena poput uvođenja novih vrsta elemenata ili nove nomenklature koje se odnose na isti element.

Pomoću ovih koraka IT organizacije mogu riješiti problem raznolikosti i izvući duboke uvide koji su povijesno izbjegli IT timove. Nadalje, upravljanje problemom sorte uvelike poboljšava njihov povrat ulaganja u alate i tehnike koji se bave tradicionalnim velikim problemima podataka s volumenom i brzinom.