Rekommenderad, 2024

Redaktörens val

6 "Data" buzzwords du behöver förstå

Digital Transformation in the Beverage Manufacturing Production Process

Digital Transformation in the Beverage Manufacturing Production Process
Anonim

Ta en stor trend som spänner över affärs- och teknikvärlden, lägg till otaliga leverantörer och konsulter som hoppas kunna tjäna pengar och vad får du? En hel del buzzwords med oklara definitioner.

I världen av stora data har den omgivande hype skapat en helt ny lingo. Behöver du lite klarhet? Läs vidare för en ordlista av sorter som markerar några av de viktigaste datatyperna du borde förstå.

1. Snabb data

[Vidare läsning: De bästa hushållsläckningsdetektorerna]

Den lysande stjärnan i denna konstellation av termer är "snabb data", som dyker upp med ökande frekvens. Det hänvisar till "data vars verktyg kommer att minska över tiden", säger Tony Baer, ​​en huvudanalytiker på Ovum som säger att han myntade termen tillbaka 2012.

Det är saker som Twitter-flöden och strömmande data som måste fångas och analyseras i realtid, vilket möjliggör omedelbara beslut och svar. Ett företag med kapitalmarknadshandel kan förlita sig på det för att bedriva algoritmiska eller högfrekventa affärer.

"Snabba data kan referera till några saker: snabbinspelning, snabb strömming, snabb förberedelse, snabb analys, snabb användarrespons", sa Nik Rouda, en senior analytiker med Enterprise Strategy Group. Det är "mestadels marknadsföringshype", men det "visar behovet av prestanda på olika sätt."

Ökad bandbredd, råvaror, minskade minnespriser och realtidsanalyser har alla bidragit till ökningen av snabba data, Baer sa.

2. Långsam data

I motsatta änden av spektret är "långsam data" eller data som kan trickle in i en relativt avslappnad takt, vilket motiverar mindre frekvent analys. Baer pekar på en enhet som övervakar ocean tidvatten som ett exempel - i de flesta fall behöver uppdateringar i realtid inte behövas.

Generellt är denna typ av data bättre lämpad för infångning i en datasjö och efterföljande sats bearbetning.

3. Små data

"Små data" är "allt som passar på en bärbar dator", säger Gregory Piatetsky-Shapiro, VD för analytikerkonsult KDnuggets.

I huvudsak erkänner termen att "mycket analys fortfarande är klar på en eller några datakällor, på en bärbar dator, med hjälp av lättviktiga appar - ibland till och med bara Excel, säger Rouda.

4. Medium data

När det gäller "medium data", ja, det är däremellan.

När du pratar om många dataöverföringar är det stora data, och du brukar använda teknologier som Hadoop och MapReduce för att analysera det sa Baer. Men "mest analytiska problem involverar inte petabytes", tillade han. När analyser involverar data på en mer mellanliggande skala är det medellång data, och du brukar använda Apache Spark.

5. Mörka data

"Mörka data" är vanligtvis data som förbises och underanvänds.

"Människor vet inte att det finns där, vet inte hur man får åtkomst till det, får inte åtkomst eller systemets tillflyktsort" t har blivit upprättad för att hävda det ännu, "förklarade Rouda. Det växer upp "alltför ofta" i databaser, datalagrar och datasjöar, sa han.

Sådana begränsade eller dåligt dokumenterade datapooler kallas ofta "den mörka webben". Att låta dem lysa är i allmänhet domänen för datafondstjänster, ofta med hjälp av maskinlärningsalgoritmer, sa Baer.

6. Smutsiga data

Sist men inte minst är "smutsiga data" ingenstans så roligt som det låter. Snarare är det helt enkelt en dataset innan den rengörs.

"En fråga om naturen är att sakerna är smutsiga tills du rengör dem", sa Baer. "Om du inte har utfört någon operation på det, kommer data inte att vara rena."

Dessa operationer kan innefatta förberedelse, berikning och transformation, noterade Rouda. "Annars är många felaktiga svar möjliga."

En sak till och med …

Användning av data för att växa ditt företag är mycket mer än bara att förstå lingo.

"Det finns ett mellanrum mellan all data som har bli tillgänglig och vår förmåga att använda den för insikt, säger Brian Hopkins, vice vd med Forrester.

Att överbrygga det gapet skulle kunna vara en fråga om att använda Hadoop, eller det kan uppnås genom enkla självbetjäningsverktyg, säger Hopkins. Hur som helst är det länken som måste göras för att meningsfulla åtgärder ska kunna resultera.

"Leverantörer och analytiker är bra på att skapa nya buzzwords", sa han. I stället för att bli försvagad i termer, "mitt råd för CIOs är att vara laserfokuserad på resultat som kommer att omvandla din verksamhet."

Top