Mi is pontosan 'nagy adat'?

És miért ez nagy ügy?

A "nagy adatok" az új tudomány a megértés és az emberi viselkedés előrejelzése nagy mennyiségű strukturálatlan adat tanulmányozásával. A nagy adatok "prediktív analitika" néven is ismertek.

A Twitter üzenetek, Facebook hírcsatornák, eBay keresések, GPS-követők és ATM gépek elemzése néhány nagy adat példája. A biztonsági videók, a forgalmi adatok, az időjárási minták, a repülőjáratok érkezése, a mobiltelefon-torony naplók és a pulzusszámlálók vizsgálata más formák. A nagy adatok egy rendetlen, új tudomány, amely hetente változik, és csak néhány szakértő mindent megért.

Milyen példák a nagy adatokra a rendszeres életben?

screenshot http://project.wnyc.org/transit-time

Míg a legtöbb nagy adatprojekt nagyon homályos, az egyének, a vállalatok és a kormányok mindennapi életét érintő nagy adatok sikeres példái vannak:

A vírus kitöréseinek előrejelzése: a társadalompolitikai adatok, az időjárás és az éghajlati adatok, valamint a kórházi / klinikai adatok tanulmányozása révén a tudósok 4 héttel előre értesítik a dengue-láz kitörését.

Homicide Watch: ez a nagy adatprofil profilt gyilkol meg áldozatok, gyanúsítottak és bűnözők Washingtonban. Mindkettő, mint az elhunyt tiszteletének és az emberek tudatosság-erőforrásának módja, ez a nagy adatprojekt lenyűgöző.

Transit Travel Planning, NYC: A WNYC rádiós programozó, Steve Melendez az online metró menetrendjét összekapcsolta az útiterv-szoftverrel. Az alkotása lehetővé teszi, hogy a New York-iak kattintsanak helyükre a térképen, és megjelenik a vonatok és a metró utazási idejének előrejelzése.

A Xerox csökkentette munkaerő-veszteségét: a call center munkája érzelmileg kimerítő. A Xerox professzionális elemzők segítségével tanulmányozta az adatok átvitelét, és most már megjósolni, hogy melyik call center-bérlő valószínűleg a leghosszabb ideig marad a cégnél.

A terrorizmus elleni küzdelem támogatása: a társadalmi média, a pénzügyi nyilvántartások, a repülőjegyek fenntartása és a biztonsági adatok tanulmányozása révén a bűnüldözés megjósolni és elhelyezni a terrorista gyanúsítókat, mielőtt gonosz tetteket hajthatnak végre.

A márkamenedzsment módosítása a közösségi médián alapul : az emberek kíméletlenül és gyorsan megosztják online gondolataikat egy pubban, étterembe vagy fitness klubba. Meg lehet tanulni ezeket a több millió közösségi média álláshelyet, és visszajelzést adhat a vállalatnak, hogy mit gondolnak az emberek a szolgáltatásaikról.

Ki használ nagy adatokat? Mit csinálnak vele?

Sok monolitikus vállalat nagy mennyiségű adatot használ fel az ajánlatok és az árak módosítására, hogy maximalizálja az ügyfelek elégedettségét.

Miért Big Data ilyen nagy ügy?

4 dolog nagy jelentőséget tulajdonít az adatoknak:

1. Az adatok hatalmasak. Nem fog egy merevlemezre illeszteni, sokkal kevésbé egy USB-t . Az adatok mennyisége messze meghaladja azt, amit az emberi tudat észlel (milliárd milliárd megabájtra gondol, aztán több milliárddal többszöröse meg).

2. Az adatok rendetlenek és nem strukturáltak. A nagy adatfeldolgozás 50-80% -a átalakítja és tisztítja az információkat, így kereshető és sorba állítható. A bolygónkon csak néhány ezer szakértő tudja, hogyan kell ezt az adatot tisztítani. Ezeknek a szakértőknek is nagyon speciális eszközökre van szükségük, mint például a HPE és a Hadoop, hogy kézművesük legyen. Talán 10 év alatt a nagy adathasználók egy tucatnyi dollár lettek, de most egy nagyon ritka elemzői faj, és munkájuk még mindig nagyon homályos és unalmas.

3. Az adatok olyan árucikkekké váltak **, amelyek értékesíthetők és megvásárolhatók. Adatpiacok léteznek, ahol a vállalatok és a magánszemélyek vásárolhatnak terabájt a közösségi média és egyéb adatok. A legtöbb adat felhőalapú, mivel túl nagy ahhoz, hogy egyetlen merevlemezre illeszkedjen. Az adatok vásárlása általában egy előfizetési díjat tartalmaz, ahol csatlakozik a felhőalapú kiszolgáló gazdasághoz.

** A nagy adathordozók és ötletek vezetői az Amazon, a Google, a Facebook és a Yahoo. Mivel ezek a vállalatok az online szolgáltatásokkal oly sok millió embert szolgálnak ki, érzés, hogy a gyűjtőhely és a nagyméretű adatelemzők mögött álló látnokok lennének.

4. A nagy adatok lehetőségei végtelenek. Talán az orvosok egy nap előrejelzik a szívrohamokat és a stroke-okat az egyéneknek egy hete hetek előtt. A repülőgép és a gépkocsi összeomlását a mechanikai adatok, a forgalom és az időjárási viszonyok prediktív elemzésével lehet csökkenteni. Az online társkeresés javulhat azzal, hogy nagy adatjelzõkkel rendelkezik, hogy ki kompatibilis személyiségek az Ön számára. A zenészek betekintést nyerhetnek abban, hogy a zeneszerző összetétele a leginkább kedvelik a célközönség változó ízlését. A táplálékkutatók talán képesek megjósolni, hogy az áruházban vásárolt élelmiszerek milyen kombinációja súlyosbíthatja vagy segítheti az egyén orvosi körülményeit. A felületet csak karcolta meg, és a nagy adatokban való felfedezések minden héten megtörténnek.

A nagy adatok messy

Monty Rakusen / Getty

A nagy adatok a prediktív analitika: a masszív, strukturálatlan adatok valamilyen kereshető és sorba rendezhetővé válnak. Ez egy rendetlen és kaotikus tér, amely különleges tudást és türelmet igényel.

Vegyük például a monolitikus UPS szállítási szolgáltatást. Az UPS programozói a járművezetők GPS-jéről és okostelefonjairól adatokat gyűjtenek a forgalmi torlódásokhoz való alkalmazkodás leghatékonyabb módjainak elemzésére. Ez a GPS és az okostelefonok adatai óriásiak, és nem készülnek automatikusan elemzésre. Ez az adat különböző GPS és térkép adatbázisokból származik, különböző okostelefon hardvereszközökön keresztül. A UPS elemzői hónapokat töltöttek, hogy ezeket az adatokat olyan formátumba konvertálják, amely könnyen kereshető és rendezhető. Az erőfeszítés azonban megéri. Ma a UPS több mint 8 millió gallon üzemanyagot mentett meg, mivel elkezdték használni ezeket a nagy adatelemzéseket.

Mivel a nagy adatok rendetlenek és sok erőfeszítést igényelnek a használatra való felkészüléshez és felkészüléshez, az adat tudósok becenevén "adattisztítók" lettek az összes unalmas munkájukért.

A nagy adatok és a prediktív analitika tudománya azonban javul minden héten. Nagy adatok várhatók, hogy 2025-ig mindenki könnyen hozzáférhetővé váljon.

A nagy adatok nem intrusív fenyegetés az adatvédelemre?

Feingersh / Getty

Igen, ha törvényeinket és az egyéni magánélet védelmét nem gondosan kezeljük, akkor a nagy adatok behatolnak a személyes adatok védelmébe. Jelenleg a Google és a YouTube és a Facebook már nyomon követi a napi online szokásait . Az okostelefon és a számítási élet naponta digitális lábnyomokat hagy, és kifinomult cégek tanulmányozzák ezeket a lábnyomokat.

A nagy adatok körüli törvények fejlődnek. Az adatvédelem olyan állapotban van, amelyet most Önnek személyes felelősséget kell vállalnia, mivel már nem számíthat rá alapértelmezettnek.

Mit tehet a magánélet védelme érdekében?

A legnagyobb egyetlen lépést, amit megtehetsz, a VPN-hálózati kapcsolat használatával takaríthatod meg napi szokásaidat . A VPN-szolgáltatás megragadja a jelzést, hogy személyazonosságát és helyét legalább részben lefedje a nyomkövetők. Ez nem fogja 100% -ban névtelenné tenni, de a VPN jelentősen csökkenteni fogja, hogy a világ milyen mértékben tudja betartani online szokásait.

Hol tudok többet tudni a nagy adatokról?

Monty Raskusen / Getty

A nagy adatok lenyűgözőek az analitikus gondolkodású emberek és a tech-szeretet iránt. Ha ez az, akkor biztosan látogasson el az érdekes nagy adatprojektek ezen oldalára.