Apache Hadoop

Sagteware kiekie:
Apache Hadoop
Sagteware besonderhede:
Weergawe: 1.0
Upload datum: 2 Apr 18
Lisensie: Gratis
Populariteit: 1
Grootte: 17862 Kb

Rating: nan/5 (Total Votes: 0)

Groot data is 'n bemarkingstermyn wat die hele idee van data ontgin van bronne soos soekenjins, kruidenierswinkel-kooppatrone wat deur puntekaartjies opgespoor word, ens. In die moderne wêreld het die internet soveel bronne van data, wat meer dikwels as nie die skaal maak dit onbruikbaar sonder verwerking en verwerking sal ongelooflike hoeveelhede tyd deur enige een bediener neem. Tik Apache Hadoop

Minder tyd vir dataverwerking

Deur die gebruik van Hadoop-argitektuur om verwerkingstake oor verskeie masjiene op 'n netwerk te versprei , word verwerkingstye astronomies verminder en antwoorde kan binne redelike hoeveelhede bepaal word. Apache Hadoop is verdeel in twee verskillende komponente: 'n bergingskomponent en 'n verwerkingskomponent. In die eenvoudigste terme maak Hapood een virtuele bediener uit verskeie fisiese masjiene . In werklikheid bestuur Hadoop die kommunikasie tussen verskeie masjiene, sodat hulle nou genoeg saamwerk sodat dit lyk asof daar net een masjien op die berekeninge werk. Die data word oor verskeie masjiene versprei om gestoor te word en verwerkingstake word toegeken en gekoördineer deur die Hadoop-argitektuur

. Hierdie tipe stelsel is 'n vereiste vir die omskakeling van rou data in nuttige inligting op die skaal van Big Data insette. Oorweeg die hoeveelheid data wat Google elke sekonde ontvang van gebruikers wat navrae aanvra. As 'n totale klomp data, sal jy nie weet waar om te begin nie, maar Hadoop sal outomaties die datastel verminder in kleiner, georganiseerde subsette data en toeken hierdie bestuurbare subset aan spesifieke bronne. Alle resultate word dan aangemeld en saamgestel in bruikbare inligting .

'n bediener maklik om te installeer

Alhoewel die stelsel kompleks is, word die meeste bewegende dele verduister agter die abstraksie. Die Hadoop-bediener is redelik eenvoudig. Installeer die bedienerkomponente op apparatuur wat aan die stelselvereistes voldoen. Die moeiliker gedeelte beplan die netwerk van rekenaars dat die Hadoop-bediener sal gebruik om die stoor- en verwerkingsrolle te versprei. Dit kan behels die opstel van 'n plaaslike area netwerk of die koppeling van verskeie netwerke saam oor die internet . U kan ook bestaande wolkdienste gebruik en betaal vir 'n Hadoop-groep op gewilde wolkplatforms soos Microsoft Azure en Amazon EC2. Dit is selfs makliker om te konfigureer, aangesien jy hulle ad hoc kan draai en dan die klusters ontmantel wanneer jy hulle nie meer nodig het nie. Hierdie tipe klusters is ideaal vir toetse aangesien u slegs betaal vir die tyd waarop die Hadoop-groep aktief is.

Verwerk jou data om die inligting wat jy benodig, te kry.

Groot data is 'n uiters kragtige bron, maar data is nutteloos, tensy dit behoorlik gekategoriseer en in inligting verander kan word. Op die huidige tyd het Hadoop clusters 'n uiters koste-effektiewe metode vir die verwerking van hierdie versamelings data in inligting.

Ondersteun bedryf stelsels

Ander sagteware ontwikkelaar The Apache Software Foundation

Apache Tika
Apache Tika

20 Feb 15

Apache Hive
Apache Hive

19 Feb 15

Apache ManifoldCF
Apache ManifoldCF

20 Feb 15

Kommentaar te Apache Hadoop

Kommentaar nie gevind
Kommentaar te lewer
Draai op die foto!