Als een van de krachtigste open-sourceprogrammakaders, is Hadoop een belangrijk hulpmiddel voor iedereen die een big data-taak wil vinden. Als je je Hadoop-vaardigheden wilt opfrissen of wilt leren beheersen, kun je het beste een online cursus volgen. Als dat niet voor u beschikbaar is, bekijk dan gratis online tutorials en gebruik referentiemateriaal om specifieke problemen op te lossen. Zodra je de basis hebt, oefen je op kleine sets met echte gegevens om je vaardigheden te verbeteren.
Methode één van de twee:
Cursussen volgen en zelfstudies gebruiken
-
1 Meld je aan voor Cloudera voor een cursus met 6 delen en interactieve tutorials. Cloudera geeft je voorbeelden uit de praktijk om te oefenen in een alleen-lezen omgeving, zodat je je geen zorgen hoeft te maken over het maken van grote fouten. Ze bieden ook analytische hulpmiddelen om u te helpen bij het uitproberen van querygegevens, evenals een gratis live demo genaamd Cloudera Live om u te helpen de Hadoop-omgeving te leren kennen.[1]
- Hoewel de volledige, diepgaande cursus met certificering je $ 295 kost, is het zeker de moeite waard als je deze vaardigheden voor je werk gebruikt. Als u de Cloudera-cursus gebruikt, kunt u fouten maken en tijd besparen, waardoor het zichzelf snel terugverdient![2]
-
2 Probeer gratis online cursussen via Cloudera als je de basiskennis al kent. Als u ervaring hebt met Hadoop en alleen een opfriscursus wilt, hoeft u het geld voor de 6-delige cursus mogelijk niet te betalen. Raadpleeg in plaats hiervan de gratis online cursussen op de website van de Cloudera University.[3]
- Er zijn bronnen voor beheerders, ontwikkelaars en gegevensanalisten, dus wat je rol ook is, je moet een geschikte cursus kunnen vinden.
-
3 Volg een cursus op universitair niveau over Coursera als je meer theorie wilt. Coursera is een bekende, gerespecteerde bron van programmeercursussen. Hoewel de instructies over het algemeen meer theoretisch zijn en niet zoveel voorbeelden bevatten, kunt u naast de zelfstudie oefenen en de cursusprojecten gebruiken om praktische ervaring op te doen.[4]
- Je kunt deze cursus online vinden op https://www.coursera.org/specializations/big-data.
- De kosten variëren tussen cursussen, maar Coursera biedt ook een financiële hulpoptie voor degenen die in aanmerking komen.
-
4 Volg een gratis cursus over Big Data University voor een kostenvriendelijke optie. Als u niet wilt betalen voor een online cursus, is Big Data University een geweldige optie. Ze hebben een tweedelige cursus, die zich eerst richt op Hadoop-basics, vervolgens op programmeren met Hadoop, en het online format maakt het gemakkelijk om in je eigen tempo te gaan.[5]
- Je vindt deze cursussen op https://cognitiveclass.ai.
- Ze bieden veel tutorials in het Engels, maar ook Japans, Spaans, Portugees en Russisch.
-
5 Zoek naar walkthroughs op YouTube als je gratis, specifieke training nodig hebt. Er zijn duizenden video's gemaakt om Hadoop uit te leggen en hoe je het kunt gebruiken. Het brede scala aan video's biedt u flexibiliteit, en het is gratis. Als je een specifiek probleem tegenkomt, zoek dan op YouTube naar een video die je door het proces leidt.[6]
- Hadoop-zelfstudies moeten ook vrij gemakkelijk te vinden zijn, aangezien "hadoop" een unieke zoekterm is.[7]
-
6 Gebruik de gratis tutorials van Yahoo als je wilt oefenen met een virtueel voorbeeld. Deze tutorials zijn onderverdeeld in 7 modules en ze geven instructies over het installeren en gebruiken van Hadoop vanaf het allereerste begin. Dit is een prima optie om specifieke vaardigheden aan te pakken als ze een beetje roestig zijn.[8]
- Je vindt deze tutorials gratis beschikbaar op https://developer.yahoo.com/hadoop/tutorial/.
-
7 Raadpleeg het IBM Open Source-document voor gratis, gedetailleerde instructies. Dit is een ongelooflijk grondig, open-source PDF-document gemaakt door een IBM-trainingsinitiatief. Het loopt je stap voor stap zorgvuldig door Hadoop en geeft duidelijke schriftelijke instructies.
- U kunt deze PDF vinden op https://www.ibm.com/developerworks/data/library/techarticle/dm-1209hadoopbigdata/.
- Deze instructies werken ook goed wanneer ze worden gecombineerd met een live demo zoals Cloudera.[9]
Methode twee van twee:
Overgang naar toepassing in de echte wereld
-
1 Vraag of je Hadoop op het werk kunt implementeren om met echte gegevens te oefenen. Dien een verzoek in bij je baas of supervisor of praat één voor één met hen over het brengen van deze nieuwe vaardigheden op de werkplek. Dit is vooral belangrijk als uw bedrijf heeft betaald voor een training of online cursussen.[10]
- Hoe sneller je begint met het implementeren van de vaardigheden die je hebt geleerd, hoe eerder je ze zult beheersen!
-
2 Zoek naar eenvoudige projecten om je vaardigheden te oefenen. Kies projecten die relatief eenvoudig en met een laag risico zijn, zoals het tellen en rangschikken van het aantal interacties per klantagent, zoals e-mails en chatsessies.[11]
- Enkele andere echte datatoepassingen zijn het scannen van weblogs op fouten of het controleren van socialemediakanalen op merksentiment.
- U kunt ook oefenen met voorbeeldgegevens van sites zoals https://www.kaggle.com/datasets of https://aws.amazon.com/datasets/.
-
3 Controleer regelmatig uw code met kleine subsets om eventuele fouten op te lossen. Voordat u de volledige set gegevens uitvoert, neemt u een kleinere testgegevensset op uw lokale computer en voert deze door verschillende modi. U kunt het bijvoorbeeld iteratief uitvoeren via de lokale Jobrunner-modus, vervolgens over de modus Pseudo-gedistribueerd en vervolgens over de volledig gedistribueerde modus.[12]
- Hiermee kunt u eventuele fouten of bugs herkennen voordat ze in de volledige dataset worden versterkt.
- Met de lokale Jobrunner-modus kun je lokaal je Map- en Verkleincode testen en debuggen, pseudo-gedistribueerde modus bootst de productieomgeving na en kijkt de Volledig Gedistribueerde modus naar je echte productiecluster.
-
4 Gebruik een gratis proefperiode van 1 jaar om te oefenen op een virtuele machine-omgeving. Bedrijven zoals Amazon en Microsoft bieden betaalde abonnementen voor hun Hadoop-oefendiensten.Amazon's virtuele machine heet Amazon Web Service (AWS) en de Microsoft-service heet Microsoft Azure. Voor beide services is uw eerste jaar gratis wanneer u uw creditcardgegevens opgeeft.[13]
- Vergeet niet om het abonnement na 1 jaar te annuleren om te voorkomen dat het in rekening wordt gebracht.
Facebook
Twitter
Google+