Essendo uno dei più potenti framework di programmazione open source, Hadoop è uno strumento importante per chiunque speri di trovare un lavoro con i big data. Se vuoi rispolverare le tue abilità di Hadoop o imparare a padroneggiarlo, la tua migliore opzione è seguire un corso online. Se questo non è disponibile, guarda i tutorial online gratuiti e usa i materiali di riferimento per risolvere problemi specifici. Una volta apprese le basi, esercitati su piccoli set di dati del mondo reale per migliorare le tue abilità.
Passi
Metodo 1 di 2: seguire corsi e utilizzare tutorial
Passaggio 1. Iscriviti a Cloudera per un corso in 6 parti e tutorial interattivi
Cloudera ti offre esempi reali su cui esercitarti in un ambiente di sola lettura, così non devi preoccuparti di commettere errori enormi. Offrono anche strumenti analitici per aiutarti a sperimentare l'interrogazione dei dati, oltre a una demo live gratuita chiamata Cloudera Live per aiutarti a conoscere l'ambiente Hadoop.
Anche se il corso completo e approfondito con certificazione ti costerà $ 295, ne varrà sicuramente la pena se utilizzi queste abilità per il tuo lavoro. L'utilizzo del corso Cloudera ti aiuterà a cogliere gli errori e a risparmiare tempo, il che lo farà ripagare rapidamente
Passaggio 2. Prova i corsi online gratuiti tramite Cloudera se conosci già le basi
Se hai esperienza con Hadoop e desideri solo un aggiornamento, potresti non dover sborsare i soldi per il corso in 6 parti. Invece, dai un'occhiata ai corsi online gratuiti sul sito Web di Cloudera University.
Ci sono risorse per amministratori, sviluppatori e analisti di dati, quindi non importa quale sia il tuo ruolo, dovresti essere in grado di trovare un corso appropriato
Passaggio 3. Se vuoi più teoria, segui un corso di livello universitario su Coursera
Coursera è una fonte nota e rispettata di corsi di programmazione. Sebbene le istruzioni siano generalmente più teoriche e non includano tanti esempi in esecuzione, puoi esercitarti insieme al tutorial e utilizzare i progetti del corso per acquisire esperienza pratica.
- Puoi trovare questo corso online su
- Il costo varia tra i corsi, ma Coursera offre anche un'opzione di aiuto finanziario a coloro che si qualificano.
Passaggio 4. Segui un corso gratuito su Big Data University per un'opzione conveniente
Se non vuoi pagare per un corso online, Big Data University è un'ottima opzione. Hanno un corso in 2 parti, che si concentra prima sulle basi di Hadoop, poi sulla programmazione con Hadoop, e il formato online lo rende facile da seguire al proprio ritmo.
- Puoi trovare questi corsi su
- Offrono molti tutorial in inglese, oltre che in giapponese, spagnolo, portoghese e russo.
Passaggio 5. Cerca le procedure dettagliate su YouTube se hai bisogno di una formazione specifica gratuita
Ci sono migliaia di video realizzati per spiegare Hadoop e come utilizzarlo. L'ampia gamma di video ti offre flessibilità ed è gratuita. Se riscontri un problema specifico, cerca su YouTube un video che ti guidi attraverso il processo.
Anche i tutorial di Hadoop dovrebbero essere abbastanza facili da trovare, poiché "hadoop" è un termine di ricerca univoco
Passaggio 6. Usa i tutorial gratuiti di Yahoo se vuoi esercitarti con un esempio virtuale
Questi tutorial sono suddivisi in 7 moduli e ti insegnano a installare e utilizzare Hadoop fin dall'inizio. Questa è un'ottima opzione per rispolverare abilità specifiche se sono un po' arrugginite.
Passaggio 7. Fare riferimento al documento IBM Open Source per istruzioni approfondite e gratuite
Questo è un documento PDF incredibilmente completo e open source creato da un'iniziativa di formazione IBM. Ti guida attraverso Hadoop con attenzione, passo dopo passo, e fornisce chiare istruzioni scritte.
Queste istruzioni funzionano bene anche se abbinate a una demo live come Cloudera
Metodo 2 di 2: Transizione all'applicazione del mondo reale
Passaggio 1. Chiedi se puoi implementare Hadoop al lavoro per fare pratica con dati reali
Fai una richiesta con il tuo capo o supervisore o parla con loro uno a uno per portare queste nuove competenze sul posto di lavoro. Ciò è particolarmente importante se la tua azienda ha pagato per qualsiasi formazione o corsi online.
Prima inizi a implementare le abilità che hai imparato, prima sarai in grado di padroneggiarle
Passaggio 2. Cerca progetti semplici su cui esercitare le tue abilità
Scegli progetti relativamente semplici e a basso rischio, come il conteggio e la classificazione del numero di interazioni per agente cliente, come e-mail e sessioni di chat.
- Alcune altre applicazioni di dati reali includono la scansione attraverso i blog per errori o il monitoraggio dei canali dei social media per il sentimento del marchio.
- Puoi anche esercitarti con dati di esempio da siti come https://www.kaggle.com/datasets o
Passaggio 3. Controlla regolarmente il tuo codice con piccoli sottoinsiemi per risolvere eventuali bug
Prima di eseguire l'intero set di dati, prendi un set di dati di test più piccolo sul tuo computer locale ed eseguilo attraverso diverse modalità. Ad esempio, è possibile eseguirlo in modo iterativo tramite la modalità Jobrunner locale, quindi la modalità pseudo-distribuita e quindi la modalità completamente distribuita.
- Ciò ti consentirà di riconoscere eventuali difetti o bug prima che vengano amplificati nell'intero set di dati.
- La modalità Jobrunner locale ti consente di testare ed eseguire il debug locale del tuo codice Map and Reduce, la modalità pseudo-distribuita imita l'ambiente di produzione e la modalità completamente distribuita guarda al tuo vero cluster di produzione.
Passaggio 4. Utilizzare una prova gratuita di 1 anno per esercitarsi su un ambiente di macchina virtuale
Aziende come Amazon e Microsoft offrono abbonamenti a pagamento per i loro servizi di pratica Hadoop. La macchina virtuale di Amazon si chiama Amazon Web Service (AWS) e il servizio di Microsoft si chiama Microsoft Azure. Per entrambi i servizi, il primo anno è gratuito inserendo i dati della carta di credito.
Non dimenticare di annullare l'abbonamento dopo 1 anno per evitare l'addebito
Suggerimenti
- Tieni presente che Hadoop è un linguaggio di programmazione più specializzato e di uso limitato. Ti darà sicuramente un vantaggio nel mondo dei big data, ma non è sempre necessario diventare un programmatore.
- Puoi anche leggere libri e articoli su Hadoop, come Hadoop: The Definitive Guide, 3rd Edition di Tom White.