Come praticare Hadoop online: 11 passaggi (con immagini)

Sommario:

Come praticare Hadoop online: 11 passaggi (con immagini)
Come praticare Hadoop online: 11 passaggi (con immagini)

Video: Come praticare Hadoop online: 11 passaggi (con immagini)

Video: Come praticare Hadoop online: 11 passaggi (con immagini)
Video: How to create a CALCULATOR in notepad [Coding Trick] 2024, Aprile
Anonim

Essendo uno dei più potenti framework di programmazione open source, Hadoop è uno strumento importante per chiunque speri di trovare un lavoro con i big data. Se vuoi rispolverare le tue abilità di Hadoop o imparare a padroneggiarlo, la tua migliore opzione è seguire un corso online. Se questo non è disponibile, guarda i tutorial online gratuiti e usa i materiali di riferimento per risolvere problemi specifici. Una volta apprese le basi, esercitati su piccoli set di dati del mondo reale per migliorare le tue abilità.

Passi

Metodo 1 di 2: seguire corsi e utilizzare tutorial

Pratica Hadoop Online Passaggio 1
Pratica Hadoop Online Passaggio 1

Passaggio 1. Iscriviti a Cloudera per un corso in 6 parti e tutorial interattivi

Cloudera ti offre esempi reali su cui esercitarti in un ambiente di sola lettura, così non devi preoccuparti di commettere errori enormi. Offrono anche strumenti analitici per aiutarti a sperimentare l'interrogazione dei dati, oltre a una demo live gratuita chiamata Cloudera Live per aiutarti a conoscere l'ambiente Hadoop.

Anche se il corso completo e approfondito con certificazione ti costerà $ 295, ne varrà sicuramente la pena se utilizzi queste abilità per il tuo lavoro. L'utilizzo del corso Cloudera ti aiuterà a cogliere gli errori e a risparmiare tempo, il che lo farà ripagare rapidamente

Pratica Hadoop Online Passaggio 2
Pratica Hadoop Online Passaggio 2

Passaggio 2. Prova i corsi online gratuiti tramite Cloudera se conosci già le basi

Se hai esperienza con Hadoop e desideri solo un aggiornamento, potresti non dover sborsare i soldi per il corso in 6 parti. Invece, dai un'occhiata ai corsi online gratuiti sul sito Web di Cloudera University.

Ci sono risorse per amministratori, sviluppatori e analisti di dati, quindi non importa quale sia il tuo ruolo, dovresti essere in grado di trovare un corso appropriato

Pratica Hadoop Online Passaggio 3
Pratica Hadoop Online Passaggio 3

Passaggio 3. Se vuoi più teoria, segui un corso di livello universitario su Coursera

Coursera è una fonte nota e rispettata di corsi di programmazione. Sebbene le istruzioni siano generalmente più teoriche e non includano tanti esempi in esecuzione, puoi esercitarti insieme al tutorial e utilizzare i progetti del corso per acquisire esperienza pratica.

  • Puoi trovare questo corso online su
  • Il costo varia tra i corsi, ma Coursera offre anche un'opzione di aiuto finanziario a coloro che si qualificano.
Pratica Hadoop Online Passaggio 4
Pratica Hadoop Online Passaggio 4

Passaggio 4. Segui un corso gratuito su Big Data University per un'opzione conveniente

Se non vuoi pagare per un corso online, Big Data University è un'ottima opzione. Hanno un corso in 2 parti, che si concentra prima sulle basi di Hadoop, poi sulla programmazione con Hadoop, e il formato online lo rende facile da seguire al proprio ritmo.

  • Puoi trovare questi corsi su
  • Offrono molti tutorial in inglese, oltre che in giapponese, spagnolo, portoghese e russo.
Pratica Hadoop Online Passaggio 5
Pratica Hadoop Online Passaggio 5

Passaggio 5. Cerca le procedure dettagliate su YouTube se hai bisogno di una formazione specifica gratuita

Ci sono migliaia di video realizzati per spiegare Hadoop e come utilizzarlo. L'ampia gamma di video ti offre flessibilità ed è gratuita. Se riscontri un problema specifico, cerca su YouTube un video che ti guidi attraverso il processo.

Anche i tutorial di Hadoop dovrebbero essere abbastanza facili da trovare, poiché "hadoop" è un termine di ricerca univoco

Pratica Hadoop Online Passaggio 6
Pratica Hadoop Online Passaggio 6

Passaggio 6. Usa i tutorial gratuiti di Yahoo se vuoi esercitarti con un esempio virtuale

Questi tutorial sono suddivisi in 7 moduli e ti insegnano a installare e utilizzare Hadoop fin dall'inizio. Questa è un'ottima opzione per rispolverare abilità specifiche se sono un po' arrugginite.

Pratica Hadoop Online Passaggio 7
Pratica Hadoop Online Passaggio 7

Passaggio 7. Fare riferimento al documento IBM Open Source per istruzioni approfondite e gratuite

Questo è un documento PDF incredibilmente completo e open source creato da un'iniziativa di formazione IBM. Ti guida attraverso Hadoop con attenzione, passo dopo passo, e fornisce chiare istruzioni scritte.

Queste istruzioni funzionano bene anche se abbinate a una demo live come Cloudera

Metodo 2 di 2: Transizione all'applicazione del mondo reale

Pratica Hadoop Online Passaggio 8
Pratica Hadoop Online Passaggio 8

Passaggio 1. Chiedi se puoi implementare Hadoop al lavoro per fare pratica con dati reali

Fai una richiesta con il tuo capo o supervisore o parla con loro uno a uno per portare queste nuove competenze sul posto di lavoro. Ciò è particolarmente importante se la tua azienda ha pagato per qualsiasi formazione o corsi online.

Prima inizi a implementare le abilità che hai imparato, prima sarai in grado di padroneggiarle

Pratica Hadoop Online Passaggio 9
Pratica Hadoop Online Passaggio 9

Passaggio 2. Cerca progetti semplici su cui esercitare le tue abilità

Scegli progetti relativamente semplici e a basso rischio, come il conteggio e la classificazione del numero di interazioni per agente cliente, come e-mail e sessioni di chat.

  • Alcune altre applicazioni di dati reali includono la scansione attraverso i blog per errori o il monitoraggio dei canali dei social media per il sentimento del marchio.
  • Puoi anche esercitarti con dati di esempio da siti come https://www.kaggle.com/datasets o
Pratica Hadoop Online Passaggio 10
Pratica Hadoop Online Passaggio 10

Passaggio 3. Controlla regolarmente il tuo codice con piccoli sottoinsiemi per risolvere eventuali bug

Prima di eseguire l'intero set di dati, prendi un set di dati di test più piccolo sul tuo computer locale ed eseguilo attraverso diverse modalità. Ad esempio, è possibile eseguirlo in modo iterativo tramite la modalità Jobrunner locale, quindi la modalità pseudo-distribuita e quindi la modalità completamente distribuita.

  • Ciò ti consentirà di riconoscere eventuali difetti o bug prima che vengano amplificati nell'intero set di dati.
  • La modalità Jobrunner locale ti consente di testare ed eseguire il debug locale del tuo codice Map and Reduce, la modalità pseudo-distribuita imita l'ambiente di produzione e la modalità completamente distribuita guarda al tuo vero cluster di produzione.
Pratica Hadoop Online Passaggio 11
Pratica Hadoop Online Passaggio 11

Passaggio 4. Utilizzare una prova gratuita di 1 anno per esercitarsi su un ambiente di macchina virtuale

Aziende come Amazon e Microsoft offrono abbonamenti a pagamento per i loro servizi di pratica Hadoop. La macchina virtuale di Amazon si chiama Amazon Web Service (AWS) e il servizio di Microsoft si chiama Microsoft Azure. Per entrambi i servizi, il primo anno è gratuito inserendo i dati della carta di credito.

Non dimenticare di annullare l'abbonamento dopo 1 anno per evitare l'addebito

Suggerimenti

  • Tieni presente che Hadoop è un linguaggio di programmazione più specializzato e di uso limitato. Ti darà sicuramente un vantaggio nel mondo dei big data, ma non è sempre necessario diventare un programmatore.
  • Puoi anche leggere libri e articoli su Hadoop, come Hadoop: The Definitive Guide, 3rd Edition di Tom White.

Consigliato: