Argo3000.it

Corsi

Hadoop Apache Spark


Descrizione del corso

Hadoop è la piattaforma ideale per la gestione dei Big Data aziendali grazie alle alte prestazione ed un costo contenuto.
Obiettivo del corso Hadoop Apache Spark è quello di acquisire competenze riguardo i concetti teorici, strumenti e tecniche per la progettazione e l’implementazione di procedure per l’analisi avanzata dei Big Data.

Il programma del corso comprende:

  • Illustrare Hadoop, HDFS, YARN, e l’ecosistema HDP
  • Illustrare alcuni Spark use cases
  • Analizzare e manipolare dati utilizzando Zeppelin
  • Analizzare e manipolare dati utilizzando Spark REPL
  • Illustrare lo scopo e la funzione di RDDs
  • Utilizzare le pratiche di programmazione funzionale
  • Eseguire le trasformazioni ed azioni con Spark
  • Lavorare con Pair RDDs
  • Eseguire Spark queries utilizzando Spark SQL e DataFrames
  • Utilizzare Spark Streaming stateless e window transformation
  • Visualizzare dati, generare reports e collaborare utilizzando Zeppelin
  • Monitorare applicazioni Spark utilizzando Spark History Server
  • Apprendere le linee guida generali per l’ottimizzazione delle applicazioni
  • Utilizzare il data caching per migliorare le performance delle applicazioni
  • Effettuare build e package di applicazioni Spark
  • Effettuare il deploy delle applicazioni nel cluster utilizzando YARN
  • Comprendere gli scopi di Spark MLib

 

Data: 21,22,23 e 24 Maggio

Destinatari: I partecipanti dovranno avere competenze riguardo i principi della programmazione ed esperienza nello sviluppo software con l’utilizzo di Python oppure Scala. Consigliata la conoscenza di SQL e Data Streaming.

Sedi: Via Vittorio Amedeo II, 24 – 10121 Torino – Viale Stelvio, 70 – 20159 Milano


Durata

32 ore


Compila il modulo di pre iscrizione


Autorizzo il trattamento dei miei dati personali ai sensi del D.Lgs. 101/2018. Informativa sulla privacy