Corso di formazione su Machine Learning e Big Data

Il corso è suddiviso in due parti: la prima su Machine Learning e la seconda su un workshop sui Big Data.

Il corso è suddiviso in due parti: la prima su Machine Learning e la seconda su un workshop sui Big Data.

Il corso introdurrà il tema dell’Intelligenza Artificiale mediante l’utilizzo di Machine Learning e Deep Learning. Verranno illustrati i casi d’uso più comuni, le tecniche e gli strumenti che è possibile utilizzare per introdurre questa tecnologia nei vari ambiti industriali. Un modulo didattico introdurrà il tema dei Big Data e l’applicazione delle tecniche di cui sopra in contesto Big Data su infrastrutture on-premise o cloud.

Autorevoli analisti hanno stimato la quantità di dati presente in quello che viene definito “Universo Digitale” in diverse decine di Zettabyte (1 miliardo di Petabyte). Tali dati sono generati principalmente dal web, alle app, dai dispositivi wearable e da quelli IoT e destinati a crescere (esponenzialmente) anno dopo anno. La parte sui Big Data, infatti, introdurrà i concetti di base e le tecnologie necessarie per poter trarre profitto da questo enorme quantitativo di dati attraverso l’utilizzo di tecniche analitiche avanzate.

OBIETTIVI
Il corso fornirà ai partecipanti le principali nozioni teoriche di base riguardanti il Machine Learning compresa l’introduzione alle tecniche basate sull’utilizzo delle reti neurali artificiali (Deep Learning). Verranno altresì illustrate le tecniche e gli strumenti adatti ad applicare gli algoritmi illustrati in ambito industriale. La parte pratica sarà basata sull’utilizzo del linguaggio Python e delle librerie opensource per la data science maggiormente utilizzate sul mercato.
Il workshop introdurrà il concetto di Big Data illustrando le limitazioni delle tecnologie tradizionali in contesti nei quali il volume, il throughput o la tipologia (es: dati scarsamente strutturati o non strutturati) rendono difficoltosa o addirittura impossibile la gestione dei dati. Alla fine del workshop i partecipanti conosceranno le architetture, le tecniche e gli strumenti maggiormente utilizzati sul mercato per la gestione di elevate quantità di dati.

DESTINATARI
Sviluppatori e analisti di dati con conoscenza di base pregressa di almeno un linguaggio di programmazione ad alto livello. Per trarre il massimo profitto dal corso è altresì auspicabile un background di studi universitari di tipo scientifico (es: Matematica, Fisica, Statistica, Informatica o Ingegneria).
Tech leaders, architetti, sviluppatori e analisti di dati con conoscenze di base riguardanti i database ed i sistemi distribuiti.

PREREQUISITI: conoscenza (almeno di base) di Python

PROGRAMMA DEL CORSO
Giorno 1
– Introduction to Artificial Intelligence
– AI, Machine learning and Deep Learning
– Examples of common use cases
– CRISP-DM methodology (Business understanding, Data understanding, Data preparation, Modeling, Evaluation, Deployment)
– Methodologies for managing the entire model lifecycle: ASUM-DM
– Preliminary exploratory data analisys techniques
– Most commonly used platform, framework and tools landscape
– Using Jypter notebooks
– Supervised learning algorithms (Linear and logistics regression, Decision trees, Scikit-learn library usage examples)
Giorno 2
– Ensable models: random forests
– K-nearest neighbors
– Suport vector machines
– Naives Bayes
– Using scikit-learn pipelines
– Unsupervised algorithms (K-means clustering, Density-based spatial clustering of applications with noise (DBSCAN)
– Model evalutaion (Regression metrics: MAE, MSE and R2 score, Metrics for classification: confusion matrix and ROC curve, Clustering evaluation strategies)
– Train/test split and k-fold cross validation
– Understanding overfitting and underfitting
– Dimensional reduction: PCS and LDA
– Hyperparameter optimization
– Tracking experiments: introducing MLFlow
Giorno 3
– Introduction to Artificial Neural Networks (Model of biological neuron, Activation function, SGD, Learning rate and momentum, Backpropagation)
– Most commonly used architectures and their uses (DFF, RNN, AE, MC, HN, DCN, GAN)
– Examples using Keras library
– Time series analysis (Terminology, Autocovariance and autocorrelations, Stationarity, ARIMA models)
– Neural networks for time serires analysis (Gated functions)
– Serving models (PMML and ONNX interchange formats)
Giorno 4
– Introduction to Big Data
– Understanding the 3Vs
– Horizontal vs. vertical scaling
– ACID, BASE, SEC and CAP theorem
– RDBMS vs. NoSQL vs. Big Data
– The Hadoop ecosystem
– From Data Warehouse to Data Lake
– Introducing Apache Spark
– Big Data in the Cloud era
– The market and the state-of-the-art technologies

Machine Learning e Big Data
Senior Consultant

Il corso ha una durata di 4 giorni (3 giorni per la parte di Machine Learning + 1 giorno per la parte sui Big Data).

 

Costo per l’edizione interaziendale€ 2.000,00/partecipante.
Viene erogato anchein modalità dedicata: per questa tipologia, la quotazione è a giornata (su richiesta) e gli argomenti possono essere personalizzati in base alle proprie necessità formative.

AGENDA
    • Introduction to Artificial Intelligence
    • AI, Machine learning and Deep Learning
    • CRISP-DM methodology
    • Naives Bayes
    • Dimensional reduction: PCS and LDA
    • Introduction to Artificial Neural Networks
    • Introduction to Big Data
    • Understanding the 3Vs
    • Horizontal vs. vertical scaling