Navigazione di Sezione:
Sistemi E Architetture Per Big Data 2020/2021
- Introduzione ai Big Data: motivazioni, problemi e sfide.
- Storage di Big Data: file system distribuiti, database NoSQL e database NewSQL; casi di studio: HDFS, Dynamo, Bigtable, HBase, Cassandra, and Neo4j. Laboratorio: HDFS, Redis, MongoDB, HBase, Neo4j.
- Sistemi per l’acquisizione ed il caricamento di Big data; sistemi pub/sub, code di messaggi, sistemi di raccolta; casi di studio: Kafka, Flume, Nifi, e Sqoop. Laboratorio: Kafka.
- Sistemi per il processamento batch. Casi di studio: Hadoop, Pig, Hive, Spark. Laboratorio: Hadoop, Spark, Spark SQL.
- Sistemi per il processamento di stream di dati. Casi di studio: Spark Streaming, Storm, Flink, Heron, Samza. Architetture avanzate per il processamento congiunto. Laboratorio: Storm, Spark Streaming, Kafka Streaming.
- Servizi Cloud per Big data (piattaforme AWS e GCP).
- Framework per la gestione delle risorse di un cluster per Big Data; casi di studio: Mesos e YARN.
- Nuove architetture e scenari edge/fog per il processamento ed analisi di Big Data.