Programma di Sistemi E Architetture Per Big Data:

  • Introduzione ai Big Data: motivazioni, problemi e sfide.
  • Storage di Big Data: file system distribuiti, database NoSQL e database NewSQL; casi di studio: HDFS, Dynamo, Bigtable, HBase, Cassandra, e Neo4j. Laboratorio: HDFS, Redis, MongoDB, HBase, Neo4j. 
  • Sistemi per l’acquisizione ed il caricamento di Big data; sistemi pub/sub, code di messaggi, sistemi di raccolta; casi di studio: Kafka, Flume, Nifi e Sqoop. Laboratorio: Kafka.
  • Sistemi per il processamento batch. Casi di studio: Hadoop, Pig, Hive, Spark. Laboratorio: Hadoop, Spark, Spark SQL. 
  • Sistemi per il processamento di stream di dati. Casi di studio: Spark Streaming, Storm, Flink, Heron, Samza. Architetture avanzate per il processamento congiunto. Laboratorio: Storm, Spark Streaming, Kafka Streaming.
  • Servizi Cloud per Big data (piattaforme AWS e GCP).
  • Framework per la gestione delle risorse di un cluster per Big Data; casi di studio: Mesos e YARN.
  • Architetture di edge/fog computing per Big Data.