Integratie van big data technologie binnen de datawarehouse-omgeving

Uit de wereld van big data is de laatste jaren een enorme hoeveelheid technologieën voortgekomen. Van simpele filesystemen via high-end in-memory analytical engines tot streaming database servers. Niet al deze oplossingen kunnen nuttig gebruikt worden binnen datawarehouse en business intelligence systemen, maar vele wel. Maar welke en waar? Waar kunnen bijvoorbeeld oplossingen zoals Kafka en streaming databases goed ingezet worden en wanneer is Spark nuttig? En hoe voorkomen we dat al deze nieuwe technologieën geïsoleerde oplossingen worden die weinig tot niet geïntegreerd zijn met het huidige BI-systeem? In deze sessie bespreken we hoe en waar deze technologieën effectief en efficiënt toegepast kunnen worden binnen bestaande BI-systemen.

  • Het labyrint van bigdata-opslag technologieën, inclusief Hadoop, Kudu, NoSQL, multi-model databases
  • Een overzicht van streaming database servers, zoals Apache Apex, Samza SQL, SQLStream en Tibco StreamBase
  • Kunnen SQL-on-Hadoop engines, zoals Impala, Presto en Spark SQL, dienst doen als vervanging voor klassieke SQL databaseservers?
  • Welke rol kunnen NoSQL-producten spelen binnen een BI-systeem?
  • Met welke technologieën gaan we dark data en fast data te lijf?