In deze sessie wordt u meegenomen in de meest gebruikte modellen. De toepassing ervan in context en de noodzaak om een model te kiezen bij het ritme en doelstelling van de data. Er is veel discussie over welk datamodel het best is. Goeroes vallen over elkaar heen. Afhankelijk van de achtergrond van de IT-er zijn ze meer of minder bekend met de keur aan beschikbare modellen. Door de focus op data science worden de onderliggende modellen vaak niet geadresseerd. Welk model u kiest heeft implicaties voor de mogelijkheden in de toekomst. Kies het datamodel dat past bij de doelstelling die u heeft met data, voor de gehele levenscyclus van de gegevens.
Waarom is dat nu relevant? De GDPR, de aankomende Data Act en AI Act vragen van bedrijven en instellingen om te weten welke data ze hebben, met welk doel, vanaf wanneer en tot wanneer. Dit zijn minimale eisen. In veel branches is de data ook als asset op de balans te vinden. Daarom is data in veel organisaties van een bij- naar een hoofdrol aan het gaan.
Een datamodel legt vast hoe de gegevenselementen zich tot elkaar verhouden. Of gegevens kunnen worden gecombineerd, hoe ze kunnen worden opgevraagd. Wat vaak over het hoofd wordt gezien, is dat je data niet alleen bewaart om te registeren, maar ook om te analyseren. Met de opkomst van Data Science, Articial Intelligence en Machine learning is de kwaliteit van de gegevens geen bijzaak meer. Er is geen mens meer om de vastgelegde gegevens eerst te interpreteren. Data wordt op grote schaal door de (wiskundige) modellen geïnterpreteerd door de computer, de computers worden ingezet in waar ze het best in zijn: rekenen. Als data op een verkeerde manier wordt bewaard, dan geven de modellen verkeerde uitkomsten met vaak desastreuze gevolgen.
De hoofdtypen modellen, relationeel, dimensioneel, ensemble en graven worden toegelicht.
Het belangrijkste gegeven bij het kiezen van een model is: welk belang in het kader van de doelen van de organisatie moet worden gediend? Is het belangrijk om zo secuur mogelijk te registreren wat er is gebeurd in interacties met een klant? Is het nodig om terug te kijken naar de gang van zaken, om te verbeteren? Of moet er vooruit gekeken worden naar de toekomst, gebaseerd op historische gegevens?
Vanuit de doelstellingen behandelen we de voor- en nadelen van elk model. Er is geen ‘one size fits all’ in datamodelleren. Keuzes gemaakt bij de ontwikkeling hebben langdurige gevolgen voor de toepassingen die met de data mogelijk zijn. Daaruit volgen implicaties voor de gehele data architectuur, in deze sessie focussen we op de datamodellen.
- Waarom data en datamodellen van een bijrol naar een hoofdrol gaan
- Datamodel typen, relationeel, dimensioneel, ensemble en graven
- Relatie tussen datamodel en doelstelling organisatie
- Ritme en doelstelling van de data gevat in een model
- Historie vatten in een model.