[Video intro] We hebben allemaal wel eens studies gezien die aangaven wat een enorme hoeveelheden data er per dag op deze planeet aangemaakt worden. Een groot deel van deze data is echter niet nieuwe maar gekopieerde data. In bestaande data-architecturen, zoals datawarehouses, wordt zeer veel gekopieerd, maar ook moderne architecturen zoals data lake en data hub rusten volledig op het kopiëren van data. Dit ongebreidelde kopiëren moet verminderd worden. We staan er niet altijd meer bij stil maar het kopiëren van data kent vele nadelen, waaronder hogere data-latency, complexe datasynchronisatie, complexere databeveiliging en dataprivacy, hogere ontwikkel en onderhoudskosten en verslechterde datakwaliteit. Het wordt tijd dat bij het opzetten van nieuwe data-architecturen het dataminimalisatieprincipe toegepast wordt. Dit betekent dat er gestreefd wordt naar het minimaliseren van gekopieerde data. Met andere woorden, gebruikers krijgen meer toegang tot originele data en er wordt overgestapt van data-by-delivery naar data-on-demand. Dit laatste komt overeen met wat er in de filmwereld gebeurd is: van video’s ophalen bij een winkel naar video-on-demand. Kortom, dataminimalisatie betekent dat we onze data gaan ‘Netflixen’.
- Het effect van dataminimalisatie op datawarehouses, data lakes en data hubs
- Het netwerk wordt de database
- Gebruik van translytical databases, analytical databases, datavirtualisatie om dataminimalisatie toe te passen
- Focus op business rules en niet op data storage
- Voorbeelden van het toepassen van dataminimalisatie op bestaande data-architecturen.