In de complexe wereld van halfgeleider productie worden dagelijks enorme hoeveelheden zeer gevarieerde data gegenereerd. ASML, wereldleider op het gebied van machines voor de productie van halfgeleiders, implementeert een central data lake waarin data verzameld wordt in een centrale omgeving en die vanuit daar beschikbaar gesteld wordt voor rapportage en analyse. Dit central data lake bevat ook een zogenaamd analytics lab voor gedetailleerde exploratie van data en het faciliteren van data science toepassingen. Het beheersen van deze snel veranderende data is een enorme uitdaging. In deze sessie bespreken we aan de hand van een aantal voorbeelden ASML’s aanpak voor de volgende uitdagingen:
- Hoe kunnen gebruikers, analisten en data scientists informatie in het central data lake ontdekken en vinden zonder te verdrinken in de hoeveelheid en complexiteit van gegevens?
- Hoe borgen we dat gebruikers van het central data lake de data begrijpen en weten waar de data vandaan komt (data lineage)?
- Hoe zorgen we er voor dat de data in het central data lake vertrouwd kan worden (data kwaliteit)?
- Hoe kunnen we als ASML borgen dat toegang tot data in lijn is met eisen van klanten en andere belanghebbenden?
- Welke toegevoegde waarde kan het analytics lab (nog meer) brengen?