The many layers of Data Lineage

Written by Ronald Baan

Ronald is een data-enthousiasteling die zijn tijd besteedt aan het delen van zijn passie voor data met anderen.

4 september 2022

Mooi artikel in Medium over #datalineage door Borja Vázquez Barreiros.
Data lineage is een lastige, hoewel zo belangrijk als je meer wilt doen met data. Naast het bepalen wat voor soort lineage je nodig hebt, het verzamelen van de data die nodig is voor de data lineage is er dan ook nog: hoe maak je deze lineage bruikbaar!

Dit artikel breekt een lans voor een Google Maps benadering met verschillende lagen voor de verschillende toepassingen van data lineage. Interessante gedachte, zeker omdat het niet uitgaat van 1 oplossing voor iedereen.

In het artikel is de context vooral het data warehouse. In een modern datalandschap met cloud en data lake is data lineage mogelijk nog belangrijker, omdat de gebruikers nu nog diverser zijn en waarschijnlijk ook elders in de organisatie. Dus, ja, prioriteit!

En dit: “If we want to remove all barriers, we need to think first and foremost about data modelling”. YES!

You may also like…

Layers of Knowledge (Graph)

Layers of Knowledge (Graph)

Je kunt de werkelijkheid ingewikkeld modelleren, je kunt het ook slim doen en dan zorgen dat systemen er ook makkelijk mee overweg kunnen.

Mooi artikel van Katariina Kari over de aanpak bij IKEA.

Data Lake House

Data Lake House

Voor het geval je aardig content bent met je data lake (of juist helemaal niet), het is tijd om de implementatie rond...