Mooi artikel in Medium over #datalineage door Borja Vázquez Barreiros.
Data lineage is een lastige, hoewel zo belangrijk als je meer wilt doen met data. Naast het bepalen wat voor soort lineage je nodig hebt, het verzamelen van de data die nodig is voor de data lineage is er dan ook nog: hoe maak je deze lineage bruikbaar!
Dit artikel breekt een lans voor een Google Maps benadering met verschillende lagen voor de verschillende toepassingen van data lineage. Interessante gedachte, zeker omdat het niet uitgaat van 1 oplossing voor iedereen.
In het artikel is de context vooral het data warehouse. In een modern datalandschap met cloud en data lake is data lineage mogelijk nog belangrijker, omdat de gebruikers nu nog diverser zijn en waarschijnlijk ook elders in de organisatie. Dus, ja, prioriteit!
En dit: “If we want to remove all barriers, we need to think first and foremost about data modelling”. YES!