LinedatLinedat
Beta

Glossari

Conceptes clau de Data Governance explicats de forma clara i pràctica

¿Que es Data Lineage?

Data Lineage (Linaje de Datos) es la capacidad de rastrear el recorrido de los datos desde su origen hasta su destino final, documentando todas las transformaciones, movimientos y dependencias que ocurren en el camino. Es como un mapa de carreteras para tus datos: muestra de donde vienen, por donde pasan y adonde llegan.

El lineage opera a diferentes niveles de granularidad. El lineage a nivel de tabla muestra las relaciones entre tablas y datasets completos. El lineage a nivel de columna (column-level lineage) va un paso mas alla, rastreando como cada campo individual se transforma y propaga a traves de pipelines, vistas y dashboards.

En un ecosistema de datos moderno donde los datos fluyen entre decenas de sistemas (CRM, ERP, data warehouse, herramientas de BI), el lineage es esencial para responder preguntas como: "¿de donde vienen los datos de este dashboard?", "¿que se rompe si modifico esta columna?" o "¿por que este KPI muestra un valor diferente al del mes pasado?".

Per què és important?

Segun un estudio de Precisely, el 77% de los lideres de datos consideran la trazabilidad como un requisito critico para la confianza en los datos. Sin lineage, los equipos operan a ciegas: no pueden evaluar el impacto de cambios, no pueden diagnosticar rapidamente la causa raiz de problemas de calidad y no pueden demostrar a reguladores de donde provienen los datos de sus reportes.

El coste de no tener lineage se materializa en incidentes: un campo que cambia de formato en el CRM rompe silenciosamente dashboards downstream. Sin lineage, detectar y reparar estos problemas puede tomar dias o semanas. Con lineage, se resuelven en minutos.

Com funciona a la pràctica?

El lineage se construye de dos formas principales. El lineage automatico analiza las queries SQL, los pipelines de ETL y las definiciones de vistas para extraer las relaciones entre tablas y columnas. El lineage manual permite a los equipos documentar relaciones que no son capturables automaticamente (por ejemplo, datos que se exportan a Excel y se reimportan).

Una vez construido, el lineage se visualiza tipicamente como un grafo dirigido donde los nodos son tablas o columnas y las aristas representan flujos de datos. Los usuarios pueden navegar upstream (hacia el origen) o downstream (hacia el consumo) para entender dependencias y evaluar impactos.

Data Lineage a Linedat

Linedat ofrece lineage visual tanto a nivel de tabla como a nivel de columna, con un grafo interactivo que permite navegar las relaciones entre activos de datos. La funcionalidad de Impact Analysis permite evaluar el efecto de cambios propuestos antes de ejecutarlos, y el lineage temporal registra como las relaciones han evolucionado a lo largo del tiempo.

FAQ

Respuestas sobre implementación y capacidades

El lineage a nivel de tabla muestra las relaciones entre datasets completos (tabla A alimenta a tabla B). El lineage a nivel de columna (column-level lineage) es mas granular: muestra como cada campo individual se transforma y propaga. Por ejemplo, que la columna "revenue" del dashboard proviene de la columna "amount" de la tabla de ventas multiplicada por el "exchange_rate" de la tabla de divisas.

Implementa Data Lineage con Linedat

Connecta les teves bases de dades i en minuts tens catàleg documentat, lineage visual i dades sensibles classificades. Gratuït per començar.