Linedat
Iniciar Sesión

EU AI Act y Data Governance: Lo Que Necesitas Saber

Guía práctica sobre el EU AI Act: qué exige el Artículo 10 sobre calidad de datos, sistemas de alto riesgo, y cómo prepararte para 2026.

Guía Educativa7 de enero de 202614 min de lecturaPor Linedat
AI Actregulación IAcompliancecalidad de datosEuropa

EU AI Act y Data Governance: Lo Que Necesitas Saber


Introducción

El EU AI Act es la primera regulación comprehensiva de inteligencia artificial en el mundo. Entró en vigor el 1 de agosto de 2024, con diferentes requisitos aplicándose progresivamente hasta 2027.

Para equipos de datos, el AI Act introduce nuevos requisitos de governance específicos para los datos que alimentan sistemas de IA. Este artículo explica qué exige la regulación y cómo prepararse.


¿Qué es el EU AI Act?

El AI Act es un reglamento de la Unión Europea que establece reglas para el desarrollo, comercialización y uso de sistemas de inteligencia artificial. Su objetivo es garantizar que la IA en Europa sea segura y respete los derechos fundamentales.

Enfoque Basado en Riesgo

El AI Act clasifica los sistemas de IA en cuatro categorías:

Categoría Ejemplos Regulación
Riesgo Inaceptable Social scoring, manipulación subliminal Prohibidos
Alto Riesgo Crédito, contratación, diagnóstico médico Requisitos estrictos
Riesgo Limitado Chatbots, deepfakes Obligaciones de transparencia
Riesgo Mínimo Filtros de spam, videojuegos Sin regulación específica

Por Qué Importa a Equipos de Datos

El AI Act no solo regula los modelos, regula los datos que los alimentan.

El Artículo 10 establece requisitos específicos de governance para los datos de entrenamiento, validación y testing de sistemas de alto riesgo.


Timeline de Implementación

Fecha Qué Entra en Vigor
1 Agosto 2024 Reglamento publicado y en vigor
2 Febrero 2025 Prohibiciones de IA inaceptable
2 Agosto 2025 Requisitos para modelos de propósito general (GPAI)
2 Agosto 2026 Requisitos para sistemas de alto riesgo
2 Agosto 2027 Requisitos para IA embebida en productos

Para equipos de datos: Los requisitos del Artículo 10 aplican desde agosto de 2026 para sistemas de alto riesgo.


Artículo 10: Requisitos de Datos para IA de Alto Riesgo

El Artículo 10 es el corazón del AI Act para equipos de datos. Establece que los sistemas de IA de alto riesgo deben entrenarse con datos que cumplan criterios específicos.

10.1 Governance de Datos

Debes implementar prácticas de governance que incluyan:

  • Decisiones de diseño relevantes para la recolección de datos
  • Procesos de preparación (anotación, etiquetado, limpieza)
  • Formulación de supuestos sobre qué miden los datos
  • Evaluación de disponibilidad y cantidad de datos
  • Análisis de posibles sesgos
  • Identificación de gaps en los datos

10.2 Calidad de Datasets

Los datasets de entrenamiento, validación y testing deben:

Requisito Qué Significa
Relevancia Apropiados para el propósito del sistema
Representatividad Reflejar a las personas afectadas
Sin errores Libres de errores y completos (en la medida posible)
Propiedades estadísticas Apropiadas para el contexto de uso

10.3 Características del Contexto

Los datasets deben considerar:

  • Ubicación geográfica de uso
  • Características de las personas afectadas
  • Contexto específico de aplicación

10.4 Detección y Corrección de Sesgos

Debes implementar medidas apropiadas para detectar, prevenir y mitigar posibles sesgos en los datasets.

10.5 Uso de Categorías Especiales de Datos

Puedes procesar datos sensibles (salud, raza, orientación sexual) solo si es estrictamente necesario para detectar y corregir sesgos.


Sistemas de Alto Riesgo: ¿Cuáles Son?

El Anexo III del AI Act lista los sistemas de IA de alto riesgo. Si tu empresa desarrolla o usa alguno de estos, el Artículo 10 aplica:

Por Sector

Sector Ejemplos de Sistemas de Alto Riesgo
RRHH/Empleo Screening de CVs, evaluación de candidatos, asignación de tareas
Educación Evaluación de estudiantes, admisiones, detección de plagio
Servicios financieros Credit scoring, evaluación de riesgo, pricing de seguros
Servicios esenciales Elegibilidad para beneficios públicos, priorización de emergencias
Justicia Evaluación de riesgo criminal, análisis de evidencia
Migración Verificación de documentos, evaluación de solicitudes

Checklist: ¿Tu Sistema es de Alto Riesgo?

  • ¿Toma o influye decisiones sobre personas?
  • ¿Afecta acceso a empleo, crédito, educación o servicios esenciales?
  • ¿Está listado en el Anexo III del AI Act?
  • ¿Es un componente de seguridad de un producto regulado?

Si respondiste sí a alguna, probablemente es alto riesgo.


Documentación Requerida

Documentación Técnica (Anexo IV)

Para sistemas de alto riesgo, debes documentar:

Elemento Qué Incluir
Descripción del sistema Propósito, capacidades, limitaciones
Metodología de desarrollo Arquitectura, algoritmos, decisiones de diseño
Datos de entrenamiento Fuentes, características, procesos de preparación
Métricas de evaluación Cómo se mide el rendimiento
Análisis de sesgos Qué sesgos se identificaron y cómo se mitigan
Gestión de riesgos Riesgos identificados y medidas de mitigación

Registro de Datasets

Para cada dataset usado:

  • Origen: De dónde vienen los datos
  • Propósito: Para qué se usan
  • Características: Tamaño, distribución, features
  • Preprocesamiento: Qué transformaciones se aplicaron
  • Limitaciones conocidas: Gaps, sesgos identificados
  • Decisiones de diseño: Por qué se eligió este dataset

Implicaciones Prácticas para Equipos de Datos

1. Documentar el Lineage de Datos de ML

Necesitas poder responder:

  • ¿De dónde vienen los datos de entrenamiento?
  • ¿Qué transformaciones se aplicaron?
  • ¿Qué versión del dataset usó este modelo?

2. Implementar Análisis de Sesgos

  • Analizar distribuciones por grupos demográficos
  • Detectar disparidades en el rendimiento del modelo
  • Documentar qué sesgos se encontraron y cómo se abordaron

3. Gestionar Versiones de Datasets

  • Cada versión del dataset debe estar versionada
  • Mantener historial de cambios
  • Poder reproducir entrenamientos anteriores

4. Establecer Procesos de Calidad

  • Validar completitud de los datos
  • Detectar errores y outliers
  • Documentar criterios de calidad

5. Clasificar Datos Sensibles

  • Identificar si el dataset contiene categorías especiales
  • Documentar la justificación para usarlos (si aplica)
  • Implementar controles adicionales

Cómo Prepararse: Checklist

Inventario de Sistemas de IA

  • Listar todos los sistemas de IA en tu organización
  • Clasificar cada uno según nivel de riesgo
  • Identificar cuáles están en scope del AI Act

Governance de Datos de ML

  • Documentar fuentes de datos para cada modelo
  • Implementar versionado de datasets
  • Crear procesos de validación de calidad
  • Establecer ownership de datasets de ML

Análisis de Sesgos

  • Definir métricas de fairness relevantes
  • Implementar análisis de distribución por grupos
  • Documentar hallazgos y mitigaciones
  • Establecer monitoreo continuo

Documentación

  • Crear plantillas de documentación técnica
  • Documentar procesos de preparación de datos
  • Mantener registro de decisiones de diseño
  • Preparar evidencia para auditorías

Sanciones por Incumplimiento

Tipo de Violación Multa Máxima
Violación de prácticas prohibidas €35M o 7% del revenue global
Incumplimiento de requisitos de alto riesgo €15M o 3% del revenue global
Información incorrecta a autoridades €7.5M o 1.5% del revenue global

Para PyMEs, las multas se calculan proporcionalmente al tamaño.


Recursos Oficiales


Conclusión

El EU AI Act introduce nuevos requisitos de governance específicos para datos de IA. Para equipos de datos, esto significa:

  1. Documentar el origen, características y transformaciones de datasets
  2. Analizar sesgos de forma sistemática y documentada
  3. Versionar datasets y mantener trazabilidad
  4. Validar calidad con criterios específicos

Las organizaciones que ya tienen buenas prácticas de data governance tendrán ventaja. Las que no, necesitan empezar a prepararse ahora para cumplir en agosto de 2026.


Última actualización: Enero 2026