EU AI Act y Data Governance: Lo Que Necesitas Saber

Introducción

El EU AI Act es la primera regulación comprehensiva de inteligencia artificial en el mundo. Entró en vigor el 1 de agosto de 2024, con diferentes requisitos aplicándose progresivamente hasta 2027.

Para equipos de datos, el AI Act introduce nuevos requisitos de governance específicos para los datos que alimentan sistemas de IA. Este artículo explica qué exige la regulación y cómo prepararse.

¿Qué es el EU AI Act?

El AI Act es un reglamento de la Unión Europea que establece reglas para el desarrollo, comercialización y uso de sistemas de inteligencia artificial. Su objetivo es garantizar que la IA en Europa sea segura y respete los derechos fundamentales.

Enfoque Basado en Riesgo

El AI Act clasifica los sistemas de IA en cuatro categorías:

Categoría	Ejemplos	Regulación
Riesgo Inaceptable	Social scoring, manipulación subliminal	Prohibidos
Alto Riesgo	Crédito, contratación, diagnóstico médico	Requisitos estrictos
Riesgo Limitado	Chatbots, deepfakes	Obligaciones de transparencia
Riesgo Mínimo	Filtros de spam, videojuegos	Sin regulación específica

Por Qué Importa a Equipos de Datos

El AI Act no solo regula los modelos, regula los datos que los alimentan.

El Artículo 10 establece requisitos específicos de governance para los datos de entrenamiento, validación y testing de sistemas de alto riesgo.

Timeline de Implementación

Fecha	Qué Entra en Vigor
1 Agosto 2024	Reglamento publicado y en vigor
2 Febrero 2025	Prohibiciones de IA inaceptable
2 Agosto 2025	Requisitos para modelos de propósito general (GPAI)
2 Agosto 2026	Requisitos para sistemas de alto riesgo
2 Agosto 2027	Requisitos para IA embebida en productos

Para equipos de datos: Los requisitos del Artículo 10 aplican desde agosto de 2026 para sistemas de alto riesgo.

Artículo 10: Requisitos de Datos para IA de Alto Riesgo

El Artículo 10 es el corazón del AI Act para equipos de datos. Establece que los sistemas de IA de alto riesgo deben entrenarse con datos que cumplan criterios específicos.

10.1 Governance de Datos

Debes implementar prácticas de governance que incluyan:

Decisiones de diseño relevantes para la recolección de datos
Procesos de preparación (anotación, etiquetado, limpieza)
Formulación de supuestos sobre qué miden los datos
Evaluación de disponibilidad y cantidad de datos
Análisis de posibles sesgos
Identificación de gaps en los datos

10.2 Calidad de Datasets

Los datasets de entrenamiento, validación y testing deben:

Requisito	Qué Significa
Relevancia	Apropiados para el propósito del sistema
Representatividad	Reflejar a las personas afectadas
Sin errores	Libres de errores y completos (en la medida posible)
Propiedades estadísticas	Apropiadas para el contexto de uso

10.3 Características del Contexto

Los datasets deben considerar:

Ubicación geográfica de uso
Características de las personas afectadas
Contexto específico de aplicación

10.4 Detección y Corrección de Sesgos

Debes implementar medidas apropiadas para detectar, prevenir y mitigar posibles sesgos en los datasets.

10.5 Uso de Categorías Especiales de Datos

Puedes procesar datos sensibles (salud, raza, orientación sexual) solo si es estrictamente necesario para detectar y corregir sesgos.

Sistemas de Alto Riesgo: ¿Cuáles Son?

El Anexo III del AI Act lista los sistemas de IA de alto riesgo. Si tu empresa desarrolla o usa alguno de estos, el Artículo 10 aplica:

Por Sector

Sector	Ejemplos de Sistemas de Alto Riesgo
RRHH/Empleo	Screening de CVs, evaluación de candidatos, asignación de tareas
Educación	Evaluación de estudiantes, admisiones, detección de plagio
Servicios financieros	Credit scoring, evaluación de riesgo, pricing de seguros
Servicios esenciales	Elegibilidad para beneficios públicos, priorización de emergencias
Justicia	Evaluación de riesgo criminal, análisis de evidencia
Migración	Verificación de documentos, evaluación de solicitudes

Checklist: ¿Tu Sistema es de Alto Riesgo?

¿Toma o influye decisiones sobre personas?
¿Afecta acceso a empleo, crédito, educación o servicios esenciales?
¿Está listado en el Anexo III del AI Act?
¿Es un componente de seguridad de un producto regulado?

Si respondiste sí a alguna, probablemente es alto riesgo.

Documentación Requerida

Documentación Técnica (Anexo IV)

Para sistemas de alto riesgo, debes documentar:

Elemento	Qué Incluir
Descripción del sistema	Propósito, capacidades, limitaciones
Metodología de desarrollo	Arquitectura, algoritmos, decisiones de diseño
Datos de entrenamiento	Fuentes, características, procesos de preparación
Métricas de evaluación	Cómo se mide el rendimiento
Análisis de sesgos	Qué sesgos se identificaron y cómo se mitigan
Gestión de riesgos	Riesgos identificados y medidas de mitigación

Registro de Datasets

Para cada dataset usado:

Origen: De dónde vienen los datos
Propósito: Para qué se usan
Características: Tamaño, distribución, features
Preprocesamiento: Qué transformaciones se aplicaron
Limitaciones conocidas: Gaps, sesgos identificados
Decisiones de diseño: Por qué se eligió este dataset

Implicaciones Prácticas para Equipos de Datos

1. Documentar el Lineage de Datos de ML

Necesitas poder responder:

¿De dónde vienen los datos de entrenamiento?
¿Qué transformaciones se aplicaron?
¿Qué versión del dataset usó este modelo?

2. Implementar Análisis de Sesgos

Analizar distribuciones por grupos demográficos
Detectar disparidades en el rendimiento del modelo
Documentar qué sesgos se encontraron y cómo se abordaron

3. Gestionar Versiones de Datasets

Cada versión del dataset debe estar versionada
Mantener historial de cambios
Poder reproducir entrenamientos anteriores

4. Establecer Procesos de Calidad

Validar completitud de los datos
Detectar errores y outliers
Documentar criterios de calidad

5. Clasificar Datos Sensibles

Identificar si el dataset contiene categorías especiales
Documentar la justificación para usarlos (si aplica)
Implementar controles adicionales

Cómo Prepararse: Checklist

Inventario de Sistemas de IA

Listar todos los sistemas de IA en tu organización
Clasificar cada uno según nivel de riesgo
Identificar cuáles están en scope del AI Act

Governance de Datos de ML

Documentar fuentes de datos para cada modelo
Implementar versionado de datasets
Crear procesos de validación de calidad
Establecer ownership de datasets de ML

Análisis de Sesgos

Definir métricas de fairness relevantes
Implementar análisis de distribución por grupos
Documentar hallazgos y mitigaciones
Establecer monitoreo continuo

Documentación

Crear plantillas de documentación técnica
Documentar procesos de preparación de datos
Mantener registro de decisiones de diseño
Preparar evidencia para auditorías

Sanciones por Incumplimiento

Tipo de Violación	Multa Máxima
Violación de prácticas prohibidas	€35M o 7% del revenue global
Incumplimiento de requisitos de alto riesgo	€15M o 3% del revenue global
Información incorrecta a autoridades	€7.5M o 1.5% del revenue global

Para PyMEs, las multas se calculan proporcionalmente al tamaño.

Recursos Oficiales

Texto completo del AI Act (EUR-Lex)
AI Act Explorer (Navegador interactivo)
Guías del AI Office (Comisión Europea)

Conclusión

El EU AI Act introduce nuevos requisitos de governance específicos para datos de IA. Para equipos de datos, esto significa:

Documentar el origen, características y transformaciones de datasets
Analizar sesgos de forma sistemática y documentada
Versionar datasets y mantener trazabilidad
Validar calidad con criterios específicos

Las organizaciones que ya tienen buenas prácticas de data governance tendrán ventaja. Las que no, necesitan empezar a prepararse ahora para cumplir en agosto de 2026.

Última actualización: Enero 2026