EU AI Act y Data Governance: Lo Que Necesitas Saber
Guía práctica sobre el EU AI Act: qué exige el Artículo 10 sobre calidad de datos, sistemas de alto riesgo, y cómo prepararte para 2026.
EU AI Act y Data Governance: Lo Que Necesitas Saber
Introducción
El EU AI Act es la primera regulación comprehensiva de inteligencia artificial en el mundo. Entró en vigor el 1 de agosto de 2024, con diferentes requisitos aplicándose progresivamente hasta 2027.
Para equipos de datos, el AI Act introduce nuevos requisitos de governance específicos para los datos que alimentan sistemas de IA. Este artículo explica qué exige la regulación y cómo prepararse.
¿Qué es el EU AI Act?
El AI Act es un reglamento de la Unión Europea que establece reglas para el desarrollo, comercialización y uso de sistemas de inteligencia artificial. Su objetivo es garantizar que la IA en Europa sea segura y respete los derechos fundamentales.
Enfoque Basado en Riesgo
El AI Act clasifica los sistemas de IA en cuatro categorías:
| Categoría | Ejemplos | Regulación |
|---|---|---|
| Riesgo Inaceptable | Social scoring, manipulación subliminal | Prohibidos |
| Alto Riesgo | Crédito, contratación, diagnóstico médico | Requisitos estrictos |
| Riesgo Limitado | Chatbots, deepfakes | Obligaciones de transparencia |
| Riesgo Mínimo | Filtros de spam, videojuegos | Sin regulación específica |
Por Qué Importa a Equipos de Datos
El AI Act no solo regula los modelos, regula los datos que los alimentan.
El Artículo 10 establece requisitos específicos de governance para los datos de entrenamiento, validación y testing de sistemas de alto riesgo.
Timeline de Implementación
| Fecha | Qué Entra en Vigor |
|---|---|
| 1 Agosto 2024 | Reglamento publicado y en vigor |
| 2 Febrero 2025 | Prohibiciones de IA inaceptable |
| 2 Agosto 2025 | Requisitos para modelos de propósito general (GPAI) |
| 2 Agosto 2026 | Requisitos para sistemas de alto riesgo |
| 2 Agosto 2027 | Requisitos para IA embebida en productos |
Para equipos de datos: Los requisitos del Artículo 10 aplican desde agosto de 2026 para sistemas de alto riesgo.
Artículo 10: Requisitos de Datos para IA de Alto Riesgo
El Artículo 10 es el corazón del AI Act para equipos de datos. Establece que los sistemas de IA de alto riesgo deben entrenarse con datos que cumplan criterios específicos.
10.1 Governance de Datos
Debes implementar prácticas de governance que incluyan:
- Decisiones de diseño relevantes para la recolección de datos
- Procesos de preparación (anotación, etiquetado, limpieza)
- Formulación de supuestos sobre qué miden los datos
- Evaluación de disponibilidad y cantidad de datos
- Análisis de posibles sesgos
- Identificación de gaps en los datos
10.2 Calidad de Datasets
Los datasets de entrenamiento, validación y testing deben:
| Requisito | Qué Significa |
|---|---|
| Relevancia | Apropiados para el propósito del sistema |
| Representatividad | Reflejar a las personas afectadas |
| Sin errores | Libres de errores y completos (en la medida posible) |
| Propiedades estadísticas | Apropiadas para el contexto de uso |
10.3 Características del Contexto
Los datasets deben considerar:
- Ubicación geográfica de uso
- Características de las personas afectadas
- Contexto específico de aplicación
10.4 Detección y Corrección de Sesgos
Debes implementar medidas apropiadas para detectar, prevenir y mitigar posibles sesgos en los datasets.
10.5 Uso de Categorías Especiales de Datos
Puedes procesar datos sensibles (salud, raza, orientación sexual) solo si es estrictamente necesario para detectar y corregir sesgos.
Sistemas de Alto Riesgo: ¿Cuáles Son?
El Anexo III del AI Act lista los sistemas de IA de alto riesgo. Si tu empresa desarrolla o usa alguno de estos, el Artículo 10 aplica:
Por Sector
| Sector | Ejemplos de Sistemas de Alto Riesgo |
|---|---|
| RRHH/Empleo | Screening de CVs, evaluación de candidatos, asignación de tareas |
| Educación | Evaluación de estudiantes, admisiones, detección de plagio |
| Servicios financieros | Credit scoring, evaluación de riesgo, pricing de seguros |
| Servicios esenciales | Elegibilidad para beneficios públicos, priorización de emergencias |
| Justicia | Evaluación de riesgo criminal, análisis de evidencia |
| Migración | Verificación de documentos, evaluación de solicitudes |
Checklist: ¿Tu Sistema es de Alto Riesgo?
- ¿Toma o influye decisiones sobre personas?
- ¿Afecta acceso a empleo, crédito, educación o servicios esenciales?
- ¿Está listado en el Anexo III del AI Act?
- ¿Es un componente de seguridad de un producto regulado?
Si respondiste sí a alguna, probablemente es alto riesgo.
Documentación Requerida
Documentación Técnica (Anexo IV)
Para sistemas de alto riesgo, debes documentar:
| Elemento | Qué Incluir |
|---|---|
| Descripción del sistema | Propósito, capacidades, limitaciones |
| Metodología de desarrollo | Arquitectura, algoritmos, decisiones de diseño |
| Datos de entrenamiento | Fuentes, características, procesos de preparación |
| Métricas de evaluación | Cómo se mide el rendimiento |
| Análisis de sesgos | Qué sesgos se identificaron y cómo se mitigan |
| Gestión de riesgos | Riesgos identificados y medidas de mitigación |
Registro de Datasets
Para cada dataset usado:
- Origen: De dónde vienen los datos
- Propósito: Para qué se usan
- Características: Tamaño, distribución, features
- Preprocesamiento: Qué transformaciones se aplicaron
- Limitaciones conocidas: Gaps, sesgos identificados
- Decisiones de diseño: Por qué se eligió este dataset
Implicaciones Prácticas para Equipos de Datos
1. Documentar el Lineage de Datos de ML
Necesitas poder responder:
- ¿De dónde vienen los datos de entrenamiento?
- ¿Qué transformaciones se aplicaron?
- ¿Qué versión del dataset usó este modelo?
2. Implementar Análisis de Sesgos
- Analizar distribuciones por grupos demográficos
- Detectar disparidades en el rendimiento del modelo
- Documentar qué sesgos se encontraron y cómo se abordaron
3. Gestionar Versiones de Datasets
- Cada versión del dataset debe estar versionada
- Mantener historial de cambios
- Poder reproducir entrenamientos anteriores
4. Establecer Procesos de Calidad
- Validar completitud de los datos
- Detectar errores y outliers
- Documentar criterios de calidad
5. Clasificar Datos Sensibles
- Identificar si el dataset contiene categorías especiales
- Documentar la justificación para usarlos (si aplica)
- Implementar controles adicionales
Cómo Prepararse: Checklist
Inventario de Sistemas de IA
- Listar todos los sistemas de IA en tu organización
- Clasificar cada uno según nivel de riesgo
- Identificar cuáles están en scope del AI Act
Governance de Datos de ML
- Documentar fuentes de datos para cada modelo
- Implementar versionado de datasets
- Crear procesos de validación de calidad
- Establecer ownership de datasets de ML
Análisis de Sesgos
- Definir métricas de fairness relevantes
- Implementar análisis de distribución por grupos
- Documentar hallazgos y mitigaciones
- Establecer monitoreo continuo
Documentación
- Crear plantillas de documentación técnica
- Documentar procesos de preparación de datos
- Mantener registro de decisiones de diseño
- Preparar evidencia para auditorías
Sanciones por Incumplimiento
| Tipo de Violación | Multa Máxima |
|---|---|
| Violación de prácticas prohibidas | €35M o 7% del revenue global |
| Incumplimiento de requisitos de alto riesgo | €15M o 3% del revenue global |
| Información incorrecta a autoridades | €7.5M o 1.5% del revenue global |
Para PyMEs, las multas se calculan proporcionalmente al tamaño.
Recursos Oficiales
- Texto completo del AI Act (EUR-Lex)
- AI Act Explorer (Navegador interactivo)
- Guías del AI Office (Comisión Europea)
Conclusión
El EU AI Act introduce nuevos requisitos de governance específicos para datos de IA. Para equipos de datos, esto significa:
- Documentar el origen, características y transformaciones de datasets
- Analizar sesgos de forma sistemática y documentada
- Versionar datasets y mantener trazabilidad
- Validar calidad con criterios específicos
Las organizaciones que ya tienen buenas prácticas de data governance tendrán ventaja. Las que no, necesitan empezar a prepararse ahora para cumplir en agosto de 2026.
Última actualización: Enero 2026