Columnas

Sin datos no hay inteligencia (artificial): por qué la Ley 21.719 importa más de lo que parece

El debate público sobre la inteligencia artificial suele detenerse en los algoritmos. Pero la pieza decisiva —y la que el derecho chileno ya empieza a regular— es otra: el dato.

Felipe Diez Ringele*

Existe la tentación de imaginar la inteligencia artificial como una inteligencia autónoma, casi mágica, capaz de razonar por sí sola. La realidad técnica es más prosaica y, a la vez, más exigente. La consolidación de la IA como una de las tecnologías más transformadoras del siglo no puede comprenderse al margen del recurso que la hace materialmente posible: los datos (Martín, Sánchez, Lanza y Sotres, 2023, p. 1). Toda arquitectura de IA —cualquiera sea su paradigma de aprendizaje— descansa sobre un presupuesto común: la existencia de un conjunto de datos suficientemente representativo del fenómeno que se pretende modelar. Si los datos son malos, el resultado también lo será.

Felipe Diez Ringele

La metáfora más extendida es la del combustible. Y conviene precisarla, porque el propio dato, aisladamente considerado, carece de valor —como lo tendría el combustible si no existiera el motor de combustión— y solo cobra sentido en la medida en que sustenta procesos inteligentes de toma de decisiones y servicios innovadores (Martín, Sánchez, Lanza y Sotres, 2023, p. 1). La magnitud económica de ese insumo no es menor: la economía europea de datos pasó de 443.000 millones de euros en 2021 a una estimación cercana a los 787.000 millones para 2030 (Ministerio para la Transformación Digital y de la Función Pública). El dato, en suma, no es un recurso auxiliar: es un activo estructural.

La calidad, no la cantidad

Aquí aparece el primer malentendido que el derecho debe tomar en serio. La abundancia de información no implica, por sí sola, mejores sistemas. Los datos son la base de cualquier sistema de toma de decisiones, y esas decisiones no serán precisas si se fundan en datos de baja calidad (Martín, Sánchez, Lanza y Sotres, 2023, p. 1). La calidad del dato es, además, multidimensional: exactitud, completitud, oportunidad temporal, precisión y usabilidad (Martín, Sánchez, Lanza y Sotres, 2023, pp. 4-5). Un dataset inexacto introduce sesgos sistemáticos; uno incompleto distorsiona la inferencia; uno desactualizado obliga al modelo a operar sobre una representación obsoleta de la realidad.

No es una preocupación abstracta. Cuando los datos provienen de fuentes heterogéneas o presentan formatos, estándares y escalas distintos, su calidad se deteriora (Martín, Sánchez, Lanza y Sotres, 2023, p. 1), y los errores que introducen, por ejemplo, los sensores de bajo coste pueden derivar en decisiones incorrectas (Martín, Sánchez, Lanza y Sotres, 2023, p. 2). La cadena causal es directa: dato defectuoso, decisión defectuosa.

Del riesgo técnico al riesgo jurídico

Esta dependencia trae consigo riesgos que el ordenamiento no puede ignorar. La literatura ha documentado que los sistemas de IA pueden generar daños relacionados con sesgo, discriminación y violaciones de la privacidad (Mökander, 2023, p. 9). La falta de representatividad del conjunto de entrenamiento produce predicciones sistemáticamente erróneas para los grupos subrepresentados; se ha demostrado, de hecho, que los grandes modelos de lenguaje pueden producir lenguaje no ético, incluidos comentarios racistas y sexistas (Mökander, 2023, p. 9). A ello se suman los errores factuales —las llamadas “alucinaciones”— y los usos no previstos del modelo, como el recordado caso del juez colombiano que recurrió a ChatGPT (Parikh et al., 2023, citado en Mökander, 2023).

Es exactamente en este punto donde la Ley N° 21.719, que regula la protección y el tratamiento de los datos personales y crea la Agencia de Protección de Datos Personales, se vuelve relevante para cualquier conversación sobre IA. La ley no menciona la palabra “algoritmo” en su título, pero gobierna su insumo. Y lo hace con principios que dialogan, casi punto por punto, con las exigencias técnicas descritas. El principio de calidad ordena que los datos sean exactos, completos, actuales y pertinentes (art. 3, letra d). El principio de proporcionalidad limita el tratamiento a lo estrictamente necesario (art. 3, letra c). El de finalidad impide reutilizar datos para propósitos distintos de los informados (art. 3, letra b). El de seguridad exige resguardarlos contra pérdida, filtración o tratamiento no autorizado (art. 3, letra f).

La ley chilena va incluso más lejos en lo que, hoy, es el corazón del problema algorítmico. Su artículo 8° bis reconoce el derecho del titular a no ser objeto de decisiones basadas únicamente en el tratamiento automatizado de sus datos —incluida la elaboración de perfiles— cuando produzcan efectos jurídicos o lo afecten significativamente, garantizándole el derecho a obtener una explicación, a la intervención humana y a solicitar la revisión de la decisión. Es la respuesta normativa precisa al riesgo de que un modelo entrenado con datos sesgados decida, sin contrapeso, sobre un crédito, un empleo o un beneficio.

Trazabilidad, curación y auditoría: una agenda compartida

La relación entre dato e IA es, además, bidireccional: la propia IA permite hoy mejorar la calidad de los datos mediante procesos de curación —detección de anomalías, imputación de valores faltantes, limpieza e integración— que alcanzan precisiones superiores al 99,8% en la reconstrucción de series con huecos (Martín, Sánchez, Lanza y Sotres, 2023, p. 6). Para que esa mejora sea confiable, se incorpora información sobre la calidad como metadatos, de modo que la calidad del dato se vuelve trazable y verificable, condición indispensable para auditorías y responsabilidad (Martín, Sánchez, Lanza y Sotres, 2023, p. 2).

Esa trazabilidad técnica tiene un correlato jurídico exacto. La Ley 21.719 exige al responsable acreditar la licitud del tratamiento (art. 13, inciso final), aplicar protección desde el diseño y por defecto (art. 14 quáter) y, cuando un tratamiento pueda producir alto riesgo —como la elaboración de perfiles o el tratamiento masivo de datos—, realizar previamente una evaluación de impacto en protección de datos (art. 15 ter). La auditoría de la IA, que la doctrina describe como un campo de práctica en rápido crecimiento (Mökander, 2023, p. 1) y compara con la auditoría financiera (Mökander, 2023, p. 2), encuentra así en nuestra legislación obligaciones concretas: documentar, evaluar, demostrar.

La conclusión es difícil de eludir. Comprender la inteligencia artificial sin atender a la realidad técnica del dato es hoy una empresa estéril; y regular la IA sin regular el dato sería igualmente ilusorio. La Ley 21.719 —cuyas disposiciones principales entran en plena vigencia el 1 de diciembre de 2026— no es solo una ley de privacidad. Es, sin proponérselo expresamente, la primera infraestructura normativa chilena para una inteligencia artificial fiable. Quienes desarrollen o desplieguen estos sistemas harían bien en leerla no como una carga, sino como el manual de calidad que su propia tecnología ya exigía.


*Felipe Diez Ringele

Profesor e investigador

Universidad del Desarrollo y de la Universitat de Girona

Candidato a doctor por ambas instituciones

Fundador de Lexinex, empresa asesora de cumplimiento normativo en materia de IA

Artículos relacionados

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Close
Close