Columnas

Minería de datos, inteligencia artificial y derecho de autor: la excepción que llegó por la puerta lateral

Por Daniela Aranda Marambio y Paula Droguett*

Entre rebajas tributarias, permisología y medidas de reactivación económica, el Proyecto de Ley para la Reconstrucción Nacional y el Desarrollo Económico y Social (bautizada por la prensa como “ley tutti frutti”) introduce una de las modificaciones más relevantes, pasando absolutamente inadvertido entre los variados temas que se proponen – en materia de propiedad intelectual e inteligencia artificial- una nueva excepción que permite el uso de obras protegidas sin autorización ni remuneración para fines de análisis masivo de datos..La propuesta incorpora un nuevo artículo 71 letra T a la Ley N° 17.336, que declara “lícitos los actos de reproducción, adaptación o comunicación de obras lícitamente publicadas cuando se realicen exclusivamente para la extracción, comparación, clasificación u otros análisis estadísticos de grandes volúmenes de datos, siempre que ello no constituya una “explotación encubierta” de las obras protegidas”.

Daniela Aranda Marambio

Todo esto sin considerar que aún están en discusión los proyectos de ley que buscan regular los sistemas de inteligencia artificial (boletines 15869-19 y 16821-19, refundidos), los que siguen en tramitación y se encuentran actualmente en segundo trámite constitucional en el Senado.

Leído en contexto tecnológico, el alcance es evidente: la norma habilita, en principio, el uso de obras protegidas para el entrenamiento de modelos de inteligencia artificial -incluidos los modelos de lenguaje (LLM)- sin necesidad de autorización de los titulares.

La pregunta no es si el derecho debe adaptarse a estas tecnologías. Es cómo debe hacerlo.

Una excepción amplia en un debate aún abierto

A nivel comparado, la regulación del uso de obras para entrenamiento de inteligencia artificial está lejos de ser pacífica.

Paula Droguett

La Unión Europea, por ejemplo, introdujo excepciones de text and data mining (TDM) en su Directiva de Copyright de 2019, pero bajo ciertas condiciones: distingue entre usos científicos y comerciales, y permite a los titulares excluir sus obras mediante mecanismos de opt-out. En otras jurisdicciones, como el Reino Unido, intentos de establecer excepciones amplias han enfrentado resistencia significativa y ajustes regulatorios. En Estados Unidos, en tanto, la discusión se ha canalizado principalmente a través de litigios bajo la doctrina del fair use.

El proyecto chileno se aparta de esos matices y opta por una formulación particularmente amplia: no distingue según finalidad, no contempla mecanismos de exclusión por parte del titular, y descansa en un estándar abierto -la ausencia de “explotación encubierta”- como principal límite. Lo cual no indica mayores directrices. Entonces nos quedan las siguientes dudas: ¿Quién determinará lo que es considerado como una “explotación encubierta”? ¿Cómo se hará en la práctica con la rapidez e inmediatez que tienen las redes sociales o el uso de obras en los medios digitales?¿Se judicializarán los conflictos en materia de vulneración de derechos de autor cuando su uso sea considerado como una “explotación encubierta»? O simplemente, ¿Se tolerará el hecho de que ya las obras ingresaron a los diferentes mecanismos de LLM y con esto hay una fehaciente pérdida de control en las obras de sus propios autores? Y a todo esto, ¿Qué tienen que decir las entidades de gestión colectivas? ¿Qué tienen que decir los expertos en materia de propiedad intelectual? Hay votos y esto se aprueba, y después: ¿Qué? Este diseño no es neutro.

El problema no es la excepción, es su indeterminación

Las excepciones a los derechos de autor no son, en sí mismas, problemáticas. El sistema siempre ha reconocido espacios de uso legítimo sin autorización. El punto crítico es el nivel de precisión con que se delimitan.

En este caso, la norma introduce un concepto central -“explotación encubierta”- sin definirlo ni asociarlo a criterios verificables. ¿Se refiere a la sustitución de la obra en el mercado? ¿A la replicación sustancial de su contenido? ¿A la afectación económica del titular? ¿A la posibilidad de reconstruir la obra a partir del output?

La ausencia de parámetros genera un doble efecto: por una parte, amplía el margen de interpretación; por otra, traslada la carga de definición a la litigación futura.

En otras palabras, no resuelve el problema: lo posterga.

Regular el input, ignorar el output

Hay, además, un desajuste estructural en la forma en que la norma aborda el fenómeno tecnológico.

El artículo propuesto regula el uso de obras como input -esto es, su utilización para entrenamiento o análisis-, pero guarda silencio sobre el output, que es precisamente donde se materializan los principales conflictos jurídicos.

Los modelos generativos no solo analizan obras: producen contenido. Y ese contenido puede:

  • replicar estilos identificables,
  • reconstruir fragmentos sustanciales,
  • o generar resultados funcionalmente sustitutivos de las obras originales.

El riesgo no está únicamente en el acto de entrenamiento, sino en la explotación posterior de sus resultados. Sin embargo, la norma no articula un vínculo claro entre ambos planos.

El resultado es una regulación incompleta: permite el uso masivo de obras en la fase inicial, sin establecer mecanismos claros para abordar sus efectos posteriores.

Un estándar probatorio, en la práctica, inalcanzable

El límite propuesto -la ausencia de “explotación encubierta”- enfrenta un problema adicional: su aplicación práctica.

Para que un titular alegue que se ha configurado una explotación encubierta, deberá, en principio, demostrar:

  • que su obra fue utilizada en el entrenamiento,
  • que el modelo genera outputs vinculados a ella,
  • y que dichos outputs constituyen una forma de explotación.

En el contexto de sistemas opacos, datasets no públicos y outputs probabilísticos, esa carga probatoria se vuelve extraordinariamente difícil de cumplir.

El riesgo, entonces, no es solo la incertidumbre jurídica, sino la generación de una zona de inmunidad de facto, donde el uso de obras protegidas resulta difícilmente cuestionable en la práctica, aun cuando pueda ser discutible en teoría.

Efectos sistémicos: mercado, incentivos y asimetrías

Más allá del análisis dogmático, la norma tiene implicancias estructurales.

Al permitir el uso de obras sin autorización ni remuneración como regla general, desplaza el equilibrio tradicional del derecho de autor: de un sistema basado en el consentimiento del titular, a uno donde el uso es lícito salvo prueba en contrario.

Ese cambio afecta los incentivos:

  • reduce la necesidad de negociar licencias,
  • debilita la posición de los creadores frente a grandes desarrolladores tecnológicos,
  • puede tensionar la sostenibilidad de ciertos mercados creativos, y 
  • por tanto, genera el desincentivo a crear y publicar obras, ya que sus propios autores se encuentran desprotegidos bajo esta excepción amplia e indeterminada.

A ello se suma una asimetría evidente: mientras los beneficios de la excepción se concentran en actores con capacidad tecnológica para explotar grandes volúmenes de datos, los costos se distribuyen entre titulares individuales con menor capacidad de defensa.

Técnica legislativa y deliberación pendiente

Todo lo anterior se inserta, además, en un contexto legislativo particularmente complejo.

La modificación se propone en el marco de un proyecto de ley de más de 200 páginas, que aborda materias tan diversas como tributación, permisos sectoriales, medio ambiente y empleo. En ese contexto, la incorporación de una excepción de esta magnitud en propiedad intelectual corre el riesgo de no recibir la deliberación técnica especializada que requiere. Teniendo el riesgo de “pasar colada”.

No es solo una cuestión de contenido. Es también una cuestión de proceso.

Algunas líneas para una regulación más precisa

Si el objetivo es compatibilizar el desarrollo de inteligencia artificial con la protección de la propiedad intelectual, existen alternativas regulatorias más equilibradas.

Entre ellas:

  • Incorporar mecanismos de exclusión (opt-out), que permitan a los titulares decidir si sus obras pueden ser utilizadas para entrenamiento.
  • Delimitar el estándar de “explotación encubierta”, asociándolo a criterios objetivos, como sustitución en el mercado, similitud sustancial o impacto económico.
  • Introducir obligaciones de trazabilidad o transparencia, al menos a nivel agregado, respecto de los datasets utilizados.
  • Abordar expresamente el problema del output, estableciendo reglas sobre generación de contenidos que reproduzcan o imiten obras protegidas.
  • Explorar esquemas de remuneración o licenciamiento colectivo, que permitan internalizar parte del valor generado.

Ninguna de estas soluciones es trivial. Pero todas apuntan a lo mismo: reducir la incertidumbre y distribuir de mejor manera los riesgos y beneficios del uso de obras en entornos de inteligencia artificial.

El derecho de autor, como cualquier sistema jurídico, debe adaptarse a los cambios tecnológicos. Pero esa adaptación requiere precisión, deliberación y claridad en los límites.

Regular el uso de obras para inteligencia artificial no es solo habilitar su utilización. Es definir bajo qué condiciones, con qué resguardos y con qué efectos.

Porque cuando los límites quedan abiertos, en los hechos, dejan de ser límites.

Artículos relacionados

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Close
Close