Las herramientas de IA como ChatGPT se basan en infracciones masivas de derechos de autor

Zainab Choudhry es una fundadora de startups que ha trabajado en derecho, tecnología y medios en Nueva York y Toronto.

El viejo mundo, en el que solo las mentes humanas habían evolucionado para crear historias, arte, música y poesía, ya no existe.

Ahora hemos entrado en la era de la generación inteligencia artificial, un tipo de IA que puede crear contenido nuevo basado en conjuntos de datos de contenido existente con el que ha sido “alimentado” y entrenado. En esta nueva era, los desarrolladores de IA generativa están construyendo las mentes de estas máquinas entrenándolas en contenido creado por humanos del pasado y del presente, desde Shakespeare a Atwood, Caravaggio a Koons. Hasta ahora, nos hemos maravillado con las creaciones que las herramientas generativas de IA como ChatGPT han producido, pero este uso de la IA plantea cuestiones éticas y legales cruciales.

Se necesitan enormes cantidades de datos para entrenar un programa de inteligencia artificial generativa como ChatGPT, y para construir estas herramientas de forma económica y rápida, los desarrolladores están cometiendo infracciones masivas de derechos de autor. Estos conjuntos de datos se crean en gran medida al buscar en Internet y recopilarlos. cada tipo de contenido, desde artículos, libros y obras de arte hasta nuestros fotos y tuits. Estos métodos dan lugar a algunas preguntas importantes: ¿Es legal el uso de nuestro contenido protegido por derechos de autor para entrenar modelos generativos de IA? ¿El uso de contenido protegido por derechos de autor para capacitar a la IA se incluye en las excepciones de uso justo en los Estados Unidos y trato justo en Canadá? ¿Tenemos derecho a una compensación cuando nuestro trabajo se alimenta a las máquinas?

Como ex fundador de una startup de derechos de autor con un título en derecho y una carrera de larga data en la intersección de la ley de propiedad intelectual (PI), los medios y la tecnología, sé que las reglas se reducen a un principio central: usar el contenido original de otra persona. , debe obtener su permiso, salvo algunas excepciones. En mi opinión, el uso de contenido con derechos de autor para entrenar una IA generativa, sin permiso, cae fácilmente en una infracción de derechos de autor.. Si entrena un modelo generativo de IA sobre el contenido de la obra de un pintor o poeta en particular, o incluso la voz de un cantante, la IA puede hacer un buen trabajo replicando el contenido y el estilo exactos de esas pinturas, poemas o voces en las nuevas obras que crea. A la velocidad del rayo, la IA generativa puede entrenar y escribir un nuevo libro basado en el trabajo de un autor mucho antes de que el autor humano pueda hacerlo.

Claramente, necesitamos protecciones legales para los autores, artistas y creadores de contenido que no quieren que su trabajo se use para entrenar la IA. Por ahora, sin embargo, es un Salvaje Oeste. Los desarrolladores de IA generativa no muestran consideración por el contenido protegido por derechos de autor, ni buscan el consentimiento de los autores y artistas para usar su contenido, y ciertamente no se ha ofrecido ninguna compensación. Como un montón de reciente infracción de copyright pleitos contra los desarrolladores de IA generativa tiene surgido, espero que se respeten las protecciones de nuestras leyes de derechos de autor. Sin embargo, depender únicamente de precedentes en esta área es arriesgado, con dos escollos importantes. En primer lugar, se necesita mucho tiempo para que las demandas y apelaciones lleguen hasta el final. Corte Suprema. En segundo lugar, nuestra propiedad intelectual colectiva está en juego: un caso débil puede llevarnos al fracaso si no se establece un precedente a favor de nuestras protecciones intelectuales.

Empujado a este nuevo terreno, la mejor manera de resolver cualquier problema legal de IA es desarrollar nuevas leyes y regulaciones en lugar de interpretar las existentes. Nuestras leyes de derechos de autor actuales simplemente no se crearon teniendo en cuenta la IA y sus capacidades. El tiempo es esencial, y tratando de regular el contenido generado por la IA es como cortar las cabezas de una hidra. En lugar de ponernos al día, necesitamos regular la IA generativa en la fuente: sus datos de entrenamiento. Necesitamos proteger nuestra propiedad intelectual y debemos limitar la capacidad de los desarrolladores de IA generativa para saquear libremente nuestras mentes sin permiso ni compensación.

En muchos casos, las personas desear IA generativa: puede ser una herramienta muy útil. Pero no podemos olvidar que la IA generativa necesidades Contenido generado por humanos para entrenar: no es una relación simbiótica. La regulación de los datos de entrenamiento de IA al permitir solo la entrada de contenido de origen ético y legal es imperativo para un futuro tecnológico saludable.

La IA generativa es un genio que nos ha concedido infinitos deseos en nuestra búsqueda de contenido nuevo, pero también es un genio que nunca podremos volver a poner en la botella. Ahora estamos en un mundo nuevo, y por más nostálgicos que seamos por la vieja forma de producción creativa, la forma humana, no hay vuelta atrás. Pero todavía tenemos la oportunidad de regular adecuadamente las herramientas de IA generativa y los datos en los que se entrenan. Hasta entonces, continuaré etiquetando mi propio trabajo como protegido por derechos de autor, cruzando los dedos para que esta designación siga siendo relevante en el futuro.

Leer Más