IA generativa y propiedad intelectual

Hemos estado hablando sobre propiedad intelectual de una forma u otra durante al menos los últimos quinientos años, y cada nueva ola de tecnología o creatividad conduce a nuevos tipos de argumentos.

Inventamos derechos de interpretación para compositores y decidimos que la fotografía, la «reproducción mecánica», podía ser protegida como arte, y en el siglo XX tuvimos que decidir qué pensar sobre todo, desde la música grabada hasta el VHS y el muestreo musical.

La inteligencia artificial generativa plantea algunas de esas preguntas de nuevas maneras (o incluso de maneras antiguas), pero también plantea algunos tipos nuevos de enigmas, siempre los mejores.

A un nivel más simple, muy pronto tendremos aplicaciones para teléfonos inteligentes que te permitirán decir «reprodúceme esta canción, pero con la voz de Taylor Swift». Esa es una nueva posibilidad, pero entendemos bastante bien las ideas de propiedad intelectual; habrá muchas discusiones sobre quién recibe cuánto pago, pero sabemos lo que pensamos que son los derechos morales. Las compañías discográficas ya están teniendo conversaciones con Google sobre esto.

Pero ¿qué sucede si digo «hazme una canción al estilo de Taylor Swift» o, aún más desconcertante, «hazme una canción al estilo de los mayores éxitos pop de la última década»?

Una persona no puede imitar otra voz perfectamente (los imitadores de voces no tienen que pagar tarifas de licencia), pero pueden escuchar mil horas de música y crear algo en ese estilo, lo que a veces llamamos un «pastiche».

Si una persona hiciera eso, no tendría que pagar una tarifa a todos esos artistas, así que si usamos una computadora para eso, ¿necesitamos pagarles? No creo que sepamos cómo pensar en eso. Es posible que sepamos lo que dice la ley, pero es posible que deseemos cambiar eso.

Problemas similares surgen en el arte y también algunas diferencias culturales interesantes. Si le pido a Midjourney una imagen al estilo de un artista en particular, algunas personas consideran esto un robo obvio y directo, pero si hablas con los especialistas de Christie’s o Sotheby’s, o recorres las galerías de Lower Manhattan o Mayfair, la mayoría de las personas no solo estarán en desacuerdo sino que se sentirán perplejas por la premisa, ya que si creas una imagen «al estilo de» Cindy Sherman, no has robado de ella y nadie que valore a Cindy Sherman considerará tu obra un sustituto (excepto en el sentido de Richard Prince).

Sé con cuál estoy de acuerdo, pero eso no es lo que importa. ¿Cómo llegamos a un consenso sobre el muestreo en el hip-hop? De hecho, ¿estamos de acuerdo en relación a Richard Prince? Lo resolveremos.

Tomemos otro problema. Creo que la mayoría de las personas entiende que si publico un enlace a una noticia en mi feed de Facebook y les digo a mis amigos que la lean, es absurdo que el periódico exija un pago por esto.

Un periódico, de hecho, no paga un porcentaje a un restaurante cuando escribe una reseña. Si puedo pedirle a ChatGPT que lea diez sitios web de noticias y me dé un resumen de los titulares de hoy, o me explique una gran noticia, de repente la queja de los periódicos se vuelve mucho más razonable, ya que la empresa de tecnología realmente está «usando las noticias».

Como era de esperar, en cuanto ChatGPT anunció que tenía su propio rastreador web, los sitios de noticias comenzaron a bloquearlo.

Pero al igual que en mi ejemplo de «hazme algo como los diez éxitos principales», ChatGPT no estaría reproduciendo el contenido en sí mismo, y de hecho, podría pedirle a un becario que lea los periódicos por mí y haga un resumen (a menudo describo la IA como brindándote becarios infinitos).

Eso podría estar rompiendo los términos de servicio auto-declarados, pero los resúmenes (a diferencia de los extractos) generalmente no se consideran cubiertos por derechos de autor; de hecho, nadie ha sugerido nunca que este boletín esté infringiendo los derechos de autor de los sitios a los que enlazo.

¿Significa eso que decidiremos que esto no es un problema? La respuesta probablemente tiene muy poco que ver con lo que la ley dice hoy en día en uno u otro país.

Una forma de pensar en esto podría ser que la IA hace prácticas a gran escala que antes solo eran posibles a pequeña escala. Esto podría ser la diferencia entre que la policía lleve imágenes de buscados en sus bolsillos y que la policía coloque cámaras de reconocimiento facial en cada esquina de la calle; una diferencia en escala puede ser una diferencia en principio. ¿Qué resultados queremos? ¿Qué queremos que sea la ley? ¿Qué puede ser?

Pero el verdadero enigma intelectual, creo, no es que puedas apuntar a ChatGPT a los titulares de hoy, sino que por un lado, todos los titulares están en alguna parte de los datos de entrenamiento, y por otro lado, no están en el modelo.

OpenAI ya no es transparente acerca de lo que utiliza exactamente, pero incluso si no está entrenando con libros pirateados, ciertamente usa parte del «Common Crawl», que es un muestreo de un porcentaje de dos dígitos de la web entera. Así que tu sitio web podría estar allí. Pero los datos de entrenamiento no son el modelo.

Los LLM (modelos de lenguaje masivo) no son bases de datos. Deducen o infieren patrones en el lenguaje al ver vastas cantidades de texto creado por personas; escribimos cosas que contienen lógica y estructura, y los LLM miran eso e infieren patrones, pero no lo retienen. Por lo tanto, ChatGPT podría haber examinado mil historias del New York Times, pero no las ha conservado.

Además, esas mil historias en sí mismas son solo una fracción minúscula de una fracción de un porcentaje de todos los datos de entrenamiento. El propósito no es que el LLM conozca el contenido de una historia o novela en particular; el propósito es que vea los patrones en la producción de inteligencia humana colectiva.

Es decir, esto no es Napster. OpenAI no ha «pirateado» tu libro o tu historia en el sentido en que normalmente usamos esa palabra, y no lo

está distribuyendo de forma gratuita. De hecho, no necesita esa novela en particular en absoluto. En la gran frase de Tim O’Reilly, los datos no son petróleo; los datos son arena. Solo son valiosos en el conjunto de miles de millones, y tu novela, canción o artículo es solo un grano de polvo en la Gran Pirámide.

OpenAI podría volver a entrenar a ChatGPT sin necesitar periódicos, si fuera necesario, y podría no importar; podría ser menos capaz de responder preguntas detalladas sobre las mejores cafeterías nuevas en el Upper East Side de Manhattan, pero nuevamente, ese nunca fue el objetivo.

No se supone que esto sea un oráculo ni una base de datos. Más bien, se supone que está inferiendo «inteligencia» (una palabra provisional) al ver la forma en que las personas hablan, como un sustituto de cómo piensan.

Por otro lado, no necesita tu libro ni tu sitio web en particular, y no le importa lo que tú en particular hayas escrito, pero sí necesita «todos» los libros y «todos» los sitios web. Funcionaría si una compañía eliminara su contenido, pero no si todos lo hicieran.

Si esto es, como mínimo, una nueva tecnología fundamental para la próxima década (independientemente de cualquier conversación sobre la IA general), y depende de que todos actuemos colectivamente como «turcos mecánicos» para alimentarlo (aunque sea ex post facto), ¿todos obtendremos pago o nos retiraremos colectivamente, o qué? Parece de alguna manera insatisfactorio argumentar que «esto vale un billón de dólares y depende de usar todo nuestro trabajo, pero tu trabajo individual solo representa el 0.0001%, así que no obtienes nada». ¿Es adecuado o incluso correcto llamar a esto «uso legítimo»? ¿Importa en alguna dirección? ¿Cambiamos nuestras leyes en torno al uso legítimo?

Al final, es posible que no importe tanto: el término «Grande» en «Grandes Modelos de Lenguaje» es un objetivo en movimiento. La tecnología comenzó a funcionar porque OpenAI introdujo órdenes de magnitud más datos de los que nadie consideraba razonable, y obtuvo excelentes resultados, pero no podemos agregar órdenes de magnitud más datos nuevamente, porque realmente no queda tanta más información. Mientras tanto, el costo y la escala de estas cosas significan que una gran parte del esfuerzo de investigación ahora se dirige a obtener los mismos o mejores resultados con mucha menos información. Tal vez no necesiten tu libro después de todo.

Mientras tanto, hasta ahora he estado hablando sobre lo que entra en el modelo; ¿qué pasa con las cosas que salen? ¿Qué pasa si uso un motor entrenado en los últimos 50 años de música para crear algo que suena completamente nuevo y original? Nadie debería tener la ilusión de que esto no sucederá.

Después de sugerir muchas cosas en las que no creo que sepamos las respuestas, hay una cosa que me parece totalmente clara: estas cosas son herramientas, y puedes usar una herramienta para hacer arte o para hacer imágenes de gatos.

Puedo comprar la misma cámara que Cartier-Bresson y puedo presionar el botón y hacer una foto sin saber dibujar ni pintar, pero eso no es lo que hace al artista; la fotografía se trata de dónde apuntas la cámara, qué imagen ves y cuál eliges. Nadie afirma que una máquina haya creado la imagen. Del mismo modo, puedo presionar «Ir» en Midjourney o ChatGPT sin ninguna habilidad en absoluto, pero lograr algo bueno es igual de difícil.

En este momento, están en la etapa del daguerrotipo, pero las personas usarán estas herramientas para hacer arte que no hemos imaginado, no porque falte la habilidad, sino porque no somos artistas. Nadar está por venir.

El problema más interesante, quizás, podría ser que Spotify ya tiene enormes cantidades de pistas de «ruido blanco» y similares, manipulando el algoritmo de recomendación y obteniendo el mismo pago por reproducción que Taylor Swift o los Rolling Stones.

Si realmente podemos hacer «música al estilo de los mayores éxitos de la última década», ¿cuánto habrá de eso y cómo lo navegaremos? ¿Cómo encontraremos lo bueno y cómo lo definiremos? ¿Nos importará?

Hace algunas semanas, en una galería de arte en Londres, vi una impresión de Durero que no era una impresión de Durero: era una copia hecha alrededor de 1506 por Raimondi, un estudiante de Rafael. Vasari nos cuenta que Durero estaba furioso y fue a los tribunales en Venecia.

Aprecio la idea de los magistrados venecianos tratando de descubrir cómo pensar en esto: su veredicto fue que Raimondi podía seguir haciendo las copias, pero ya no podía incluir el logotipo de Durero. Ese fue un caso sobre propiedad intelectual, pero el veredicto es también una división elegante entre dos ideas de autenticidad.

¿Nos importa quién lo hizo y por qué, o simplemente queremos la imagen? Por eso algunas personas se horrorizan con los generadores de música o Midjourney (o, hace 150 años, se horrorizaban con las cámaras), y otros no están preocupados en absoluto.

Traducción del artículo «Generative AI and intellectual property» de Benedict Evans.