Cuando OpenAI entrenaba a su inteligencia artificial, ChatGPT, lo hizo con millones de textos que ahora son reclamados por los autores originales.
Los textos usados por la empresa de tecnología iban desde sitios web, artículos, libros, publicaciones en redes sociales o estudios académicos, lo que le sirvió a ChatGPT para identificar patrones y relaciones entre palabras, frases o párrafos.
Sin embargo, la mayoría de estos textos estaban protegidos por derechos de autor, lo que ha empezado a ser un problema para OpenAI debido a las quejas de cientos de escritores y casas editoriales.
Pero OpenAI se defiende con que los textos que se usaron no fueron copiados literalmente, ya que sólo fueron estudiados por ChatGPT a forma de referencia y no para copiar las obras en su totalidad.
“Durante el proceso de entrenamiento, se utiliza texto de diversas fuentes para entrenar el modelo ChatGPT. Es probable que el texto se copiara en una base de datos interna de OpenAI con el fin de entrenar el modelo. Sin embargo, el texto de entrenamiento se suele preprocesar para eliminar cualquier información sensible, como identificadores personales, texto protegido por derechos de autor, etc. Además, el texto también se utiliza para entrenar el modelo y no se almacena en una base de datos. El modelo utiliza el texto para aprender patrones y la estructura del lenguaje y, una vez terminado el entrenamiento, ya no necesita el texto”.
Explicó OpenAI
Además, de acuerdo con la Ley de Propiedad Intelectual, la obra derivada puede ser una modificación, adaptación o transformación de una obra existente, donde se garantizan los derechos de autor de la obra originaria.
De esta forma parece que no hay un uso injustificado, ya que el programa no realizó algún plagio al escribir las obras nuevamente, ya que sólo se usaron como un banco de información que aunque sí llega a replicar, no lo hace palabra por palabra.
Pero bueno, ¿OpenAI se librará de las demandas?
También te puede interesar: ¿Elon Musk creará su propio ChatGPT?