Continúa la polémica: una filtración revela que OpenAI usó millones de vídeos de YouTube para entrenar al modelo GPT-4

Hace una semana salieron a la luz unos rumores de que OpenAI estaba utilizando la plataforma de YouTube, propiedad de Google, para entrenar a Sora, una herramienta de IA generativa que crea vídeos realistas a partir de una descripción de texto. El CEO de YouTube, Neal Mohan, advirtió a Sam Altman, CEO de Open AI, que si utilizaban sus vídeos estarán rompiendo las reglas. Pero en principio, eran solo rumores.

En cambio, ahora, una investigación del medio The New York Times asegura que OpenAI también ha utilizado más de un millón de horas de video para entrenar a Whisper, su inteligencia artificial que convierte audio en texto, con el objetivo de usar sus transcripciones para hacer lo propio con GPT-4.

YouTube para entrenar a GPT-4

Las primeras sospechas sobre que OpenAI podría estar utilizando a YouTube para entrenar a Sora aumentaron considerablemente después de una entrevista realizada a Mira Murati, la CTO de la compañía de inteligencia artificial, en el The Wall Street Journal, ya que al preguntarle esta posibilidad respondió textualmente: “No estoy segura de eso”.

Según afirman desde The New York Times, se han utilizado las transcripciones Whisper para entrenar a GPT-4, que está considerado uno de los modelos de lenguaje más avanzados de la actualidad. Comentan también que las principales compañías de IA ya han consumido todos los datos públicos disponibles para entrenar y aseguran que OpenAI se quedó sin datos en el 2021.

Tras ocurrir esto, los ejecutivos de la compañía tomaron la decisión de usar cerca de un millón de horas de vídeos de YouTube para extraer el audio y entrenar a Whisper. Y que se refugiarían en el uso razonable al utilizar solo una parte de los cientos de miles de millones de horas de vídeos que hay en la plataforma.

Matt Bryant, portavoz de Google, confirma que han visto ‘informes no confirmados’ de la actividad de OpenAI y vuelve a recordar que sus condiciones de servicio prohíben la descarga no autorizada el contenido de YouTube. Dicho esto, veremos cómo sigue avanzando este caso y si cualquiera de las compañías decide utilizar o pasar a ámbitos legales.

Apúntate a nuestra newsletter y recibe en tu correo las últimas noticias sobre tecnología.

Zircon - This is a contributing Drupal Theme
Design by WeebPal.