New York Times, cnn, Reuters, El Correo de Washington, Bloomberg cualquiera guardián Estos son sólo algunos de los medios de comunicación que han decidido bloquear la herramienta de seguimiento de OpenAI, GPTBot. Las preocupaciones sobre el uso de contenido no autorizado están aumentando.
Medios de comunicación de renombre, entre ellos el New York Times, cnn, Reuters, El Correo de Washington, Bloomberg cualquiera guardián han bloqueado el acceso al famoso rastreador web OpenAI llamado GPTBot. La empresa utiliza este rastreador para mejorar sus herramientas de inteligencia artificial, como ChatGPT, mediante la recopilación de información de diversas fuentes en la web.
Para contextualizar, esta novedad está diseñada para potenciar específicamente modelos como el GPT-4 —que ya ha demostrado perder calidad en sus respuestas— y su esperado sucesor, el GPT-5. La empresa —detrás del famoso ChatGPT— explica que GPTBot se centrará en recopilar datos disponibles públicamente en la red global.pero con ciertos filtros colocados.
En concreto, la herramienta evitará acceder a fuentes que requieran suscripciones de pago, aquellas que recopilen información de identificación personal (PII) o contengan contenido que vaya en contra de las políticas de OpenAI, como ha explicado en su blog.
Sin embargo, la iniciativa no ha estado exenta de grandes críticas en cuanto a la protección de contenidos y copia de datos de páginas web ajenas si no cumplen con los requisitos de filtrado.
Esta novedad de OpenAI Obliga a los propietarios de los sitios web a prohibir el uso de sus contenidos para formación en inteligencia artificial en lugar de que la empresa lo solicite.
Como resultado, los principales medios de comunicación de todo el mundo están dando un paso al frente, como lo hicieron al principio. Los New York Timesprohibir explícitamente en sus Términos de servicio el uso de su contenido para entrenar herramientas basadas en IA.
un editor de guardián y observadordijo: “Eliminar propiedad intelectual del sitio web de The Guardian con fines comerciales es, y siempre ha sido, contrario a nuestros términos de servicio. El equipo de Licencias Comerciales de Guardian tiene muchas relaciones comerciales mutuamente beneficiosas con desarrolladores de todo el mundo. Esperamos construir más relaciones de este tipo en el futuro.
Los grandes medios dicen no al OpenAI y a su interés en utilizar sus novedades para entrenar modelos de IA
Los modelos de lenguaje avanzados como ChatGPT requieren grandes conjuntos de datos para entrenarse, incluida información de la web, como noticias y artículos. Sin embargo, las empresas detrás de estos modelos a menudo no revelan si su conjunto de datos incluye material protegido por derechos de autor.
El bloqueo de GPTBot se implementa a través de archivos robots.txt en los sitios web de los editores, que indica a los rastreadores de los motores de búsqueda qué páginas pueden y qué páginas no pueden visitar.
La base de todo este alboroto es que los editores de noticias y otros creadores de contenido están cada vez más preocupados por la posibilidad de que su material sea utilizado sin su autorización en el entrenamiento de sistemas de IA.
“La propiedad intelectual es el alma de nuestro negocio; es imperativo que protejamos los derechos de autor de nuestro contenido”, afirma un portavoz de Reuters.
A principios de agosto, agencias de noticias como Agencia France-Presse (AFP) y imágenes falsas firmó una carta abierta pidiendo regulaciones más estrictas en materia de inteligencia artificial. Esto incluye la transparencia en la composición de los conjuntos de datos utilizados para entrenar modelos de IA y la obtención del consentimiento para el uso de contenido protegido por derechos de autor.
En el Reino Unido, el Comité de Cultura, Medios y Deportes ha instado al gobierno a proteger los derechos de propiedad intelectual en el uso de la IA generativa, y los editores de libros británicos han solicitado proteger estos derechos. Se espera que todas estas cuestiones y muchas más se debatan en la próxima Cumbre de Seguridad de la IA que se celebrará en el Reino Unido en noviembre.
Leer la nota Completa > Grandes medios prohíben usar sus noticias para entrenar a ChatGPT
