-Advertisement-
La empresa de inteligencia artificial OpenAI ha lanzado “GPTBot”, su nueva herramienta de rastreo web que, según afirma, podría utilizarse para mejorar los futuros modelos ChatGPT.
“Las páginas web rastreadas con el agente de usuario GPTBot podrían utilizarse para mejorar futuros modelos”, afirma OpenAI en una entrada de su blog, añadiendo que podría mejorar la precisión y ampliar las capacidades de futuras iteraciones.
Un rastreador web, también llamado araña web, es un tipo de robot que indexa el contenido de los sitios web de Internet. Los motores de búsqueda como Google y Bing los utilizan para que los sitios web aparezcan en los resultados de las búsquedas.
OpenAI dijo el rastreador web recopilará datos de acceso público de la red mundial, pero filtrará las fuentes que requieran contenidos de pago, o de las que se sepa que recopilan información de identificación personal, o que contengan textos que infrinjan sus políticas.
Breaking
OpenAI acaba de lanzar GPTBot, un rastreador web diseñado para extraer automáticamente datos de todo Internet.
Estos datos se utilizarán para entrenar futuros modelos de IA como GPT-4 y GPT-5.
GPTBot garantiza que se excluyan las fuentes que violan la privacidad y las que están detrás de muros de pago. pic.twitter.com/oR3kY4buaU
– Shubham Saboo (@Saboo_Shubham_) 7 de agosto de 2023
Cabe señalar que los propietarios de sitios web pueden denegar el rastreo web añadiendo un comando “disallow” a un archivo estándar del servidor.
El nuevo rastreador llega tres semanas después de que la empresa presentara una solicitud de marca para “GPT-5”, el sucesor previsto del actual modelo GPT-4.
La solicitud se presentada en la Oficina de Patentes y Marcas de Estados Unidos el 18 de julio, y cubre el uso del término “GPT-5”, que incluye software para el habla y el texto humano basado en IA, la conversión de audio en texto y el reconocimiento de voz y habla.
OpenAI ha presentado una solicitud de marca para:
“GPT-5”
que incluye “software para”:
“la producción artificial de habla y texto humanos”
“conversión de archivos de datos de audio en texto”
“reconocimiento de voz y discurso”
“procesamiento del lenguaje y del habla basado en el aprendizaje automático”
– YK alias CS Dojo (@ykdojo) 1 de agosto de 2023
Sin embargo, es posible que los observadores no quieran contener la respiración por la próxima iteración de ChatGPT todavía. En junio, el fundador y consejero delegado de OpenAI, Sam Altman, afirmó que la empresa no está “ni cerca” de empezar a entrenar GPT-5, explicando que es necesario realizar varias auditorías de seguridad antes de empezar.
Relacionado: 11 avisos de ChatGPT para una máxima productividad
Por otra parte, últimamente han surgido dudas sobre las tácticas de recopilación de datos de OpenAI, sobre todo en torno a los derechos de autor y el consentimiento.
En junio, el organismo de control de la privacidad de Japón advirtió a OpenAI sobre la recopilación de datos confidenciales sin permiso, mientras que Italia prohibió temporalmente el uso de ChatGPT tras alegar que infringía varias leyes de privacidad de la Unión Europea en abril.
A finales de junio, 16 demandantes interpusieron una demanda colectiva contra OpenAI alegando que la empresa de IA había accedido a información privada de las interacciones de los usuarios de ChatGPT.
Si se demuestra que estas acusaciones son ciertas, OpenAI -y Microsoft, que fue nombrada demandada- estarían infringiendo la Computer Fraud and Abuse Act, una ley con precedentes en casos de web-scraping.
Revista: AI Eye: AI travel booking hilariously bad, 3 weird uses for ChatGPT, crypto plugins
Source: COIN TELEGRAPH