¿Es ChatGPT el rey? Cómo les fue a los mejores chatbots de IA gratuitos en las pruebas de campo

May 18, 2023

-Advertisement-

Aunque ChatGPT de OpenAI fue el primer chatbot basado en inteligencia artificial (IA) que cautivó al mundo tras su lanzamiento público en noviembre de 2022, desde entonces han aparecido en el mercado diversos competidores.

Los gigantes tecnológicos Google y Microsoft han lanzado sus chatbots de IA, con Bard de Google eliminando su lista de espera y abriéndose a más de 180 países y territorios el 10 de mayo, después de que Microsoft se le adelantara y lanzara por completo su motor de búsqueda Bing potenciado por IA el 4 de mayo.

Con varios chatbots entre los que elegir, Cointelegraph decidió poner a prueba algunos de los más conocidos para ver cuál resistía mejor las pruebas de campo, así como comparar algunas de sus características.

Para poner a prueba los chatbots, se les plantearon una serie de preguntas, acertijos y preguntas más complejas para determinar su precisión y velocidad de respuesta.

Muchos de los chatbots de IA disponibles en la actualidad están basados en los modelos GPT de OpenAI. Aunque estos chatbots de IA pueden dar resultados similares a ChatGPT, los desarrolladores de aplicaciones también pueden añadir comandos adicionales, que pueden cambiar los resultados.

ChatGPT-3.5 de OpenAI

Aunque OpenAI ya ha lanzado ChatGPT-4, que está disponible para los usuarios del plan Plus por 20 dólares al mes, ChatGPT-3.5 es de uso gratuito y se prueba aquí.

ChatGPT-4 supera significativamente a su predecesor con velocidades de respuesta más rápidas, respuestas más precisas y menos tiempo de inactividad del servidor.

El primer chatbot de inteligencia artificial que arrasa en todo el mundo puede ayudar en tareas como la redacción de ensayos, la depuración de código e incluso las finanzas personales con tan solo un segundo de tiempo de procesamiento.

Sin embargo, un área en la que ChatGPT se queda corto es su falta de capacidad para realizar búsquedas en Internet.

Esto significa que el modelo es tan bueno como los datos de entrenamiento con los que se alimenta, que llegan hasta septiembre de 2021. OpenAI está desarrollando plugins que le permiten obtener información en línea utilizando la API de búsqueda de Bing, pero esto se limitará a los usuarios del plan Plus.

ChatGPT cuenta con un nuevo plugin que utiliza la API de Bing para acceder a Internet actualizada.

Esto lo cambia todo. pic.twitter.com/Izknqp1UgC

– Rowan Cheung (@rowancheung) 23 de marzo de 2023

A pesar de esta carencia en la versión gratuita, el chatbot suele ser capaz de sugerir recursos para ayudar al usuario con su consulta, como se destaca en la interacción siguiente.

Image Caption _ Image Name | Vimilin — *Captura de pantalla que ilustra la incapacidad de ChatGPT-3.5 para hablar de acontecimientos recientes. Fuente:* *OpenAI*

ChatGPT-3.5 respondió correctamente a la mayoría de los acertijos que se le plantearon y a todos los problemas matemáticos sencillos, pero las respuestas fueron menos consistentemente correctas cuando se le plantearon problemas más complejos.

Por ejemplo, cuando se le pidió que resolviera la ecuación cuadrática 2t^2 + 0,3t – 0,4 = 0, ChatGPT-3.5 dio la respuesta correcta en uno de cada tres intentos y tuvo problemas similares al multiplicar números más grandes.

ChatGPT-3.5 también puede ser impreciso al responder a otras preguntas. Según las pruebas realizadas por OpenAI, sólo fue capaz de responder correctamente a 213 de las 400 preguntas del Examen Uniforme de la Abogacía, que los estudiantes de Derecho de Estados Unidos deben aprobar para poder ejercer como abogados.

Aparte de las imprecisiones fácticas, ChatGPT-3.5 también tuvo problemas con las preguntas que ponían a prueba su capacidad lógica, como la siguiente.

-Advertisement-

Bing de Microsoft

ChatGPT de Bing se basa en el modelo de lenguaje GPT-4 creado por OpenAI, pero los dos chatbots tienen varias diferencias clave.

La primera diferencia notable es que el chatbot de Bing tarda mucho más en responder a las preguntas, con un tiempo medio de respuesta de aproximadamente cinco segundos en comparación con el ChatGPT de OpenAI, que tarda sólo un segundo.

También requiere que los usuarios utilicen el navegador web Microsoft Edge, que no es ni de lejos tan popular como Google Chrome.

En el lado positivo, el chatbot de Bing utiliza el motor de búsqueda de Bing en sus respuestas, lo que le permite responder a preguntas sobre acontecimientos actuales, a diferencia de cualquier otro chatbot que utilice GPT-4. Además, actualmente está disponible de forma gratuita.

Además, proporciona fuentes para sus respuestas, lo que permite a los usuarios verificar más fácilmente las afirmaciones hechas por el chatbot.

Utilizando la misma ecuación cuadrática 2t^2 + 0.3t – 0.4 = 0, Bing enlazó con Microsoft Math Solver pero a menudo dio una respuesta incorrecta y tuvo problemas similares para responder correctamente a multiplicaciones mayores.

En la misma pregunta lógica sobre el marcador planteada a ChatGPT-3.5, Bing respondió correctamente que se esperaría ver el marcador en la página 120.

Bardo de Google

Recientemente, Google ha lanzado un chatbot de inteligencia artificial llamado Bard, que funciona con su modelo de lenguaje PaLM 2.

2/ Bard ahora también tiene plugins

Obtén acceso instantáneo a estas aplicaciones, entre otras:
・Spotify (Música)
・Walmart (venta al por menor)
・Indeed (búsqueda de empleo)
・Uber Eats (reparto de comida)
・Adobe Firefly (creación de imágenes)
・Y todas las Google Apps pic.twitter.com/WyRBBYbYbR

– Moritz Kremb (@moritzkremb) 11 de mayo de 2023

Como señala Moritz Kremb, entusiasta de la IA, en un hilo de Twitter, puede responder y recibir mensajes con imágenes, es compatible con numerosos lenguajes de programación y, al igual que el chatbot de Bing, puede conectarse a Internet.

A la pregunta de cómo se compara PaLM 2 con GPT-4, Bard dijo que GPT-4 es mejor en la generación de texto, pero PaLM 2 es mejor en el razonamiento y la lógica, añadiendo:

“En última instancia, el mejor modelo lingüístico para usted depende de sus necesidades. Si necesitas un LLM que sea fuerte en razonamiento y lógica, entonces Palm 2 es la mejor opción. Si necesitas un LLM que sea rápido, bueno generando texto y que haya demostrado su eficacia, entonces GPT-4 es la mejor opción.”

Bard respondió correctamente a la pregunta del marcador y explicó su respuesta con más profundidad que Bing, pero las explicaciones a menudo carecían de sentido.

Relacionado: ¿Qué es y cómo funciona el Bardo de Google?

Resolvió la mayoría de los acertijos que se le plantearon y obtuvo buenos resultados en las preguntas de matemáticas, resolviendo correctamente las preguntas de multiplicación compleja y la ecuación cuadrática en dos de los tres borradores de respuesta que preparó.

YouChat

Aunque también utiliza GPT-3.5 de OpenAI, hay algunas diferencias entre YouChat de You.com y ChatGPT de OpenAI.

Enumera las fuentes de la mayor parte del texto que genera y también proporciona enlaces a varias páginas web relacionadas con la consulta.

También se conecta a Internet, lo que le permite acceder a la actualidad, y como no tiene el mismo nivel de popularidad que el chatbot de OpenAI, el tiempo de inactividad no es un problema.

Respondió incorrectamente tanto a la pregunta del marcador, la ecuación cuadrática, como al problema más complejo de multiplicación.

Fue capaz de resolver la mayoría de las adivinanzas que se le plantearon, pero respondió incorrectamente a algunas.

HuggingChat

HuggingChat es un chatbox de IA de código abierto de la empresa de IA Hugging Face, lanzado en abril.

Algunos decían que las API cerradas ganaban…

pero nunca abandonaremos la lucha por la IA de código abierto ⚔️⚔️

Hoy es un gran día, ya que lanzamos la primera alternativa de código abierto a ChatGPT:

HuggingChat

Impulsado por el último modelo de Open Assistant – el mejor chat de código abierto… pic.twitter.com/LjKN78XaI7

– Julien Chaumond (@julien_c) 25 de abril de 2023

Cuando se le pidió que resolviera la misma ecuación cuadrática, HuggingChat devolvió 684 palabras de texto y no consiguió dar una respuesta a la pregunta. Aunque podía responder correctamente a problemas sencillos, no podía multiplicar números más grandes.

Aunque a veces daba respuestas directas, HuggingChat a menudo devolvía extensos muros de texto, que al principio eran relevantes pero que se convertían en algo parecido a divagaciones.

Por ejemplo, se le pidió que resolviera el siguiente acertijo: “Un barril de agua pesaba 18 kilos. Alguien puso algo en él, y ahora pesa 40 libras. ¿Qué añadió esa persona?”.

La respuesta correcta es un agujero, pero el HuggingChat contestó cubitos de hielo antes de lanzarse a un monólogo de 545 palabras.

¿Y el resto?

Hay muchos otros chatbots de IA disponibles en la actualidad, diseñados para casos de uso más limitados que los mencionados aquí, y es probable que el mercado siga creciendo rápidamente.

Por ejemplo, Socratic es otro chatbot de IA de Google que puede descargarse en un smartphone para ayudar a los usuarios a responder preguntas sobre ciencia, matemáticas, literatura y más. También proporciona explicaciones visuales de conceptos de diferentes materias y es una herramienta útil para ayudar al aprendizaje.

DeepAI es un chatbot de IA especializado en la escritura de textos como códigos de programación, poemas, historias o ensayos.

Conclusión

Aunque podría ser injusto comparar ChatGPT-3.5 de OpenAI con el chatbot de IA de Bing -dado que utilizan modelos lingüísticos diferentes-, este artículo sólo pretende analizar los chatbots de IA disponibles de forma gratuita.

A través de Bing, los usuarios pueden beneficiarse del modelo de lenguaje ChatGPT-4 de OpenAI, que supone una enorme mejora respecto a su predecesor.

Mientras que el Bard de Google era prometedor, el de Bing era en general el mejor de los actuales chatbots de IA disponibles de forma gratuita, aunque seguía cometiendo algunos errores.

Otros chatbots parecen tener casos de uso más limitados que podrían ser más útiles, pero estos tres parecen liderar el camino a medida que avanza el desarrollo.

Revista: Adicción al comercio de criptodivisas: qué hay que tener en cuenta y cómo se trata

Lo anterior representa una prueba de campo informal de diferentes soluciones de IA y no es de ninguna manera exhaustiva o representativa de la posición de Cointelegraph sobre una solución de IA en particular.

Source: COIN TELEGRAPH

Reciba noticias de Vimilin desde Google news

-Advertisement-

ChatGPT-3.5 de OpenAI

-Advertisement-

Bing de Microsoft

Bardo de Google

YouChat

HuggingChat

¿Y el resto?

Conclusión

-Advertisement-

LEAVE A REPLY Cancel reply