Hay algunas diferencias clave entre el antiguo modelo GPT-3.5 y el nuevo y brillante modelo GPT-4.

Después de todas las especulaciones y afirmaciones sobre las capacidades de GPT-4, la muy esperada cuarta iteración de la familia de modelos de lenguaje GPT se lanzó el 14 de marzo de 2023.

GPT-4 no vino con algunas de las características tan promocionadas que se rumoreaba que tenía. Sin embargo, el último modelo mejora significativamente el GPT-3.5 y sus predecesores. Pero, ¿en qué se diferencia GPT-4 de GPT-3.5? Lo guiaremos a través de algunas diferencias clave entre GPT-4 y GPT-3.5.

1. GPT-4 contra GPT-3.5: Creatividad

Una de las ventajas más pronunciadas del modelo GPT-4 sobre GPT-3.5 es su capacidad para proporcionar respuestas más creativas a las indicaciones. No me malinterpreten; GPT-3.5 es muy creativo. Hay una larga lista de cosas creativas que puedes hacer con ChatGPT que usa el modelo. Sin embargo, ya supera a muchos modelos de lenguaje grandes en términos de creatividad.

Sin embargo, GPT-4 sube el listón aún más. Aunque la ventaja creativa de GPT-4 puede no ser evidente cuando se trata de resolver problemas básicos, la diferencia en la creatividad entre ambos modelos se hace evidente a medida que la tarea se vuelve más difícil y requiere un mayor nivel de creatividad.

instagram viewer

Por ejemplo, si le pide a ambos modelos que completen una tarea creativa como escribir un poema en inglés y francés en cada línea del poema, ChatGPT impulsado por el último modelo GPT-4 entregará mejores resultados. Mientras que la respuesta de GPT-4 usaría ambos idiomas en cada línea, GPT-3.5 alternaría entre ambos idiomas, con cada línea usando un idioma y la siguiente usando el otro.

2. GPT-4 contra GPT-3.5: Entradas de imágenes o visuales

Mientras que GPT-3.5 solo puede aceptar indicaciones de texto, GPT-4 es multimodal y puede aceptar entradas de texto y visuales. Para ser claros, cuando decimos entradas visuales, la imagen no tiene que ser una imagen de un aviso escrito, puede ser una imagen de cualquier cosa. Entonces, desde una imagen de un problema matemático escrito a mano hasta memes de Reddit, GPT-4 puede comprender y describir casi cualquier imagen.

A diferencia de GPT-3, GPT-4 es tanto un lenguaje como un modelo visual.

Durante la transmisión en vivo del anuncio de GPT-4, un ingeniero de OpenAI alimentó el modelo con una captura de pantalla de un servidor Discord. GPT-4 podría describir cada detalle, incluidos los nombres de los usuarios en línea en ese momento. También se envió al modelo una imagen de una maqueta dibujada a mano de un sitio web de bromas con instrucciones para convertirlo en un sitio web y, sorprendentemente, GPT-4 proporcionó un código de trabajo para un sitio web que coincidía con el imagen.

3. GPT-4 contra GPT-3.5: Respuestas más seguras

Si bien GPT-4 no es perfecto, las medidas que adopta para garantizar respuestas más seguras son una actualización bienvenida del modelo GPT-3.5. Con GPT-3.5, OpenAI adoptó un enfoque de seguridad más basado en la moderación. En otras palabras, algunas de las medidas de seguridad fueron más una ocurrencia tardía. OpenAI monitoreó lo que hicieron los usuarios y las preguntas que hicieron, identificó fallas e intentó solucionarlas sobre la marcha.

Con GPT-4, la mayoría de las medidas de seguridad ya están integradas en el sistema a nivel de modelo. Para entender la diferencia, es como construir una casa con materiales resistentes desde el principio en lugar de usar cualquier cosa que funcione y luego tratar de reparar las cosas a medida que surgen las fallas. De acuerdo a Informe técnico GPT-4 de OpenAI [PDF], GPT-4 produce respuestas tóxicas solo el 0,73 % del tiempo en comparación con el 6,48 % de respuestas tóxicas de GPT-3.5.

4. GPT-4 contra GPT-3.5: Factibilidad de la Respuesta

Uno de los defectos de GPT-3.5 es su tendencia a producir información sin sentido y falsa con confianza. En la jerga de la IA, esto se denomina "alucinación de la IA" y puede generar desconfianza en la información generada por la IA.

​​​​​​

En GPT-4, la alucinación sigue siendo un problema. Sin embargo, según el informe técnico de GPT-4, el nuevo modelo tiene entre un 19 % y un 29 % menos de probabilidades de alucinar en comparación con el modelo GPT-3.5. Pero no se trata sólo del informe técnico. Las respuestas del modelo GPT-4 en ChatGPT son notablemente más objetivas.

5. GPT-4 contra GPT-3.5: Ventana de contexto

Una diferencia menos comentada entre GPT-4 y GPT-3.5 es la ventana de contexto y el tamaño del contexto. Una ventana de contexto es la cantidad de datos que un modelo puede retener en su "memoria" durante una sesión de chat y durante cuánto tiempo. GPT-4 tiene una ventana y un tamaño de contexto significativamente mejores que su modelo predecesor.

En términos prácticos, esto significa que GPT-4 puede recordar mejor el contexto de una conversación durante más tiempo, así como las instrucciones dadas durante la conversación.

Un problema con GPT-3.5 es la propensión del modelo a salirse del tema o no seguir las instrucciones a medida que avanza en el curso de una conversación. Podría, por ejemplo, decirle a la modelo que se dirija a usted por su nombre, y lo haría por un tiempo, pero luego dejaría de seguir las instrucciones en el camino. Aunque este problema todavía existe con el modelo GPT-4, es un problema menor debido a una mejor ventana de contexto.

Otro problema es la limitación en el volumen de texto que puede usar en un aviso a la vez. Resumir texto largo usando GPT-3 generalmente significa dividir el texto en varios fragmentos y resumirlos poco a poco. La mejora en la longitud del contexto en el modelo GPT-4 significa que puede pegar archivos PDF completos de una sola vez y hacer que el modelo se resuma sin dividirlo en partes.

GPT-4: un paso adelante de GPT-3.5

Sin lugar a dudas, GPT-4 es un paso significativo respecto a sus modelos predecesores. Si bien todavía está plagado de algunas de las limitaciones de GPT-3.5, mejoras significativas en varias áreas y la La adición de nuevas capacidades hace que el modelo sea un nuevo y emocionante paso en la búsqueda de un lenguaje de IA verdaderamente inteligente. modelos