Los modelos GPT de OpenAI han revolucionado el procesamiento del lenguaje natural (NLP), pero a menos que pague por la prima acceso a los servicios de OpenAI, no podrá ajustar e integrar sus modelos GPT en su aplicaciones Además, OpenAI tendrá acceso a todas sus conversaciones, lo que puede ser un problema de seguridad si usa ChatGPT para negocios y otras áreas más sensibles de su vida. Si no está interesado en esto, puede probar GPT4All.

Entonces, ¿qué es exactamente GPT4All? ¿Cómo funciona y por qué usarlo sobre ChatGPT?

¿Qué es GPT4All?

GPT4All es un ecosistema de código abierto que se utiliza para integrar LLM en aplicaciones sin pagar una suscripción de plataforma o hardware. Fue creado por Nomic AI, una empresa de cartografía de información que tiene como objetivo mejorar el acceso a los recursos de IA.

¡GPT4All está diseñado para ejecutarse en PC modernas o relativamente modernas sin necesidad de una conexión a Internet o incluso una GPU! Esto es posible ya que la mayoría de los modelos provistos por GPT4All han sido cuantificados para ser tan pequeños como unos pocos gigabytes, requiriendo solo de 4 a 16 GB de RAM para funcionar.

instagram viewer

Esto permite que las empresas más pequeñas, las organizaciones y los investigadores independientes usen e integren un LLM para aplicaciones específicas. Y con GPT4All fácilmente instalable a través de un instalador de un solo clic, las personas ahora pueden usar GPT4All y muchos de sus LLM para la creación de contenido, la escritura de código, la comprensión de documentos y la información reunión.

¿Por qué usar GPT4ALL sobre ChatGPT?

Crédito de la imagen: bruce mars /Unsplash

Hay varias razones por las que es posible que desee utilizar GPT4All en ChatGPT.

  • Portabilidad: Los modelos provistos por GPT4All solo requieren de cuatro a ocho gigabytes de almacenamiento de memoria, no requieren una GPU para funcionar y se pueden guardar fácilmente en una unidad flash USB con el instalador de un solo clic de GPT4All. Esto hace que GPT4All y sus modelos sean realmente portátiles y utilizables en casi cualquier computadora moderna.
  • Privacidad y seguridad: Como se explicó anteriormente, a menos que tenga acceso a ChatGPT Plus, OpenAI puede acceder a todas sus conversiones de ChatGPT. GPT4All se centra en la transparencia y privacidad de los datos; sus datos solo se guardarán en su hardware local a menos que los comparta intencionalmente con GPT4All para ayudar a hacer crecer sus modelos.
  • Modo offline: GPT es un modelo patentado que requiere acceso a la API y una conexión constante a Internet para consultar o acceder al modelo. Si pierde una conexión a Internet o tiene un problema con el servidor, no tendrá acceso a ChatGPT. Este no es el caso con GPT4All. Dado que todos los datos ya están almacenados en un paquete de cuatro a ocho gigabytes y la inferencia se realiza localmente, no necesita una conexión a Internet para acceder a ningún modelo en GPT4All. Puede continuar chateando y ajustando su modelo incluso sin conexión a Internet.
  • Gratis y de código abierto: Varios LLM proporcionados por GPT4All tienen licencia GPL-2. Esto permite que cualquier persona ajuste e integre sus propios modelos para uso comercial sin necesidad de pagar la licencia.

Cómo funciona GPT4All

Como se discutió anteriormente, GPT4All es un ecosistema que se utiliza para entrenar e implementar LLM localmente en su computadora, ¡lo cual es una hazaña increíble! Por lo general, cargar un LLM estándar de 25 a 30 GB requeriría 32 GB de RAM y una GPU de nivel empresarial.

Para comparar, los LLM que puede usar con GPT4All solo requieren de 3 GB a 8 GB de almacenamiento y pueden funcionar con 4 GB a 16 GB de RAM. Esto hace posible ejecutar un LLM completo en un dispositivo de borde sin necesidad de una GPU o asistencia de nube externa.

Los requisitos de hardware para ejecutar LLM en GPT4All se han reducido significativamente gracias a la cuantificación de redes neuronales. Al reducir el peso de precisión y las activaciones en una red neuronal, muchos de los modelos proporcionados por GPT4All se pueden ejecutar en la mayoría de las computadoras relativamente modernas.

Los datos de entrenamiento utilizados en algunos de los modelos disponibles se recopilaron a través de "la pila", que son solo datos extraídos del contenido publicado públicamente en Internet. Luego, los datos se envían a la base de datos Atlas AI de Nomic AI, que se puede ver en función de las correlaciones en un mapa vectorial 2D fácil de ver (también conocido como una base de datos de vectores de IA).

Al entrenar Nomic AI el modelo Groovy y usar datos disponibles públicamente, Nomic AI pudo lanzar el modelo en una licencia GPL abierta que permite que cualquiera lo use, incluso para aplicaciones comerciales.

Cómo instalar GPT4All

Instalar GPT4All es simple, y ahora que se ha lanzado la versión 2 de GPT4All, ¡es aún más fácil! La mejor manera de instalar GPT4All 2 es descargar el instalador de un solo clic:

Descargar:GPT4Todos para Windows, macOS o Linux (gratis)

Las siguientes instrucciones son para Windows, pero puede instalar GPT4All en todos los sistemas operativos principales.

Una vez descargado, haga doble clic en el instalador y seleccione Instalar. Windows Defender puede considerar que la instalación es maliciosa porque el proceso para que Microsoft proporcione firmas válidas para aplicaciones de terceros puede llevar mucho tiempo. Sin embargo, esto debería arreglarse pronto. Al momento de escribir, siempre que haya descargado la aplicación GPT4All del sitio web oficial, debe estar seguro. Haga clic en Instalar de todos modos para instalar GPT4All.

Una vez que abra la aplicación, deberá seleccionar un modelo para usar. GPT4ALL le proporciona varios modelos, todos los cuales tendrán sus fortalezas y debilidades. Para saber qué modelo descargar, aquí hay una tabla que muestra sus fortalezas y debilidades.

Modelo

Tamaño

Nota

Parámetros

Tipo

cuantización

Hermes

7,58GB

  • Basado en instrucciones
  • Da respuestas largas
  • Curado con 300,000 instrucciones sin censura
  • No se puede utilizar comercialmente.

13 mil millones

Llama

q4_0

GPT4Todo Halcón

3,78 GB

  • Respuestas rápidas
  • Basado en instrucciones
  • Con licencia para uso comercial

7 billones

Halcón

q4_0

maravilloso

8GB

  • Respuestas rápidas
  • -Respuestas creativas
  • Basado en instrucciones
  • Con licencia para uso comercial

7 billones

GPT-J

q4_0

ChatGPT-3.5 Turbo

Mínimo

  • Requiere API personal
  • Enviará tus chats a OpenAI
  • GPT4All solo se usa para comunicarse con OpenAI

?

GPT

N / A

ChatGPT-4

Mínimo

  • Requiere API personal
  • Enviará tus chats a OpenAI
  • GPT4All solo se usa para comunicarse con OpenAI

?

GPT

N / A

dormitando

7,58GB

  • Basado en instrucciones
  • Más lento que Groovy pero con respuestas de mayor calidad.
  • No se puede utilizar comercialmente.

13 mil millones

Llama

q4_0

Charla MPT

4,52 GB

  • Respuestas rápidas
  • basado en chat
  • No se puede utilizar comercialmente.

7 billones

MPT

q4_0

orca

3,53 GB

  • Basado en instrucciones
  • Explica los conjuntos de datos ajustados
  • Enfoques de construcción de conjuntos de datos de Orca Research Paper
  • Con licencia para uso comercial

7 billones

OpenLLaMA

q4_0

Vicuña

3,92GB

  • Basado en instrucciones
  • No se puede utilizar comercialmente.

7 billones

Llama

q4_2

Mago

3,92GB

  • Basado en instrucciones
  • No se puede utilizar comercialmente.

7 billones

Llama

q4_2

Asistente sin censura

7,58GB

  • Basado en instrucciones
  • No se puede utilizar comercialmente.

13 mil millones

Llama

q4_0

Tenga en cuenta que los modelos provistos tienen diferentes niveles de restricciones. No todos los modelos se pueden usar comercialmente de forma gratuita; algunos necesitarán más recursos de hardware, mientras que otros necesitarán una clave API. Los modelos menos restrictivos disponibles en GPT4All son Groovy, GPT4All Falcon y Orca.

¿Puedes entrenar GPT4Todos los modelos?

Sí, pero no las versiones cuantificadas. Para ajustar de manera efectiva los modelos GPT4All, debe descargar los modelos sin procesar y usar GPU de nivel empresarial como Aceleradores Instinct de AMD o las GPU Ampere o Hopper de NVIDIA. Además, deberá entrenar el modelo a través de un marco de entrenamiento de IA como LangChain, lo que requerirá algunos conocimientos técnicos.

Ajustar un modelo GPT4All requerirá algunos recursos monetarios, así como algunos conocimientos técnicos, pero si solo desea alimentar un modelo GPT4All con datos personalizados, puede seguir entrenando el modelo a través de la generación aumentada de recuperación (que ayuda a un modelo de lenguaje a acceder y comprender información fuera de su entrenamiento base para completar tareas). Puede hacerlo solicitando a GPT4All que modele sus datos personalizados antes de hacer una pregunta. Los datos personalizados deben guardarse localmente y, cuando se le solicite, el modelo debería poder proporcionarle la información que proporcionó una vez.

¿Deberías usar GTP4All?

La idea de GPT4All es proporcionar una plataforma de código abierto y de uso gratuito donde las personas puedan ejecutar grandes modelos de lenguaje en sus computadoras. Actualmente, GPT4All y sus modelos cuantificados son excelentes para experimentar, aprender y probar diferentes LLM en un entorno seguro. Para cargas de trabajo profesionales, aún recomendamos usar ChatGPT ya que el modelo es significativamente más capaz.

En general, no hay ninguna razón por la que deba limitarse a uno. Dado que su caso de uso no se superpone, debe intentar usar ambos.