¿Quiere proporcionar a ChatGPT sus datos personalizados? ¡Aquí hay un paso a paso sobre cómo hacer exactamente eso!

Al proporcionar tecnología GPT en un chatbot potente y fácil de usar, ChatGPT se ha convertido en la herramienta de IA más popular del mundo. Muchas personas usan ChatGPT para brindar conversaciones interesantes, responder consultas, ofrecer sugerencias creativas y ayudar en la codificación y escritura. Sin embargo, ChatGPT está limitado ya que no puede almacenar sus datos para uso personal a largo plazo y su punto de corte de datos de conocimiento de septiembre de 2021.

Como solución alternativa, podemos usar la API de OpenAI y LangChain para proporcionar a ChatGPT datos personalizados e información actualizada después de 2021 para crear una instancia personalizada de ChatGPT.

¿Por qué proporcionar ChatGPT con datos personalizados?

Alimentar ChatGPT con datos personalizados y proporcionar información actualizada más allá de su fecha límite de conocimiento brinda varios beneficios en comparación con el uso habitual de ChatGPT. Éstos son algunos de ellos:

instagram viewer
  • Interacciones personalizadas: Al proporcionar a ChatGPT datos personalizados, los usuarios pueden crear una experiencia más personalizada. El modelo se puede entrenar en conjuntos de datos específicos relevantes para usuarios u organizaciones individuales, lo que da como resultado respuestas adaptadas a sus necesidades y preferencias únicas.
  • Experiencia en dominios específicos: La integración de datos personalizados permite que ChatGPT se especialice en dominios o industrias particulares. Puede capacitarse en conocimientos, terminología y tendencias específicos de la industria, lo que permite respuestas más precisas y perspicaces dentro de esas áreas específicas.
  • Información actual y precisa: El acceso a información actualizada garantiza que ChatGPT se mantenga actualizado con los últimos desarrollos y conocimientos. Puede proporcionar respuestas precisas basadas en eventos, noticias o investigaciones recientes, lo que la convierte en una fuente de información más confiable.

Ahora que comprende la importancia de proporcionar datos personalizados a ChatGPT, aquí hay un paso a paso sobre cómo hacerlo en su computadora local.

Paso 1: instale y descargue el software y el script prefabricado

Tenga en cuenta que las siguientes instrucciones son para una máquina con Windows 10 o Windows 11.

Para proporcionar datos personalizados a ChatGPT, deberá instalar y descargar la última versión de Python3, Git, Microsoft C++ y el script de recuperación de ChatGPT de GitHub. Si ya tiene algunos de los programas instalados en su PC, asegúrese de que estén actualizados con la última versión para evitar contratiempos durante el proceso.

Comience instalando:

  • Descargar:Python3 (Gratis)
  • Descargar:Git (Gratis)
  • Descargar:Herramientas de compilación visual de Microsoft (Gratis)

Notas de instalación de Python3 y Microsoft C++

Al instalar Python3, asegúrese de marcar la casilla Agregue python.exe a la RUTA opción antes de hacer clic Instalar ahora. Esto es importante ya que le permite acceder a Python en cualquier directorio de su computadora.

Al instalar Microsoft C++, querrá instalar Herramientas de compilación de Microsoft Visual Studio primero. Una vez instalado, puede marcar la casilla Desarrollo de escritorio con C++ opción y haga clic Instalar con todas las herramientas opcionales marcadas automáticamente en la barra lateral derecha.

Ahora que ha instalado las últimas versiones de Python3, Git y Microsoft C++, puede descargar el script de Python para consultar fácilmente datos locales personalizados.

Descargar: Script de recuperación de ChatGPT (Gratis)

Para descargar el script, haga clic en Código, luego seleccione Descargar ZIP. Esto debería descargar el script de Python en su directorio predeterminado o seleccionado.

Una vez descargado, ya podemos configurar un entorno local.

Paso 2: configurar el entorno local

Para configurar el entorno, deberá abrir una terminal en la carpeta chatgpt-retrieval-main que descargó. Para ello, abre chatgpt-recuperación-principal carpeta, haga clic con el botón derecho y seleccione Abrir en Terminal.

Una vez que la terminal esté abierta, copia y pega este comando:

pip instalar langchain openai chromadb tiktoken no estructurado

Este comando usa el administrador de paquetes de Python para crear y administrar el entorno virtual de Python necesario.

Después de crear el entorno virtual, debemos proporcionar una clave API de OpenAI para acceder a sus servicios. Primero necesitaremos generar una clave API desde el Sitio de claves API de OpenAI haciendo clic en Crear nueva clave secreta, agregando un nombre para la clave, luego presionando el botón Crear botón de clave secreta.

Se le proporcionará una cadena de caracteres. Esta es su clave API de OpenAI. Cópielo haciendo clic en el icono de copia al costado de la clave API. Tenga en cuenta que esta clave API debe mantenerse en secreto. No lo comparta con otros a menos que realmente tenga la intención de que lo usen con usted.

Una vez copiado, regrese a la carpeta chatgpt-retrieval-main y abra constantes con Bloc. Ahora reemplace el marcador de posición con su clave API. ¡Recuerda guardar el archivo!

Ahora que configuró con éxito su entorno virtual y agregó su clave API de OpenAI como una variable de entorno. Ahora puede proporcionar sus datos personalizados a ChatGPT.

Paso 3: agregar datos personalizados

Para agregar datos personalizados, coloque todos sus datos de texto personalizados en el datos carpeta dentro de chatgpt-retrieval-main. El formato de los datos de texto puede ser PDF, TXT o DOC.

Como puede ver en la captura de pantalla anterior, agregué un archivo de texto que contiene un horario personal inventado, un artículo que escribí en Aceleradores Instinct de AMDy un documento PDF.

Paso 4: consultar ChatGPT a través de la terminal

El script de Python nos permite consultar datos de los datos personalizados que hemos agregado a la carpeta de datos e Internet. En otras palabras, tendrá acceso al backend habitual de ChatGPT y a todos los datos almacenados localmente en la carpeta de datos.

Para usar el script, ejecute python chatgpt.py script y luego agregue su pregunta o consulta como argumento.

pitón chatgpt.py "TU PREGUNTA"

Asegúrese de poner sus preguntas entre comillas.

Para probar si hemos alimentado con éxito a ChatGPT con nuestros datos, haré una pregunta personal con respecto a la Horario personal.txt archivo.

¡Funcionó! Esto significa que ChatGPT pudo leer el Personal Sched.txt proporcionado anteriormente. Ahora veamos si hemos alimentado con éxito a ChatGPT con información que no conoce debido a su fecha límite de conocimiento.

Como puede ver, describió correctamente el AMD Instinct MI250x, que se lanzó después de la fecha límite de conocimiento de ChatGPT -3.

Limitaciones de ChatGPT personalizado

Aunque alimentar GPT-3.5 con datos personalizados abre más formas de aplicar y usar el LLM, existen algunos inconvenientes y limitaciones.

En primer lugar, debe proporcionar todos los datos usted mismo. Todavía puede acceder a todo el conocimiento de GPT-3.5 hasta su fecha límite de conocimiento; sin embargo, debe proporcionar todos los datos adicionales. Esto significa que si desea que su modelo local conozca un determinado tema en Internet que GPT-3.5 aún no conoce, tendrá que ir a Internet y raspar los datos usted mismo y guardarlos como texto en la carpeta de datos de chatgpt-retrieval-main.

Otro problema es que consultar ChatGPT de esta manera lleva más tiempo para cargar en comparación con preguntar ChatGPT directamente.

Por último, el único modelo disponible actualmente es GPT-3.5 Turbo. Entonces, incluso si tiene acceso a GPT-4, no podrá usarlo para potenciar su instancia personalizada de ChatGPT.

ChatGPT personalizado es impresionante pero limitado

Proporcionar datos personalizados a ChatGPT es una forma poderosa de sacar más provecho del modelo. A través de este método, puede alimentar el modelo con cualquier dato de texto que desee y solicitarlo como ChatGPT normal, aunque con algunas limitaciones. Sin embargo, esto cambiará en el futuro a medida que sea más fácil integrar nuestros datos con el LLM, junto con el acceso al último modelo GPT-4.