Descubra el poder de la API de OpenAI y todas las posibilidades que ofrece.

El poder generativo de ChatGPT ha causado frenesí en el mundo de la tecnología desde su lanzamiento. Para compartir la intuición de la IA, OpenAI lanzó las API ChatGPT y Whisper el 1 de marzo de 2023 para que los desarrolladores exploren y consuman en la aplicación.

Las API de OpenAI cuentan con muchos puntos finales valiosos que facilitan la integración de la IA. Exploremos el poder de las API de OpenAI para ver cómo pueden beneficiarlo.

¿Qué puede hacer la API de OpenAI?

El API de IA abierta incluye un montón de utilidades para programadores. Si tiene la intención de ofrecer inteligencia artificial en la aplicación todos los días, OpenAI le facilitará la vida con las siguientes habilidades.

Charlar

El punto final de finalización del chat de la API de OpenAI ayuda al usuario final a iniciar una sesión interactiva natural y amigable con un asistente virtual que utiliza el modelo GPT-3.5-turbo.

Entre bastidores, la llamada a la API utiliza una matriz de mensajes de roles y contenido. Del lado del usuario, el contenido es un conjunto de instrucciones para el asistente virtual, que involucra al usuario, mientras que para el modelo, el contenido es su respuesta.

instagram viewer

El rol de nivel superior es el sistema, donde define la función general del asistente virtual. Por ejemplo, cuando el programador le dice al sistema algo como "usted es un asistente virtual útil", espera que responda a varias preguntas dentro de su capacidad de aprendizaje.

Después de decirle que es "un asistente virtual útil", así es como fue uno de nuestros chats de línea de comandos con el modelo GPT-3.5-turbo:

Incluso puede mejorar el rendimiento del modelo proporcionando parámetros como temperatura, penalización por presencia, penalización por frecuencia y más. Si alguna vez usó ChatGPT, ya sabe cómo funciona el modelo de finalización de chat de OpenAI.

Finalización de texto

La API de finalización de texto proporciona funcionalidades de conversación, inserción de texto y finalización de texto basadas en modelos GPT-3.5 avanzados.

El modelo campeón en el punto final de finalización de texto es text-davinci-003, que es considerablemente más intuitivo que los modelos de lenguaje natural GPT-3. El punto final acepta un aviso del usuario, lo que permite que el modelo responda de forma natural y complete oraciones simples o complejas utilizando texto fácil de entender.

Aunque el punto final de finalización de texto no es tan intuitivo como el punto final de chat, mejora a medida que aumenta los tokens de texto proporcionados al modelo text-davinci-003.

Por ejemplo, obtuvimos algunas terminaciones a medias cuando colocamos el modelo en un max_tokens de siete:

Sin embargo, aumentar max_tokens a 70 generó pensamientos más coherentes:

Dictado a texto

Puede transcribir y traducir voz de audio utilizando los puntos finales de transcripción y traducción de OpenAI. Los puntos finales de voz a texto se basan en el modelo Whisper v2-large, desarrollado a través de una supervisión débil a gran escala.

Sin embargo, OpenAI dice que no hay diferencia entre su modelo Whisper y el de código abierto. Por lo tanto, ofrece infinitas oportunidades para integrar una IA de transcriptor y traductor multilingüe en su aplicación a escala.

El uso del punto final es simple. Todo lo que tiene que hacer es proporcionarle al modelo un archivo de audio y llamar al abierto Audio.traducir o abierto Audio.transcribe endpoint para traducirlo o transcribirlo respectivamente. Estos terminales aceptan un tamaño de archivo máximo de 25 MB y admiten la mayoría de los tipos de archivos de audio, incluidos mp3, mp4, MPEG, MPGA, m4a, wav y webm.

Comparación de texto

El punto final de comparación de texto de la API de OpenAI mide la relación entre los textos mediante el modelo text-embedding-ada-002, un modelo de incrustación de segunda generación. La API de incrustación utiliza este modelo para evaluar la relación entre textos en función de la distancia entre dos puntos vectoriales. Cuanto más amplia es la diferencia, menos relacionados están los textos comparados.

El punto final de incrustación presenta agrupación de texto, diferencias, relevancia, recomendaciones, opiniones y clasificación. Además, cobra por volumen de token.

Aunque la documentación de OpenAI dice que puede usar los otros modelos integrados de primera generación, el primero es mejor con un precio más económico. Sin embargo, OpenAI advierte que el modelo integrado podría mostrar un sesgo social hacia ciertas personas, como se demostró en las pruebas.

Finalización de código

El punto final de finalización de código se basa en OpenAI Codex, un conjunto de modelos entrenados con lenguaje natural y miles de millones de líneas de código de repositorios públicos.

El punto final está en versión beta limitada y es gratuito al momento de escribir, y ofrece soporte para muchos lenguajes de programación modernos, incluidos JavaScript, Python, Go, PHP, Ruby, Shell, TypeScript, Swift, Perl y SQL.

Con el modelo code-davinci-002 o code-cushman-001, el punto final de finalización de código puede insertar automáticamente líneas de código o activar bloques de código desde el aviso del usuario. Mientras que el último modelo es más rápido, el primero es el centro neurálgico del punto final, ya que presenta inserciones de código para el autocompletado de código.

Por ejemplo, puede generar un bloque de código enviando un aviso al extremo en el comentario del idioma de destino.

Aquí hay algunas respuestas que obtuvimos cuando intentamos generar algunos bloques de código en Python y JavaScript a través de la terminal:

Generación de imágenes

Esta es una de las funciones más intuitivas de la API de OpenAI. Basado en el modelo de imagen DALL.E, la funcionalidad de imagen de la API de OpenAI presenta puntos finales para generar, editar y crear variaciones de imagen a partir de indicaciones en lenguaje natural.

Aunque todavía no tiene funciones avanzadas como la mejora de escala, ya que todavía está en versión beta, sus resultados sin escalar son más impresionantes que los de generación modelos de arte como Midjourney y difusión estable.

Al llegar al punto final de generación de imágenes, solo necesita proporcionar un mensaje, el tamaño de la imagen y el recuento de imágenes. Pero el punto final de edición de imágenes requiere que incluya la imagen que desea editar y una máscara RGBA que marque el punto de edición además de los otros parámetros.

El punto final de variación, por otro lado, solo requiere la imagen de destino, el recuento de variación y el tamaño de salida. En el momento de escribir este artículo, los extremos de imagen beta de OpenAI solo pueden aceptar marcos cuadrados en el rango de 256x256, 512x512 y 1024x1024 píxeles.

Creamos una aplicación simple de generación de imágenes utilizando este punto final y, aunque se perdieron algunos detalles, dio un resultado increíble:

Cómo usar la API de OpenAI

El uso de la API de OpenAI es simple y sigue el patrón de consumo de la API convencional.

  1. Instala el abierto paquete usando pip: pip instalar openai.Si usa Node en su lugar, puede hacerlo usando npm: npm instalar openai.
  2. Obtenga sus claves API: Inicie sesión en su panel de OpenAI y haga clic en el icono de su perfil en la parte superior derecha. Ir a Ver claves API y haga clic Crear nueva clave secreta para generar su clave secreta API.
  3. Realice llamadas API a los puntos finales de su modelo elegido a través de un lenguaje del lado del servidor como Python o JavaScript (Nodo). Alimente estos a sus API personalizadas y pruebe sus puntos finales.
  4. Entonces obtener API personalizadas a través de JavaScript frameworks como React, Vue o Angular.
  5. Presente los datos (solicitudes de los usuarios y respuestas del modelo) en una interfaz de usuario visualmente atractiva y su aplicación estará lista para su uso en el mundo real.

¿Qué puedes crear con la API de OpenAI?

Las API de OpenAI crean puntos de entrada para el uso real del aprendizaje automático y el aprendizaje por refuerzo. Si bien abundan las oportunidades para la creatividad, estas son algunas de las que puede crear con las API de OpenAI:

  1. Integre un bot de chat asistente virtual intuitivo en su sitio web o aplicación utilizando el punto final de finalización de chat.
  2. Cree una aplicación de edición y manipulación de imágenes que pueda insertar de forma natural un objeto en una imagen en cualquier punto específico utilizando los puntos finales de generación de imágenes.
  3. Cree un modelo de aprendizaje automático personalizado desde cero utilizando el punto final de ajuste fino del modelo de OpenAI.
  4. Corrija subtítulos y traducciones para videos, audio y conversaciones en vivo usando el punto final del modelo de voz a texto.
  5. Identifique los sentimientos negativos en su aplicación mediante el punto final del modelo de incrustación de OpenAI.
  6. Cree complementos de finalización de código específicos del lenguaje de programación para editores de código y entornos de desarrollo integrados (IDE).

Cree infinitamente con las API de OpenAI

Nuestra comunicación diaria a menudo implica el intercambio de contenido escrito. La API de OpenAI solo amplía sus tendencias creativas y su potencial, con casos de uso de lenguaje natural aparentemente ilimitados.

Todavía es pronto para la API de OpenAI. Pero espere que evolucione con más funciones a medida que pase el tiempo.