Tras el lanzamiento de ChatGPT en noviembre de 2022, el fenomenal chatbot de IA se ha convertido en una de las herramientas de escritura más confiables en Internet. Es fácil de usar; describe lo que necesitas escribir y ChatGPT lo imprime en la pantalla en segundos.
Sin embargo, en una era en la que el texto generado por IA pasa como escrito por humanos y se usa para obtener una ventaja injusta, identificar el contenido de IA es muy importante. Pero ChatGPT no puede detectar con precisión el contenido de IA, ni siquiera su propio trabajo, pero ¿por qué?
¿Hay alguna diferencia entre el texto de IA y la escritura humana?
Una condición previa para que ChatGPT detecte su propia escritura o cualquier texto generado por IA es que tiene que haber una diferencia entre este y el texto escrito por humanos. Entonces, ¿hay alguna diferencia significativa entre el texto escrito por humanos y el contenido generado por IA? Si lo hay, seguramente una herramienta como ChatGPT debería ser capaz de discernirlo.
Escribimos una historia corta sin ningún aporte de ninguna herramienta de IA y luego le preguntamos a ChatGPT si la historia era contenido escrito por IA. ChatGPT lo marcó con confianza como un texto generado por IA.
Luego le pedimos a ChatGPT que generara una historia, y en ese mismo hilo de chat, copiamos y pegamos el texto generado y le preguntamos a ChatGPT si el texto fue creado por IA. ¿La respuesta de ChatGPT? Un confiado "No".
ChatGPT no pudo identificar texto escrito por humanos o generado por IA en ambos casos. Entonces, ¿cómo es que ChatGPT no puede detectar su propio texto? ¿Significa esto que no hay diferencia entre la IA y el texto humano?
Bueno, lo hay. Podríamos escribir un libro entero sobre la diferencia entre los dos, pero no importará mucho. Entonces, si hay una diferencia, ¿por qué ChatGPT o cualquier otra herramienta de IA no puede identificar estas diferencias y señalar con precisión el texto generado por IA de uno escrito por humanos? La respuesta está en cómo funciona ChatGPT y cómo genera texto.
Cómo ChatGPT genera texto
Cuando le pide a ChatGPT que genere texto, intenta imitar el proceso de escritura humana. En primer lugar, el modelo detrás de ChatGPT (Transformador preentrenado generativo (GPT)) se ha entrenado en un gran corpus de texto humano. Todo, desde correos electrónicos, artículos de salud, artículos de tecnología, ensayos de la escuela secundaria y casi cualquier texto que pueda encontrar en línea, ha sido alimentado al modelo durante el entrenamiento. Entonces ChatGPT entiende cómo se debe escribir cada uno de estos tipos de textos.
Si le pide a ChatGPT que le escriba un correo electrónico a su jefe, sabe cómo debe verse un correo electrónico de esa naturaleza porque ha sido entrenado en correos electrónicos similares, probablemente miles de ellos. Del mismo modo, si le pide que escriba un ensayo de secundaria, también sabe cómo debe sonar un ensayo de secundaria. ChatGPT intentará escribir lo que quieras que escriba de la forma en que lo haría un humano.
Pero hay una trampa. A diferencia de cómo escriben los humanos, ChatGPT realmente no entiende lo que está escribiendo de la manera en que lo haría un humano. En cambio, el chatbot intenta predecir cuál sería la siguiente palabra más plausible en una oración hasta que completa la redacción.
Cómo escribe ChatGPT por predicción
Supongamos que le pide a ChatGPT que escriba una historia sobre una ciudad ficticia llamada Volkra. Existe una gran posibilidad de que el chatbot comience la historia con las palabras "Érase una vez". Esto se debe a que el chatbot no piensa por pero trata de predecir lo que un humano escribiría basándose en lo que ha aprendido de las miles de historias que ha recibido durante capacitación.
Entonces, creyendo que un humano probablemente comenzaría la historia con las palabras "Érase una vez", ChatGPT intentaría predecir la siguiente palabra lógica, que sería ser "a" seguido de "tiempo". Entonces tendrías "Érase una vez..." seguido de la siguiente palabra lógica y la siguiente hasta que se complete la historia. ChatGPT básicamente escribe al predecir qué palabra sería naturalmente (o al menos tiene la mayor probabilidad) de aparecer a continuación en una oración e insertarla.
Entonces, cuando una herramienta de IA intenta detectar si un texto es generado por IA, uno de los criterios que intenta sopesar es la previsibilidad del texto, ya que las herramientas de IA escriben por predicción. Esta medida de previsibilidad se denomina perplejidad en la jerga de la IA. Ahora, cuando se le presenta un texto, entre otros criterios, una herramienta de IA como ChatGPT intenta analizar el texto para medir qué tan predecible es la secuencia de palabras u oraciones en el texto. Una mayor previsibilidad o poca perplejidad generalmente significa que es probable que el texto sea generado por IA. Menos previsibilidad o mayor perplejidad generalmente significa que el texto probablemente esté escrito por humanos.
Estos criterios, junto con otros factores como el nivel de creatividad de un texto, lamentablemente no son suficientes para determinar con certeza si un texto está escrito por una herramienta de IA o no. Esto se debe a que los humanos pueden escribir con mayor variación, como en el texto de ejemplo que usamos para la demostración al principio de este artículo.
Los chatbots de IA como ChatGPT están diseñados para imitar el lenguaje humano natural tanto como sea posible. Entonces, si bien el texto de IA puede tener patrones perceptibles, esos patrones no son tan obvios incluso para una herramienta poderosa como ChatGPT. Esta es la razón por la que ChatGPT no puede detectar su propia escritura, así como por qué las herramientas de detección de texto AI no funcionan.
¿ChatGPT reconocerá su propia escritura en el futuro?
Actualmente, herramientas como ChatGPT no pueden detectar si un texto fue escrito por sí mismo o por cualquier otra herramienta de IA porque no hay un patrón claro y perceptible en el contenido generado por IA. Sin embargo, hay una buena posibilidad de que esto pueda cambiar pronto. Con los esfuerzos de compañías como ChatGPT para introducir marcas de agua digitales en el contenido generado por ChatGPT, habrá un patrón más perceptible en el texto generado por el chatbot.