Hace más de 70 años, cuando se conceptualizó la inteligencia artificial, Alan Turing publicó un artículo que describía cómo identificarla. Más tarde se conoció como la prueba de Turing, y se ha utilizado durante décadas para distinguir entre un humano y una IA.

Sin embargo, con la introducción de chatbots de IA avanzados como ChatGPT y Google Bard, cada vez es más difícil saber si estás hablando con una IA. Plantea la pregunta; ¿Está desactualizado el test de Turing? Y si es así, ¿cuáles son las alternativas?

¿Está desactualizado el Test de Turing?

Crédito de la imagen: Jesús Sanz/Shutterstock

Para determinar si la prueba de Turing está desactualizada, primero debe entender cómo funciona. Para que una IA pase la prueba de Turing, debe convencer a un interrogador humano de que es un humano. Pero hay una trampa: la IA se evalúa junto con un humano y debe responder usando texto.

Piensa en esto, de esta manera; Si usted es el interrogador y está haciendo preguntas a dos participantes en línea usando texto, pero uno de ellos es un modelo de IA, ¿los diferenciaría después de cinco minutos? Tenga en cuenta que el objetivo de la prueba de Turing no es identificar el modelo de IA en función de las respuestas correctas, sino evaluar si la IA puede pensar o comportarse como un humano.

instagram viewer

El problema con el enfoque de la prueba de Turing de solo identificar respuestas similares a las humanas es que no considera otros factores. Por ejemplo, la inteligencia del modelo de IA o el conocimiento del interrogador. Además de eso, la prueba de Turing se limita solo a texto, y cada vez es más difícil identificar una IA que genera una voz humana o videos deepfake que imitan el comportamiento humano.

Sin embargo, los modelos de IA actuales como ChatGPT-4 y Google Bard aún no han avanzado hasta el punto en que puedan pasar la prueba de Turing de manera constante. De hecho, si está familiarizado con la IA, puede detectar texto generado por IA.

Las 5 mejores alternativas de prueba de Turing

Es posible que futuros modelos de IA como ChatGPT-5 podría pasar la prueba de Turing. Si eso sucede, necesitaríamos diferentes pruebas combinadas con la prueba de Turing para identificar si estamos hablando con una IA o con un humano. Aquí están las mejores alternativas de prueba de Turing:

1. La prueba de Marcus

Gary Marcus, un reconocido científico cognitivo e investigador de IA, propuso una alternativa a la prueba de Turing que se publicó en el Neoyorquino para identificar la capacidad cognitiva de una IA. La prueba es simple: usted juzga un modelo de IA en función de su capacidad para ver y comprender videos y programas de televisión de YouTube sin subtítulos ni texto. Para que la IA pase la prueba de Marcus, debe comprender el sarcasmo, el humor, la ironía y la trama al mirar los videos y explicarlo como un ser humano.

En este momento, GPT-4 puede describir imágenes, pero hasta ahora, no existe un modelo de IA que pueda comprender videos como un ser humano. vehículos autónomos se acercan, pero no son completamente autónomos y requieren sensores ya que no pueden dar sentido a todo lo que les rodea.

2. La prueba visual de Turing

Según un trabajo de investigación publicado en PNAS, la prueba visual de Turing se puede usar para identificar si está hablando con un ser humano o con una IA mediante cuestionarios de imágenes. Funciona como la prueba de Turing, pero en lugar de responder preguntas usando textos, a los participantes se les muestran imágenes y se espera que respondan preguntas simples mientras piensan como un ser humano. sin embargo, el La prueba visual de Turing es diferente de los CAPTCHA ya que todas las respuestas son correctas, pero para pasar la prueba, la IA debe procesar las imágenes de manera similar a un humano.

Más allá de eso, si a una IA y a un humano se les muestran varias imágenes una al lado de la otra y se les pide que identifiquen imágenes realistas, el humano tendría la capacidad cognitiva para pasar la prueba. Esto se debe a que a los modelos de IA les resulta difícil distinguir imágenes que no parecen tomadas en el mundo real. De hecho, esa es la razón por la que puedes identificar imágenes generadas por IA usando anomalías que no tienen sentido.

3. La prueba de Lovelace 2.0

La teoría de que una computadora no puede crear ideas originales más allá de lo que fue programada para hacer fue conceptualizada por primera vez por Ada Lovelace antes de la prueba de Turing. Sin embargo, Alan Turing se opuso a esa teoría argumentando que la IA aún puede sorprender a los humanos. No fue sino hasta 2001 que se desarrollaron las pautas para la prueba de Lovelace para diferenciar una IA de un ser humano y, según la labibliotecakurzweilli las reglas se revisaron posteriormente en 2014.

Para que una IA pase la prueba de Lovelace, debe demostrar que puede generar ideas originales que superen su entrenamiento. Los modelos actuales de IA como GPT-4 no tienen la capacidad de generar nuevos inventos más allá de nuestro conocimiento actual. Sin embargo, inteligencia general artificial puede lograr esa capacidad y pasar la prueba de Lovelace.

4. Prueba de Turing inversa

¿Qué tal la prueba de Turing, pero hecha a la inversa? En lugar de tratar de averiguar si estás hablando con un ser humano, el objetivo de la prueba de Turing inversa es engañar a la IA para que crea que eres una IA. Sin embargo, también necesita otro modelo de IA para responder las mismas preguntas usando texto.

Por ejemplo, si ChatGPT-4 es el interrogador, puede inscribir a Google Bard y a otro ser humano como participantes. Si el modelo de IA puede identificar correctamente al participante humano en función de las respuestas, ha pasado la prueba.

La desventaja de la prueba de Turing inversa es que no es confiable, especialmente considerando que a veces La IA no puede diferenciar las generadas por la IA y contenido escrito por humanos.

5. Marco de clasificación de IA

De acuerdo con el marco de clasificación de IA desarrollado por chris saad, la prueba de Turing es solo un método de evaluación para saber si estás hablando con una IA. Más sucintamente, el marco de clasificación de la IA se basa en la teoría de las inteligencias múltiples, que requiere que la inteligencia humana satisfaga al menos ocho criterios diferentes, que incluyen: ritmo musical, inteligencia lógico-matemática, identificación visual, inteligencia emocional, inteligencia autorreflexiva, capacidad de pensamiento existencial y capacidad corporal. movimienot.

Dado que la IA se evalúa en ocho parámetros diferentes, es poco probable que pase por un ser humano, incluso si se desempeña mejor que el promedio en ciertos puntos de referencia. Por ejemplo, ChatGPT puede resolver problemas matemáticos, describir imágenes y conversar en un lenguaje natural como un ser humano, pero fallaría en otras categorías definidas en el marco de clasificación de IA.

La prueba de Turing no es concluyente

La prueba de Turing estaba destinada a ser más un experimento mental que una prueba concluyente para diferenciar entre humanos e IA. Cuando se propuso inicialmente, era el punto de referencia fundamental para medir la inteligencia de las máquinas.

Sin embargo, con el desarrollo reciente de modelos de IA con capacidades interactivas de voz, visuales y auditivas, la prueba de Turing se queda corta ya que se limita a conversaciones de texto. La solución más efectiva sería introducir alternativas de prueba de Turing que diferencien aún más los modelos de IA de los humanos.