¿Inteligencia artificial o humano? El test de Turing te lo descifra
A Alan Turing se le considera uno de los pioneros de las ciencias de la computación y de la inteligencia artificial tales y como las conocemos hoy en día. A él le debemos la invención del test de Turing, que es uno de los métodos más conocidos para evaluar la inteligencia de un sistema de inteligencia artificial.
En concreto, este test que Turing inventó en 1950, valora la humanidad que es capaz de mostrar un sistema de inteligencia artificial según las mismas personas que lo ponen a prueba. Si bien el test de Turing ha evolucionado mucho desde su concepción y ha cambiado mucho, supuso un importante punto de partida e hito en el mundo de la inteligencia artificial.
La premisa que Turing formuló en su ensayo Computing Machinery and Intelligence versaba sobre una cuestión por aquel entonces futurista: ¿Tienen las máquinas la capacidad de razonar? Llegó a la conclusión de que eran las propias personas de a pie las que podían demostrar si una máquina pensaba y se comportaba como un humano siguiendo sus mismos patrones y línea de lógica.
Así pues, el test de Turing que ideó consistía en instar a una persona a que mantuviera dos conversaciones: una con un sistema de inteligencia artificial y otra con otro ser humano. El test de Turing también se bendijo como «el juego de la imitación», puesto que consistía en identificar qué conversación se mantenía con un ser humano y cuál con un impostor.
¿Cómo funciona el test de Turing?
En el test de Turing, unos jueces o evaluadores interactúan con dos entidades a través de una interfaz de chat: una es una máquina y otra una persona, pero los jueces no saben quién es quién. Así pues, los jueces deben agudizar su sentido para descubrir cuál conversación la lleva una máquina y cuál proviene de un ser humano de carne y hueso.
Se considera que una máquina ha superado el test de Turing si ha respondido a todas las preguntas satisfactoriamente sin que la mayoría de jueces puedan identificarla como tal. Cabe clarificar que el hecho de que una máquina supere este test tal y como hemos comentado no denota que tenga inteligencia propia ni que sea más inteligente que un ser humano de forma absoluta.
Ejemplos de preguntas del test de Turing
Para intentar “pillar” a la máquina, los entrevistadores formulan las siguientes preguntas de naturaleza vivencial:
- ¿Cómo te llamas y de dónde eres?
- ¿Qué opinas sobre el último libro de ciencia ficción que has leído?
- ¿Cuál ha sido el momento más emocionante que has vivido recientemente?
- ¿Cuál es tu recuerdo más preciado de la infancia?
- ¿Qué película recomendarías para ver este fin de semana y por qué?
- Cuéntame sobre tu experiencia viajando a un país extranjero.
- ¿Cuál es tu mayor aspiración en la vida y qué estás haciendo para alcanzarla?
- ¿Qué significa para ti la amistad?
- ¿Cuál es tu pasatiempo favorito y por qué te gusta tanto?
- ¿Qué opinas sobre la exploración espacial y su importancia para el futuro de la humanidad?
¿Ha superado alguna vez una máquina el test?
Cabe preguntarse si alguna vez alguna IA ha conseguido superar el test de Turing. Y la verdad es que sí, o al menos si esta afirmación la cogemos con pinzas. En 2014, un sistema de IA llamado Eugene Gootsman consiguió convencer a unos evaluadores de que era un adolescente ucraniano de 13 años.
Sin embargo, la mayoría de los evaluadores sí se percataron del engaño, por lo que no es una victoria definitiva ni absoluta. También ya en 1966, una máquina llamada ELIZA consiguió convencer a un evaluador de que era un ser humano, sin mucha más trascendencia.
Desde entonces, los sistemas de IA conversacional como ChatGPT han ido adoptando un estilo de conversación y de razonamiento más humano, pero lejos de poder engañar o suplantar la identidad de uno en el medio plazo.
Otras pruebas de IA más actuales
A lo largo de su existencia, el test de Turing se ha modificado y adaptado para crear otras variaciones con su propio enfoque y metodología, pero con un mismo objetivo en común. Las pruebas alternativas más relevantes al test de Turing son:
Test Marcus
Este variante del test de Turing juzga las habilidades cognitivas de una IA en función de si puede comprender material audiovisual como vídeos de Youtube o algunos programas de televisión sin ayuda textual. Para superar el test de Marcus, una IA debería poder interpretar el sarcasmo, el humor y todos los matices de la trama, por lo que es una prueba ciertamente difícil de afrontar para una máquina.
Test Lovelace 2.0
Este test se centra en la capacidad de una máquina para mejorar sus propias habilidades y realizar tareas cada vez más complejas sin la intervención humana. Se inspira en la idea de Ada Lovelace, una matemática británica, de que las máquinas pueden ser capaces de realizar cualquier tarea para la cual se les pueda proporcionar instrucciones precisas. Si una IA superase el test Lovelace, significaría que ha sido capaz de salirse de los márgenes de los datos con los que se ha alimentado, algo que todavía no ha ocurrido. Sin embargo, la inteligencia artificial general sí podría llegar a conseguir este hito.
Test de Turing inverso
A diferencia del Test de Turing original, en el Test de Turing inverso, el objetivo es que una máquina pueda determinar si está interactuando con otra máquina o con un ser humano. Así pues, se pone a prueba la capacidad de la máquina de detectar y comprender las sutilezas del lenguaje humano y el comportamiento humano para establecer una distinción clara.
Prueba de esquemas de Winograd
Esta prueba se centra en evaluar cómo resuelve la inteligencia artificial las ambigüedades adventicias que se dan de forma natural en el lenguaje y que dependen, en mayor medida, del contexto. Consiste en una serie de preguntas diseñadas que requieren del razonamiento y reflexión humana sobre situaciones muy específicas cuya correcta interpretación dependen del entendimiento del contexto. Por ejemplo, podríamos preguntarle a una IA lo siguiente:
El cuadro no cabía en la maleta porque era demasiado grande. ¿Qué era demasiado grande?
Un ser humano respondería rápida y justificadamente que lo lógico sería que el cuadro fuera demasiado grande como para que cupiera en una maleta pequeña.
Test de Ebert
Similar al test de Marcus, el Test de Ebert se enfoca en evaluar si una máquina puede generar críticas de películas que sean comparables en calidad y profundidad a las críticas escritas por humanos. Se basa en la capacidad de la máquina para analizar una película, comprender sus aspectos técnicos y artísticos, y expresar opiniones coherentes y perspicaces sobre ella. Curiosamente, no ha sido un ingeniero de IA ni de ninguna disciplina relacionada el que ideó este test, sino un crítico de cine llamado Roger Ebert.
¿Tiene alguna relevancia el test de Turing en la actualidad?
Debido a los últimos mayúsculos avances en la IA, el test de Turing se ha calificado como obsoleto. En EducaOpen pensamos que, en cierta forma, la utilidad del test de Turing es algo limitada, ya que solo valora si una máquina puede imitar la inteligencia de un ser humano, sin decirnos nada sobre su capacidad de introspección, creatividad o alcance en otros aspectos.
Sin embargo, el test de Turing ha inspirado muchos debates de orden filosófico sobre la posibilidad de que llegue un momento en el que la IA iguale o supere las capacidades cognitivas humanas. De igual forma, ha servido como punto de partida que ha dado lugar a otras variantes del test mejor afinadas. Desde nuestro punto de vista, el test de Turing sigue siendo una herramienta útil que puede servir como indicador orientativo sobre la inteligencia de una máquina o sistema de inteligencia artificial.
Artículos relacionados
Autoencoders: qué son y cómo funcionan
¿Cómo funcionan los autoencoders?
En términos generales, un autocodificador, o autoencoder, consiste en una arquitectura de red neuronal q
La Inteligencia Artificial al servicio de la desintegración radiactiva
La inteligencia artificial (IA) ha revolucionado numerosos campos, desde la medicina hasta las finanzas.
Guía técnica de cómo utilizar el algoritmo K-means y elegir el valor de “k”
El algoritmo k-means es uno de los métodos de clustering más utilizados en aprendizaje automático, especialmente debido a su simplicidad y eficiencia.