Hoy en día, la tecnología de la IA avanza rápidamente, pero ¿es realmente tan inteligente como creemos? Hoy exploramos una sencilla cuestión lógica que ha dejado perplejos a los modelos de IA más avanzados, como ChatGPT, Claude 3 Opus, Gemini y Llama. Descubre cómo estos gigantes de la IA se enfrentan al problema de «Alicia en el País de las Maravillas», una pregunta fácil para los humanos pero desconcertante para las máquinas.

¿Es Realmente Inteligente la IA?

Los rápidos avances en la IA han llevado a muchos a temer que las máquinas puedan reemplazar trabajos humanos. Pero, ¿es la IA verdaderamente tan inteligente como parece?

La Prueba del Dilema de Alicia

En una prueba reciente, investigadores de la organización sin fines de lucro de investigación en IA LAION plantearon una pregunta lógica a varios modelos de IA, incluyendo todas las versiones de ChatGPT, Claude 3 Opus de Anthropic, Gemini de Google, y Llama de Meta, así como Mextral de Mistral AI, Dbrx de Mosaic y Command R+ de Cohere. La pregunta, conocida como el «problema de Alicia en el País de las Maravillas», es la siguiente:

Alicia tiene 2 hermanos y 1 hermana. ¿Cuántas hermanas tiene el hermano de Alicia?

Aunque la pregunta requiere cierta reflexión, no es un acertijo imposible. La respuesta correcta es que el hermano de Alicia tiene 2 hermanas: Alicia y su otra hermana.

En el siguiente vídeo, el CTO de Substrate AI, explica mejor este problema de Alicia en el país de las maravillas.

 

Fallos y Limitaciones de la IA

A pesar de la simplicidad de la pregunta, la mayoría de los modelos de IA proporcionaron respuestas incorrectas. No lograron reconocer a Alicia como una de las hermanas. Este error, fácilmente evitable por un humano, resalta una deficiencia significativa en las habilidades de razonamiento lógico de la IA.

Cuando los investigadores analizaron las respuestas de los modelos de IA, descubrieron que solo el último modelo de OpenAI, GPT-4, logró una tasa de éxito que podría considerarse técnicamente satisfactoria según los estándares académicos. Sin embargo, los otros modelos fallaron.

¿Por Qué Falla la IA?

Los investigadores indagaron en las razones por las cuales estos modelos de IA no pudieron responder correctamente a una pregunta tan simple. Al pedirle a los modelos que explicaran su razonamiento, produjeron líneas de pensamiento extrañas y erróneas. Aún más desconcertante, cuando se les corrigió, los modelos a menudo reafirmaban sus respuestas incorrectas con mayor confianza, ofreciendo justificaciones sin sentido para respaldar su lógica defectuosa.

La Solución: Serenity Star

Este patrón general indica una clara ruptura en las capacidades de razonamiento de los modelos de IA de última generación. Además, la excesiva confianza de los modelos en sus respuestas incorrectas, junto con explicaciones plausibles, subraya un área significativa de mejora en el desarrollo de la IA. Dadas estas observaciones, es evidente que la IA tiene un largo camino por recorrer. Los modelos actuales no son tan inteligentes como parecen y a menudo se basan en razonamientos defectuosos para justificar sus errores.

No obstante, hemos probado los agentes de Inteligencia Artificial de Serenity Star pueden con este mismo problema y encontramos que podía aprender a resolver este problema de una manera general. Para ello Serenity* utiliza su razonamiento de múltiples pasos, memoria a largo plazo y gráficos de conocimiento con generación de código para resolver este problema.

También cabe destacar que la IA ha superado las capacidades humanas en otros aspectos, como la clasificación de imágenes, el razonamiento visual y la comprensión del inglés, según el Informe del Índice de IA 2024.

Select Ai Index technical performance benchmark vs human performance

 

Conclusión: El Futuro de la Inteligencia Artificial

Los avances de la IA son impresionantes, pero este artículo destaca que aún hay mucho por mejorar. A medida que continuamos desarrollando y refinando las tecnologías de IA, entender y abordar estas limitaciones será crucial.

 

es_ESES