Tecnología

IA de OpenAI alcanza nivel humano en prueba de ‘inteligencia general’: ¿qué implica este avance?

Un nuevo modelo de inteligencia artificial (IA) ha alcanzado un hito notable al obtener resultados de nivel humano en

IA de OpenAI alcanza nivel humano en prueba de ‘inteligencia general’: ¿qué implica este avance?


Un nuevo modelo de inteligencia artificial (IA) ha alcanzado un hito notable al obtener resultados de nivel humano en una prueba destinada a evaluar la “inteligencia general”. El 20 de diciembre, el sistema O3 de OpenAI logró un puntaje del 85% en la prueba ARC-AGI, superando ampliamente el récord anterior para una IA, que era del 55%, y equiparándose con el promedio de puntuación humana.

Adicionalmente, el modelo se destacó en una prueba compleja de matemáticas. El desarrollo de la inteligencia artificial general (IAG) es el objetivo primordial de los principales laboratorios de investigación en este campo. A primera vista, parece que OpenAI ha dado un paso significativo hacia la consecución de esta meta.

Aunque el escepticismo persiste, muchos investigadores y desarrolladores de IA tienen la sensación de que algo acaba de cambiar. Para muchos, la perspectiva de la IAG ahora parece más real, urgente y cercana de lo que se esperaba. ¿Tienen razón?

¿Qué significa que una IA alcance un nivel humano?

Para entender qué significa el resultado de o3, es necesario comprender de qué se trata la prueba ARC-AGI. En términos técnicos, es una prueba de la “eficiencia de muestra” de un sistema de IA para adaptarse a algo nuevo: cuántos ejemplos de una situación nueva necesita ver el sistema para descubrir cómo funciona.

Un sistema de IA como ChatGPT (GPT-4) no es muy eficiente en cuanto a la selección de muestras. Fue “entrenado” con millones de ejemplos de textos humanos y construyó “reglas” probabilísticas sobre qué combinaciones de palabras son más probables.

LEE TAMBIÉN: ChatGPT lanza servicio de asistencia por teléfono y WhatsApp para resolver tus dudas

Aunque el rendimiento en tareas comunes es bastante satisfactorio, su desempeño en situaciones menos frecuentes es deficiente debido a la escasez de datos relacionados (menos muestras) para dichas tareas. 

Mientras los sistemas de inteligencia artificial no logren aprender a partir de un número reducido de ejemplos y adaptarse de manera más eficiente, su uso se verá restringido a tareas repetitivas donde se pueda tolerar un fallo ocasional.

La capacidad de resolver con precisión problemas previamente desconocidos o nuevos a partir de muestras limitadas de datos, se conoce como capacidad de generalización, y se considera un elemento necesario, incluso fundamental, de la inteligencia.

Cuadrículas y patrones

El benchmark ARC-AGI prueba la adaptación eficiente de la muestra utilizando pequeños problemas de cuadrícula como el que se muestra a continuación. La IA debe descubrir el patrón que convierte la cuadrícula de la izquierda en la cuadrícula de la derecha.

Cada pregunta ofrece tres ejemplos de los que aprender. El sistema de IA debe determinar las reglas que se “generalizan” a partir de los tres ejemplos para el cuarto. Son muy similares a las pruebas de coeficiente intelectual que quizás recuerdes de la escuela.

IA

Normas débiles y adaptación

No se sabe exactamente cómo OpenAI logró este avance, pero los resultados indican que el modelo O3 es notablemente adaptable. A partir de unos pocos ejemplos, es capaz de identificar reglas generales que se pueden aplicar a diversas situaciones. Este enfoque sugiere una capacidad para abstraer conceptos fundamentales con eficacia.

La clave está en encontrar las llamadas “reglas más débiles”, aquellas que se describen con enunciados simples y son lo suficientemente flexibles para adaptarse a nuevas situaciones. Por ejemplo, una regla en inglés podría ser: “Cualquier forma con una línea saliente se moverá al final de esa línea y cubrirá cualquier otra forma con la que se superponga”. Este enfoque maximiza la adaptabilidad.

Aunque no es claro si OpenAI optimizó intencionalmente el modelo O3 para descubrir estas reglas, el éxito en la prueba ARC-AGI parece depender de ello. OpenAI comenzó con una versión de propósito general del modelo, diseñado para dedicar más tiempo a problemas complejos, y lo entrenó específicamente para este desafío.

El creador de la prueba ARC-AGI, François Chollet, sugiere que O3 explora “cadenas de pensamiento” que describen pasos para resolver tareas, eligiendo la mejor según una heurística. Este proceso se asemeja al de AlphaGo, el sistema de Google que utilizaba una IA para evaluar secuencias de movimientos en el juego de Go, seleccionando las más prometedoras según una regla flexible.

Lo que aún no sabemos

La pregunta clave es si esto realmente representa un paso hacia la inteligencia artificial general. Si el modelo O3 funciona de esta manera, su diseño subyacente podría no ser significativamente mejor que el de versiones anteriores. Es posible que simplemente estemos viendo una heurística más generalizable, desarrollada durante su entrenamiento adicional para esta prueba específica. Como siempre, el tiempo lo dirá.

Por ahora, casi todo sobre O3 sigue siendo un misterio. OpenAI ha revelado solo detalles limitados en algunas presentaciones públicas, restringiendo el acceso inicial a investigadores selectos, laboratorios e instituciones de seguridad de IA. Comprender su verdadero potencial requerirá evaluaciones profundas para medir sus capacidades, tasas de éxito y limitaciones.

Si O3 resulta ser tan adaptable como un humano promedio, podría desencadenar una revolución económica al marcar el inicio de una era de inteligencia acelerada y automejorada. De no ser así, aunque los avances serían impresionantes, la vida cotidiana probablemente permanecerá igual, mientras continuamos explorando los límites de la inteligencia artificial.

LEE TAMBIÉN: Mark Zuckerberg predice que las gafas inteligentes dominarán en 2030: “los celulares dejarán de existir”



Source link

About Author

admin

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *