Tecnología

el asistente de IA que navega, compra y hace reservas por ti

OpenAI, la empresa líder en inteligencia artificial, ha dado un paso revolucionario en la automatización de tareas cotidianas con

el asistente de IA que navega, compra y hace reservas por ti


OpenAI, la empresa líder en inteligencia artificial, ha dado un paso revolucionario en la automatización de tareas cotidianas con el lanzamiento de Operator, un sofisticado agente de AI capaz de realizar múltiples actividades en internet como si fuera un asistente humano. El anuncio marca un hito en la evolución de los asistentes virtuales.

Esta nueva herramienta, que inicialmente estará disponible para un grupo selecto de usuarios estadounidenses suscritos al plan ChatGPT Pro por $200 mensuales, puede navegar por internet de manera autónoma para realizar tareas como reservar vuelos, hacer pedidos de comestibles y completar compras en línea, todo ello mediante la simulación del comportamiento humano en la navegación web.

Operator está basado en un modelo de “agente de uso informático” que fusiona las capacidades de visión del modelo 4.0 con un sistema de “razonamiento avanzado mediante aprendizaje por refuerzo”. Esto le permite interactuar con Interfaces Gráficas de Usuario (GUI), comprender y manipular elementos visuales mediante capturas de pantalla, tomar decisiones de forma independiente y realizar acciones como un usuario con ratón y teclado en un navegador.

Consciencia y control para una interacción segura

Operator contará con una capacidad de autocorrección, lo que le permitirá ceder el control al usuario en situaciones donde se presente algún obstáculo. Adicionalmente, también transferirá el control al usuario en casos específicos, como cuando un sitio web requiera la introducción de datos personales o credenciales de inicio de sesión.

Es importante destacar que el agente no siempre operará de manera autónoma; por ejemplo, deberá solicitar permiso antes de enviar correos electrónicos, entre otras acciones. OpenAI ha comunicado que está colaborando con diversas empresas, incluidas DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack y Uber, para que su agente Operator pueda atender necesidades del mundo real.

LEA TAMBIÉN: El 41% de empresas planea reemplazar a trabajadores por inteligencia artificial para 2030

No obstante, la compañía también ha reconocido que el agente enfrenta dificultades al interactuar con interfaces más complejas, como en la creación de presentaciones o en aplicaciones de calendario. El objetivo a largo plazo de Operator es incorporarse a otros planes como Plus, Team y Enterprise, ya que actualmente solo está disponible para los suscriptores de ChatGPT Pro.

Además, OpenAI manifiesta su intención de integrar Operator directamente en ChatGPT en el futuro. Mientras se expande hacia nuevos planes y países, OpenAI continúa mejorando su chatbot mediante la introducción de los Proyectos, una nueva herramienta que permitirá organizar las conversaciones de manera más eficiente.

¿Cuánto cuesta Operator?

Operator estará disponible a través de la suscripción ChatGPT Pro, que tiene un precio de 200 dólares al mes. Esto significa que no se puede contratar como un servicio independiente; los usuarios deberán pagar esta tarifa para acceder a la versión preliminar de Operator.

Por el momento, Operator solo está accesible en Estados Unidos, y OpenAI ha indicado que su lanzamiento en América Latina podría llevar un tiempo. Así, para los usuarios de esta región, Operator permanece como un producto en desarrollo, con la posibilidad de que esté disponible para una audiencia más amplia en unos meses o incluso años.

OpenAI presenta su propio agente de IA: así es Operator, la inteligencia artificial que hará las tareas por ti

¿Cómo funciona?

Operator se basa en un modelo exclusivo de inteligencia artificial denominado Computer-Using Agent (CUA), que tiene su fundamento en GPT-40. Este modelo está diseñado para “ver” lo que ocurre en el navegador mediante la realización de capturas de pantalla, lo que le permite utilizar controles habituales como el cursor o el ratón para navegar y ejecutar acciones en la página web visitada.

El modelo CUA es capaz de analizar y entender cada píxel de las capturas que realiza en una página web, permitiéndole identificar objetos en pantalla, así como texto e imágenes. Tras analizar el contenido de la web, realiza un proceso de “razonamiento” interno y sigue una línea de “pensamiento” para llevar a cabo acciones específicas. Además, se adapta en función de acciones previas, lo que mejora su capacidad para ejecutar tareas de manera efectiva.

Para llevar a cabo las tareas, Operator utiliza un navegador interno, lo que significa que los usuarios no necesitan instalar ningún software adicional. Este navegador opera de forma remota desde los servidores de OpenAI, lo que implica que tanto los datos ingresados, las solicitudes realizadas, como las capturas de pantalla de las páginas web son almacenadas en los servidores de la empresa.

LEE TAMBIÉN: Conoce las 10 grandes empresas que quebraron o pasaron al olvido por dejar de ser innovadoras



Source link

About Author

admin

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *