• LA SEÑAL
  • Posts
  • Llega el primer agente de IA de OpenAI

Llega el primer agente de IA de OpenAI

ADEMÁS: Perplexity lanza un asistente telefónico con capacidades autónomas

In partnership with

The Daily Newsletter for Intellectually Curious Readers

If you're frustrated by one-sided reporting, our 5-minute newsletter is the missing piece. We sift through 100+ sources to bring you comprehensive, unbiased news—free from political agendas. Stay informed with factual coverage on the topics that matter.

2025 ya ha sido ampliamente proclamado como el año de los agentes de IA, y OpenAI acaba de unirse oficialmente a la revolución.  

Con el lanzamiento de "Operator", la compañía nos lleva a una nueva era de asistentes de IA capaces de navegar por internet y realizar acciones de forma autónoma, lo que podría cambiar para siempre nuestra forma de interactuar con los chatbots.

  • OpenAI presenta su primer agente web autónomo  

  • Perplexity lanza un nuevo asistente de IA para móviles  

  • "Humanity’s Last Exam" amplía su benchmark de IA  

  • 4 nuevas herramientas de IA

OpenAI acaba de lanzar Operator, un agente de IA capaz de navegar de forma autónoma por navegadores web para realizar tareas cotidianas, marcando el primer gran paso de la compañía hacia los asistentes de IA autónomos.

Detalles:

  • Operator utiliza un nuevo modelo de Agente de Uso de Computadora, que combina las capacidades visuales de 4o con un razonamiento avanzado para interactuar de forma natural con sitios web.

  • OpenAI mostró la función en una transmisión en vivo, demostrando tareas como hacer reservas, pedir comida y comprar entradas para eventos deportivos.

  • La compañía se ha asociado con plataformas como DoorDash, Instacart y Uber para garantizar que el agente funcione sin problemas y respetando las normas de cada plataforma.

  • Incluye funciones de seguridad como aprobación del usuario para compras, detección automática de amenazas y un "modo manual" para información sensible como contraseñas y pagos.

  • Actualmente, la vista previa de investigación está limitada a usuarios Pro en EE.UU., con planes de expansión a Plus, Team y Enterprise tras más pruebas de seguridad y fiabilidad.

¿Por qué es importante?

Aunque los sistemas autónomos han ido ganando terreno, el esperado movimiento de OpenAI marca un cambio clave en la forma en que interactuamos con la IA. Puede que al principio haya desafíos, pero Operator representa el inicio oficial de una nueva era de agentes inteligentes.

Perplexity acaba de presentar Perplexity Assistant, una herramienta gratuita con capacidades de agente para Android que puede controlar aplicaciones del teléfono y realizar tareas complejas mediante voz y funciones multimodales, desafiando directamente a asistentes como Google Gemini y Siri.

Detalles:

  • Se integra con apps populares como Uber y OpenTable, permitiendo realizar acciones a través de comandos de voz o gestos.

  • Mantiene el contexto a lo largo de las interacciones, permitiendo a los usuarios pasar de la búsqueda a la acción, como encontrar un restaurante y reservar una mesa.

  • Soporta interacciones multimodales mediante voz y cámara, facilitando la obtención de información sobre el entorno o el contenido en pantalla.

  • Los usuarios pueden reemplazar el asistente predeterminado de Google con Perplexity Assistant sin coste alguno, aunque por ahora solo está disponible en Android.

¿Por qué es importante?

Operator no es el único agente en escena hoy. Perplexity ha pasado de ser un motor de búsqueda y respuestas a un asistente digital completo. La competencia en este espacio no solo involucra a las grandes tecnológicas, y este lanzamiento se parece mucho más a lo que debería ser el "Siri mejorado" de Apple.

El Center for AI Safety y Scale AI han lanzado "Humanity’s Last Exam" (HLE), un nuevo benchmark diseñado como la prueba definitiva para evaluar el conocimiento académico de los modelos de lenguaje, ya que los sistemas actuales han superado la mayoría de los test existentes.

Detalles:

  • El benchmark incluye 3.000 preguntas elaboradas por expertos en más de 100 disciplinas, con aportes de más de 500 instituciones en 50 países.

  • Los modelos de IA más avanzados han mostrado un rendimiento sorprendentemente bajo en HLE, con puntuaciones por debajo del 10% de precisión.

  • Las preguntas están en formato de respuesta exacta o de opción múltiple, y el 10% de los desafíos incorporan análisis multimodal de texto e imágenes.

  • Se ha establecido un fondo de premios de 500.000 dólares para incentivar contribuciones de calidad, con recompensas de 5.000 dólares por pregunta seleccionada y oportunidades de coautoría para los participantes.

¿Por qué es importante?

Los modelos actuales superan el 90% en muchos benchmarks clave, por lo que pruebas como HLE son cruciales para seguir midiendo el avance de la IA. Sin embargo, con el ritmo de progreso actual, es probable que no pase mucho tiempo antes de que los modelos comiencen a obtener resultados impresionantes en este nuevo estándar.

PERO ESPERA

Recuerda que te puedes suscribir a la versión “Pro” de La Señal, para recibir reportes diarios, semanales, y acceso a decenas de recursos que publico en mi comunidad privada.

¡Si no te lo quieres perder, suscríbete aquí! https://www.alertaia.com/upgrade