Saltar al reproductor
Saltar al contenido principal
Saltar al pie de página
Buscar
Iniciar sesión
Ver en pantalla completa
Me gusta
Comentarios
Añadir marcador
Compartir
Añadir a la lista de reproducción
Denunciar
Demonstrating Operator
xataka
Seguir
24/1/2025
Categoría
🤖
Tecnología
Transcripción
Mostrar la transcripción completa del vídeo
00:00
¿Puedes decirme tu nombre?
00:02
Sí, mi nombre es Hyunwoo Noh
00:04
y soy el líder de investigación de Operator en OpenAI.
00:06
¿Y qué es Operator?
00:08
Operator es una previsión de investigación
00:11
de un agente que utiliza browsers
00:13
para ayudar al usuario a hacer cosas.
00:15
Tengo un niño de tres años que le gusta la pasta
00:20
así que hice un link-in con el cliente
00:23
y le pedí que comprara las comidas para él.
00:25
Así que usaré la tabla Instacart
00:29
y Operator puede usar cualquier sitio web
00:33
y no es particularmente optimizado para Instacart.
00:36
Pero la razón por la que uso esta tabla
00:38
es que ofrece una instrucción detallada
00:40
sobre cómo utilizar este sitio web
00:42
igual que el tutorial de cómo beneficiar a los humanos.
00:46
Así que usaré la tabla Instacart
00:48
y le pediré para resolver una tarea.
00:50
¿Puedes encontrar la receta
00:54
del link-in con el cliente
00:57
desde el sitio web de todas las recetas
01:00
y agregar todos los ingredientes
01:04
a la carta comercial de Instacart?
01:10
Creo que ya tengo
01:15
algunos ingredientes como mantequilla,
01:17
aceite vegetal y agua.
01:24
Y pimienta negra.
01:28
Así que no necesito agregarlos a la carta.
01:33
Dice que encontraré la receta
01:36
y agregaré todos los ingredientes a la carta.
01:42
Dice que vendrá de los ingredientes
01:44
y la compro conmigo
01:46
antes de agregarlos a la carta.
01:48
Empecemos por encontrar la receta.
01:51
No estoy haciendo nada.
01:53
El operador está haciendo
01:55
y yo estoy viendo lo que está haciendo.
01:57
Lo interesante del operador es que
01:59
está usando un browser diseñado para los humanos.
02:02
Y está viendo exactamente la misma herramienta
02:05
que estoy viendo ahora mismo
02:07
y está usando el tipo de teclado
02:09
y el clic de la mano para controlar el browser,
02:11
igual que lo haría el humano.
02:13
Esto es diferente a otros agentes
02:15
que usan una interfaz de programación
02:17
que los programadores podrían entender,
02:20
pero los usuarios no podrían entenderlo muy bien.
02:23
El operador, porque está usando
02:26
esta interfaz humana natural,
02:29
es muy fácil de seguir
02:31
mirando lo que está haciendo en la pantalla.
02:33
¿Puedes seguir su progreso?
02:35
Sí.
02:37
Una manera de seguir su progreso es
02:41
que puedo zoomar para ver la pantalla mejor.
02:44
El operador está apagado
02:46
por la cadena textual del origen.
02:49
Entonces, cuando está haciendo cosas,
02:51
dice que hace planes
02:54
de cómo las cosas pueden ser hechas.
02:56
Y esto puede ser seguido por esta lista de datos.
02:59
Y dice que encontré una receta
03:01
y ¿cuál tienda preferirías usar?
03:06
Entonces, voy a preguntar.
03:08
Usar.
03:14
Entonces, a menudo pregunta clarificadora
03:17
cuando es necesario
03:19
en el proceso de resolver la tarea.
03:21
Hay casos en los que el operador
03:23
tiene que hacer acciones sensitivas,
03:25
cosas como ingresar o comprar cosas.
03:28
En este caso, construimos al operador
03:30
para estar a salvo en esta situación.
03:32
Entonces, el operador es diseñado
03:34
a pedirnos para tomar el control
03:36
para ingresar por nosotros mismos
03:38
o cuando sea necesario chequearlo.
03:40
Nos da el control
03:42
para que pueda revisar
03:43
si la lista está correcta
03:46
Increíble.
03:47
Muchas gracias.
03:48
Aprecio que nos lo muestres.
03:49
Muchas gracias.
Recomendada
1:56
|
Próximamente
Project Astra Exploring the Capabilities of a Universal AI Assistant
xataka
21/5/2025
1:26
Operator de OpenAI
Webedia Spain
23/1/2025
1:28
Powering Smart Hospitals with AI at the Edge
xataka
24/6/2021
0:54
Ai Cyberagent
xataka
30/1/2023
2:53
Proceso Ninja Luxe Café
xataka
hace 3 días
1:02
Quinografía - Tráiler
xataka
hace 4 días
0:13
Catedral de Florencia en Microsoft Excel
xataka
hace 4 días
1:07
YouTube Resúmenes IA
xataka
hace 4 días
0:29
Xiaomi Smart Band 10
xataka
hace 5 días
1:00
Xiaomi AI Glasses
xataka
hace 5 días
0:59
Xiaomi MIX Flip 2
xataka
hace 5 días
0:48
Introducing: The Fairphone (Gen. 6) | Switch to a new smartphone experience
xataka
hace 5 días
0:07
Resúmenes de mensajes de WhatsApp con MetaAI
xataka
hace 5 días
0:41
Así es el SIRTAP, el dron táctico de alta gama diseñado y fabricado en España por Airbus
xataka
hace 6 días
1:23
Mediaset Infinity
xataka
hace 6 días
1:02
Unitree B2, robot bombero
xataka
24/6/2025
1:14
Candlelight Conciertos
xataka
24/6/2025
0:48
Netflix
xataka
24/6/2025
0:33
Apple TV
xataka
24/6/2025
17:23
CERRADURA INTELIGENTE NUKI ¿Se abrirá la puerta? | Domotizar o morir en el intento: CAPÍTULO 3
xataka
24/6/2025
8:07
Las ENSALADAS espaciales podrían MATARNOS. El futuro está en COMER GRILLOS
xataka
24/6/2025
0:58
El impresionante campo visual del Observatorio Vera Rubin
xataka
24/6/2025
1:52
The Path to the Liberty Phone
xataka
24/6/2025
0:56
Lei Jun hablando sobre el Xiaomi YU7
xataka
24/6/2025
59:38
Death Stranding 2, primeros minutos
xataka
23/6/2025