Saltar al reproductor
Saltar al contenido principal
Buscar
Iniciar sesión
Ver en pantalla completa
Me gusta
Añadir marcador
Compartir
Más
Añadir a la lista de reproducción
Denunciar
Demonstrating Operator
xataka
Seguir
hace 8 meses
Categoría
🤖
Tecnología
Transcripción
Mostrar la transcripción completa del vídeo
00:00
¿Puedes decirme tu nombre?
00:02
Sí, mi nombre es Hyunwoo Noh
00:04
y soy el líder de investigación de Operator en OpenAI.
00:06
¿Y qué es Operator?
00:08
Operator es una previsión de investigación
00:11
de un agente que utiliza browsers
00:13
para ayudar al usuario a hacer cosas.
00:15
Tengo un niño de tres años que le gusta la pasta
00:20
así que hice un link-in con el cliente
00:23
y le pedí que comprara las comidas para él.
00:25
Así que usaré la tabla Instacart
00:29
y Operator puede usar cualquier sitio web
00:33
y no es particularmente optimizado para Instacart.
00:36
Pero la razón por la que uso esta tabla
00:38
es que ofrece una instrucción detallada
00:40
sobre cómo utilizar este sitio web
00:42
igual que el tutorial de cómo beneficiar a los humanos.
00:46
Así que usaré la tabla Instacart
00:48
y le pediré para resolver una tarea.
00:50
¿Puedes encontrar la receta
00:54
del link-in con el cliente
00:57
desde el sitio web de todas las recetas
01:00
y agregar todos los ingredientes
01:04
a la carta comercial de Instacart?
01:10
Creo que ya tengo
01:15
algunos ingredientes como mantequilla,
01:17
aceite vegetal y agua.
01:24
Y pimienta negra.
01:28
Así que no necesito agregarlos a la carta.
01:33
Dice que encontraré la receta
01:36
y agregaré todos los ingredientes a la carta.
01:42
Dice que vendrá de los ingredientes
01:44
y la compro conmigo
01:46
antes de agregarlos a la carta.
01:48
Empecemos por encontrar la receta.
01:51
No estoy haciendo nada.
01:53
El operador está haciendo
01:55
y yo estoy viendo lo que está haciendo.
01:57
Lo interesante del operador es que
01:59
está usando un browser diseñado para los humanos.
02:02
Y está viendo exactamente la misma herramienta
02:05
que estoy viendo ahora mismo
02:07
y está usando el tipo de teclado
02:09
y el clic de la mano para controlar el browser,
02:11
igual que lo haría el humano.
02:13
Esto es diferente a otros agentes
02:15
que usan una interfaz de programación
02:17
que los programadores podrían entender,
02:20
pero los usuarios no podrían entenderlo muy bien.
02:23
El operador, porque está usando
02:26
esta interfaz humana natural,
02:29
es muy fácil de seguir
02:31
mirando lo que está haciendo en la pantalla.
02:33
¿Puedes seguir su progreso?
02:35
Sí.
02:37
Una manera de seguir su progreso es
02:41
que puedo zoomar para ver la pantalla mejor.
02:44
El operador está apagado
02:46
por la cadena textual del origen.
02:49
Entonces, cuando está haciendo cosas,
02:51
dice que hace planes
02:54
de cómo las cosas pueden ser hechas.
02:56
Y esto puede ser seguido por esta lista de datos.
02:59
Y dice que encontré una receta
03:01
y ¿cuál tienda preferirías usar?
03:06
Entonces, voy a preguntar.
03:08
Usar.
03:14
Entonces, a menudo pregunta clarificadora
03:17
cuando es necesario
03:19
en el proceso de resolver la tarea.
03:21
Hay casos en los que el operador
03:23
tiene que hacer acciones sensitivas,
03:25
cosas como ingresar o comprar cosas.
03:28
En este caso, construimos al operador
03:30
para estar a salvo en esta situación.
03:32
Entonces, el operador es diseñado
03:34
a pedirnos para tomar el control
03:36
para ingresar por nosotros mismos
03:38
o cuando sea necesario chequearlo.
03:40
Nos da el control
03:42
para que pueda revisar
03:43
si la lista está correcta
03:46
Increíble.
03:47
Muchas gracias.
03:48
Aprecio que nos lo muestres.
03:49
Muchas gracias.
Sé la primera persona en añadir un comentario
Añade tu comentario
Recomendada
0:14
|
Próximamente
Inteligencia Artificial
Forbes
hace 3 años
1:56
Project Astra Exploring the Capabilities of a Universal AI Assistant
xataka
hace 4 meses
1:26
Operator de OpenAI
Webedia Spain
hace 8 meses
1:28
Powering Smart Hospitals with AI at the Edge
xataka
hace 4 años
0:54
Ai Cyberagent
xataka
hace 3 años
0:56
Inteligência artificial recria rostos de pinturas famosas
Olhar Digital
hace 5 años
12:20
Cómo China, el mayor contaminador del planeta, se ha convertido también en todo lo contrario
xataka
hace 18 horas
0:08
Gato persiguiendo a una pelota generado con Veo 3 en Gemini
xataka
hace 1 día
0:10
Gato persiguiendo a una pelota generado con Sora 2
xataka
hace 1 día
0:08
Disolución de líquidos generada con Veo 3 en Gemini
xataka
hace 1 día
0:10
Disolución de líquidos generada con Sora 2
xataka
hace 1 día
0:10
Muestra creada con Sora 2 aprovechando un modelo personal
xataka
hace 1 día
1:42
Ejemplos grabación iPhone 17 Pro Max
xataka
hace 1 día
0:34
Prueba de enfoque iPhone 17 Pro Max
xataka
hace 1 día
0:11
Estabilización iPhone 17 Pro MAx
xataka
hace 1 día
0:57
Así es Sora 2
xataka
hace 2 días
6:14
Muestra de juego en iPhone 17 Pro Max
xataka
hace 2 días
1:46
Muestra vídeo iPhone 17 Pro Max
xataka
hace 2 días
2:14
Resumen del vuelo 10 de Starship
xataka
hace 2 días
0:24
Grabación de vídeo en Modo Cine - iPhone 17
xataka
hace 2 días
0:21
Grabación de vídeo del iPhone 17 - 4K 60 fps
xataka
hace 2 días
0:09
Robot Limpiacristales-Escaparate tienda_v2
xataka
hace 3 días
0:14
Screen_Recording_20250926_155902_WhatsApp
xataka
hace 6 días
0:10
Screen_Recording_20250926_155835_WhatsApp
xataka
hace 6 días
2:27
The Savant — Official Trailer | Apple TV+
xataka
hace 6 días
Sé la primera persona en añadir un comentario