00:00장빙님 이거 보셨어요?
00:01뭔데요? 뭐야?
00:02지드래곤 선배님 노래 맞춰서 춤추는 로봇인데
00:06로봇이야?
00:07네
00:08이거 진짜 너무 신기했어요
00:10어디 가네?
00:11멀리서 보면 진짜 사람이 춤추는 거 같아요
00:14대박이다
00:18오셨어요
00:19안녕하세요
00:19안녕하세요
00:22아니 뭐 이렇게 재밌게 보고 계시던데요
00:25지드래곤 선배님 안무를 진짜 똑같이 소화하는 로봇을 제가 보고 있었거든요
00:30이거 알고 계셨어요?
00:31이 로봇은 좀 알죠
00:32이게 피지컬 AI의 대표적인 로봇인 게
00:37이런 어떤 멜로디, 음악, 춤까지 다 외운 로봇이기 때문에
00:42새로운 음악만 틀어주면 거기에 맞춰서 춤을 출 수 있는
00:46아주 대표적인 피지컬 AI 로봇입니다
00:49아니 근데 이러다가 진짜로 로봇 아이돌이 정식으로 데뷔하는 거 아닙니까?
00:54그러니까요
00:55그게 불가능한 일은 아닌 거 같아요
00:57뭐냐면 갤럭시 코퍼레이션
00:59우리 GD님의 소속사죠
01:01이것과 KAIST가 같이 개발한 결과예요
01:04그래서 여기 소속사 대표님이 미국 언론이랑 인터뷰를 했는데
01:09향후 5년 안에 데뷔를 시키겠다
01:11이런 얘기를 했다고 봐요
01:14아니 근데 이거 제가 좀 주제넘은 걱정일 수 있지만
01:17우리 지민 씨
01:18이러다가 로봇 아이돌들 막 우르르 데뷔하고 그러면
01:21리얼 아이돌들보다 더 로봇들이 인기 많아지면 어떻게 해요?
01:25네 근데 로봇이랑 사람은 다르죠
01:29그건 또 지민 씨 생각인 게
01:32소속사 입장에서도 너무 매력적인 게
01:35일단은 얘네들 밥 안 먹잖아요
01:37그렇지
01:37전기, 전기만 먹이면 식비 얼마나 들어가겠어요?
01:41네
01:42그리고 일단 전 세계 투어를 시켜도
01:44힘들다 뭐하다 이런 거 얘기 안 하잖아요
01:47그러면 얼마나 투정 많이 하겠어요?
01:49아니 저희 이진하느라 안 그렇죠
01:52사실 오늘은 가요계 뿐만 아니라 우리 사회 곳곳에
01:57특히 산업의 질서가 피지컬 AI를 중심으로 재편되는
02:02그런 구조적 변화에 대해서 깊이 있게 들어가 보려고 합니다
02:19근데 제가 궁금한 게 있는데
02:22피지컬 AI도 로봇이고
02:25옛날부터 했던 그 로봇도 로봇이잖아요
02:28근데 그 두 개가 어떤 차이점이 있는지
02:31진짜 우리가 뭘 하든 개념부터 이렇게 이해하고 가야 되잖아요
02:34유승재 대표께서는 정부 피지컬 AI 기획위원으로 계신다고 들었는데
02:40또 전문 분야시니까 전문적으로 한번 말씀해 주시죠
02:43아 네 지금까지 우리가 CHAT GPT 워낙 유명하잖아요
02:46뭐 재미나이 이런 초거대 언어 무대들 굉장히 많이 나오고 있는데
02:50이 AI들은 엄청나게 똑똑하긴 한데
02:52모니터라는 감옥 안에 갇혀 있습니다
02:55쉽게 말하면 머리, 뇌만 있는 존재였던 거죠
02:59근데 이제는 카메라라는 눈 그리고 모터라는 근육이 달려 있는 거고요
03:04그리고 이런 CHAT GPT 같은 것들이 지능이 팔다리라고 하는 육체를 입고
03:09드디어 몸 밖으로 나오게 된 겁니다
03:11이게 바로 피지컬 AI의 기본 개념이라고 보시면 볼 수 있을 것 같습니다
03:15뭔가 알 것 같으면서도
03:18아직 조금 어려워
03:21더 쉽게 얘기를 해보겠습니다
03:22우리가 이 치킨도 앞에 있는데
03:24치킨 튀기는 기계를 생각해 보세요
03:26오 저기 있네
03:27기존의 로봇은 인간이 180도 온도에서 10분간 튀겨라고 정해주면
03:33이 치킨이 맛있게 튀겨져야 되는데
03:35사실 온도도 다르고
03:36닭의 크기도 달라지고 하기 때문에
03:39이게 맛있게 튀겨지지가 않는 거죠
03:41그렇구나
03:42그렇기 때문에 AI의 판단이 들어가는 게 굉장히 중요하고요
03:45초거대 언어 모델, LLM의 추론 능력도 몸과 같이 결합이 돼서
03:49보고 판단해서 규칙이 아니라 스스로 판단해서 튀기는 거예요
03:54그게 바로 VLA라고 하는 새로운 AI 기술이 들어가 있는 게 바로 피지컬 AI라고 할 수 있습니다
04:00이제 생각까지 해버리는구나
04:03판단을 하고
04:03근데 지금 말씀 듣다가 또 어려운 용어가 나온 것 같은데
04:06VLA요?
04:08그게 어떤 거예요? VLA?
04:10AI의 전체 발전 과정을 알면 조금 더 이해하기가 쉬운데요
04:14우리가 많이 쓰는 채찍 비키를 초거대 언어 모델, LLM, 라지 랭기지 모델이라고 하고요
04:20너무 큰 모델을 돌리는 것이 어렵기 때문에
04:23그걸 작게 만들어서 스몰, SLLM이라고도 많이 부릅니다
04:28이렇게 작은 모델은 장점이 하드웨어에다가 심을 수가 있겠죠
04:32어디든지 넣을 수 있다는 장점이 있는 거고요
04:35그 이후에 나온 게 뭐냐면 LAM입니다
04:38LAM은 라지 액션 모델이에요
04:41큰 언어 모델의 행동 데이터를 같이 학습시킨 거예요
04:44단순히 답변만 하는 것이 아니라 여행 계획도 짜달라고 할 수 있고
04:48비행기 표도 이렇게 해달라고 할 수가 있습니다
04:51그 이후에 나온 게 VLM입니다
04:54VLM은 비전 랭기지 모델이에요
04:57그러니까 시각과 언어가 같이 합쳐져 있는 그런 모델이고요
05:00이 사진 안에 뭐가 있어? 라고 질문을 물어보면
05:03이 사진 안에 치킨이 있고요
05:05포크가 있고요 라고 이해하고
05:07거기에 맞는 답을 줄 수 있는 게 VLM이라고 할 수 있고요
05:11그리고 드디어 다섯 번째가 아까 질문하신 게 VLA입니다
05:15비전 랭기지 액션 모델이에요
05:18VLM이라고 하는 행동 모델에다가
05:21나중에 언어 모델 그리고 볼 수 있는 것들
05:24그리고 행동 데이터까지 세 가지가 다 결합되어 있는 게
05:27이 VLA라고 하는 이런 모델이고요
05:30이렇게 하게 되면 팔을 움직여서 물건을 짓거나
05:33물리적인 어떤 실체와 연결된 작업을 수행하는
05:37두뇌 역할까지 같이 할 수 있는
05:39세 가지가 모두 결합된 모델이
05:41VLA라고 할 수 있습니다
05:42거의 사람이 돼 가는군요
05:44네
댓글