에이전트 아키텍처와 타입

Shared on March 31, 2026

00:13:05

그 다음에 싱글 디터미니스틱 시퀀셜 소딕 이거네 이거 이거 이거 이거 이거 여기까지 쭉 와서 풀리 싱글 디터미니스틱 에피소딕 에피소딕이 좋죠 그쵸? 풀리 싱글 디터미니스틱 에피소딕이 좋아요 그 다음에 뭐 스터틱이나 세미나 비슷하다고 보고 디스크리트가 좋죠 디스크리트가 그렇게 따지면

00:13:33

비슷한 것이 지금 크로스워드 퍼즐 여러 번 퍼즐 신문에서 가로 세로 맞추기 아니면 이미지 분석하기 네 이것도 컨티뉴스 라인 게 조금 그래서 이게 전체적으로 보면 어 그 무슨 말 하는지 알겠죠 요런 상태 여기도 지금 요런 상태로 가다가 디터미니스트 까지 가다가 시퀀셜이기 때문에 이게 앞이 시퀀셜은 과거 현재를 계속 스토리를 계속 들고 다녀야 되기 때문에 에이전트가 무거워지는 거거든요

00:14:05

일회용으로 끝나는 게 아니라 계속 들고 다녀야 돼. 그래서 시퀀셜, 스타틱, 정적, 이게 정적이나 세미나 이게 조금 더 낮고 컨티뉴스, 마찬가지로 디스크리트, 환경 자체가 여기서 디스크리트, 컨티뉴스 설명하고 있죠. 그래서 여기서 택시 드라이빙이 컨티뉴스 이렇게 얘기했죠. 스피드나 이 부분에서 여기서 택시 드라이빙 액션은

00:14:40

컨티뉴스 하다. 그 다음에 인풋카메라 자체는 디스크립트 하고 인풋 카메라로부터 오는 인풋은 계속 쪼각쪼각쪼각 오지만 계속 액션은 택시 드라이빙하는 액션은 컨티뉴스하게 바퀴의 각도라든지 이런 거는 계속 영향을 받아서 이렇게 했다 저렇게 했다 계속 영향을 받아지는 거기 때문에 이게 컨티뉴스 하다 그렇게 표현할 수 있는 거죠. 그래서 이런 용어들을 여러분이 정확하게 아는 게 굉장히 중요하고요.

00:14:46

이게 지난 시간에 한 거에 중요한 포인트가 되겠습니다.

00:15:09

그렇게 했고 그 다음에 오늘 들어갈 부분은 혹시 질문 있는 학생 있나요?

00:15:19

감사합니다.

00:15:58

에피소드 시퀀셜 부분은 미리 미래를 생각 안 해도 되기 때문에 그런 거고 시퀀셜이다 아니면 에피소디카다 단타냐 아니면 과거 현재 미래에 검토해야 되느냐인 거고요. 여기서 컨티뉴스한 거는 액션은 이게 자동차가 운전하다가 갑자기 쓸 수가 없잖아요. 운전하다가 계속 가야지. 계속 가야 되는 환경이고 카메라 같은 사진은 계속 우리한테 뿌려주지만

00:16:43

나는 내 차는 그게 오든 안으로 내 차는 가야 되는 환경이잖아요. 계속 가야 되는 거잖아요. 이렇게 가든 저렇게 가든 앞차랑 부딪히든 어쩌든 간에 나는 계속 가야 돼. 그래서 이런 환경이 우리가 디스크립트냐 컨티뉴스 하냐라고 얘기하는 거죠. 여기서 알겠죠. 이걸 했고 오늘 2.4절 진행할 겁니다. 그래서 지난 시간에 조금 했지만 에이전트 프로그램과 에이전트 아키텍처 그래서 프로그램과 아키텍처를 합했을 때 에이전트라고 얘기하는 거고요. 여기서 프로그램이라고 얘기하면

00:17:39

에이전트 펑션들 펑션이라는 건 인지하고 행동하고 여기 있죠. 에이전트 펑션이라는 거는 인지하고 행동하는 거. 내가 로봇에서 지난번에 A방을 갔는데 A방이라는 걸 인지했는데 거기가 더티해. 인지했어. A방이라는 걸 가서 더티하다는 걸 인지했어. 그래서 우리가 이렇게 괄호로 표현했잖아요. 그게 에이전트 펑션이고 그랬을 때 어떻게 해? 클린한다. 썩 이라고 해서 청소를 한다. 라고 하면 그건 액션이죠. 퍼셉트한 거를 액션으로 했어요. 그래서 그렇게 하는 거를 펑션이라고 얘기하고 그걸 구현한 게 에이전트 프로그램이고 그렇게 하라라고 구현한 게 프로그램이고 이거는 피지컬하게 실질적인 센서라는 그런 게 붙어있는 아키텍처를 말하죠. 즉 PC라든가 로봇이라든가 자동차라든가 실제적인 모양이 있는 무언가 그걸 아키텍처라고 얘기를 해요.

00:18:23

컴퓨터 아키텍처 이러면 컴퓨터 그 자체를 말하는 것이 되겠습니다. 컴퓨터 아키텍처 하면 이게 컴퓨터 구조니까 이 안쪽에 있는 것을 얘기하나 메모리 이런 걸 얘기하나 라고 생각할 수 있는데 그게 아니고 에이전트 아키텍처라고 얘기하면 아키텍처는 피지컬 센서나 액취에이터 즉 피지컬 전체적인 컴퓨터 모양이 있죠. 네모난 데스크탑 같은 거 네모난 모양 물론 안에 있는 메모리도 다 포함을 해서 이렇게 생긴 모양 데이터가 우리가 버스라고 얘기하죠. 데이터가 왔다갔다 하는 것 cpu gpu 들어 있는 것 캐시 있는 것 뭐 이런 것들이 다 왔다갔다 하면서 처리하는 우리가 보여주는 이 물리적인 컴퓨터 시스템 자체를 아키텍처라고 얘기하는 거고

00:19:05

거기에 프로그램 하면 인지하고 그 다음에 그거에 대해서 행동. 방이 더러우니까 A가 더디하니까 청소해라 써. 아니면 A는 클린하니까 Move. Left Move, Right Move 이런 식으로 행동을 연결하는, 맵핑하는 하나의 에이전트 펑션. 그거를 그렇게 하라고 구현한 프로그램. 그게 에이전트 프로그램이죠. 그래서 하나의 소프트웨어. 로봇한테 그렇게 하라고 한 소프트웨어. 그 다음에 로봇 자체 발도 달려 있고 저희 집에도 로봇이 있거든요. 로봇청소기. 근데 이렇게 동그랗게 생겨서 다리만 움직이면서 청소를 해요. 센싱도 하고 반짝반짝 빛나고. 그래서 그렇게 생긴 로봇.

00:19:38

그게 아키텍처 프로그램 아키텍처 합한 거를 거기에서 동작하는 그 전반적인 그거를 뭐라고 그랬냐면 그거를 에이전트라고 얘기하는 거거든요. 에이전트. 에이전트라고 얘기하면 사실은 하드웨어 소프트웨어를 전부 다 합했다라고 볼 수 있습니다. 에이전트. 합했다고 볼 수 있어요. 왜냐하면 에이전트 혼자서 동작할 수가 없고 이게 이제 소프트웨어랑 합쳐서 들어가야지 얘가 그냥 뭐 혼자서 되기는 사실 어렵습니다. 그래서

00:20:41

에이전트를 우리가 쉽지 만약에 에이전트를 AI 관점에서 얘기하면 이 프로그램을 조금 더 얘기할 수 있어요. 프로그램을. 그런데 얘는 뭔가 어딘가에서 동작을 해야 되잖아요. 그걸 아키텍처라고 얘기하고 합쳤을 때 우리는 이거를 하나의 명백하게 오비어슬리 명백하게 이걸 하나의 에이전트다라고 볼 수가 있습니다. 왜냐하면 아키텍처에 에이전트 소프트웨어가 돌아가기 때문에 에이전트 프로그램이 돌아가기 때문에 결과적으로 이게 하나의 에이전트다. 왜냐하면 청소라고 하는 미션을 가지고 있는 로봇이잖아요. 그러니까 하나의 에이전트. 나 대신 하는 거잖아. 원래는 그게 없으면 내가 청소해야 되는데 나 대신 청소하는 아키텍처가 있고 그게 하나의 에이전트고 거기에 소프트웨어를 얹어서 완벽하게 하드위어 소프트웨어가 움직이는 하나의 에이전트를 만들었어요. 그래서 이거를 에이전트라고 얘기를 합니다.

00:21:13

이렇게 해서 이렇게 하는 에이전트의 스트럭처를 좀 지금부터 몇 가지 좀 보도록 하겠습니다 그래서 여기 이런 그 알고리즘 코드들이 나와 있는데 알고리즘 코드는 여러분 각자 보도록 하고 여기서 지금 설명한 부분을 다시 한번 하겠습니다 대부분 나는 이제 문서에 있는 그 문장을 그대로 가져왔구요 변형을 하지 않았습니다 그래서 여러분이 요 해당하는 지금 이거 책에 아까 있었던 문장이죠 그래서 요거를 보고 책을 같이 고해당하는 부분을 읽어가면서 하면 좀 더 이해가 더 쉬울 거에요

00:21:44

The job of AI라고 얘기할 때는 to design agent program that implement agent function mapping from percept to action 이미 얘기했죠. 그걸 implement하는 걸 하나의 agent program이라고 하고 agent program을 정의하는 것이 AI의 job이에요. 그래서 이것을 우리가 보통 소프트웨어적으로 보면 이 자체를 그냥 AI다. AI는 agent다 이렇게 얘기할 수 있었던 것은 바로 이것 때문이죠. 이렇게 인지하고 행동하는 것을

00:22:36

구현하는 하나의 소프트웨어를 만드는 것 자체가 AI의 job이라는 얘기죠. 그걸 하기 위해서 AI가 여태까지 해온 거야. AI는 결국 에이전트다 이렇게 말할 수가 있는데 근데 그 프로그램이 이 에이전트 프로그램이 어딘가에서 동작을 해야 되잖아. 그래가지고 어디서 동작하냐면 디바이스에서 동작해요. 디바이스. 근데 디바이스가 피지컬하게 물리적으로 피지컬하다는 건 우리가 눈에 보이게 물리적으로 센서도 있고 액체위이터도 있어. 센싱하고 에이전트는 행동하는 거예요. 그래서 로봇청소기로 보면 발이 달렸잖아. 발이 막 움직이거든요. 그게 에이전이터고 센서는 반짝반짝해서 앞에 먼지가 있나 앞에 어떤 물체가 있나 이걸 센싱해서 큰 물체가 있으면 피해가고 이렇게 하거든요. 그래서 센싱과 센서와 에이전이터가 함께 있는

00:23:17

그런 형체를 갖춘 디바이스, 컴퓨팅 디바이스 상에서 동작을 한단 말입니다. 그래서 그걸 우리가 아키텍처라고 말을 하는 거죠. 그래서 이런 아키텍처와 프로그램 합친 게 하나의 에이전트다. 그래서 아키텍처는 프로그램 상에서 유용한 건데 프로그램 상에서 동작하고 프로그램에 일종의 피드, 먹이를 주는 역할을 하는 거죠. 피드, 피드 프로그램의 먹이 역할을 한다. 그래서 초이스, 액션 초이스 투 액추에이터, 액추에이터가 액션을 선택할 수 있는

00:23:48

로봇이 있는데 로봇이 발이 막 움직이는데 센싱이 됐더니 이게 먼지가 많으면 발이 막 움직여서 더 많은 것을 그 먼지를 빨아들이잖아요. 그래서 프로그램 액션 액취에이터가 행동하는 행동하게 할 수 있도록 하는 하나의 먹이를 주는 역할을 한다. 하나의 인풋을 제공한다 그렇게 볼 수가 있다는 것입니다. 그래서 여러분이 이 내용을 잘 인식을 하면 아키텍기 정리를 해보면 여태까지 한 걸 슬라이드를 정리를 해보면

00:24:00

여기 지우개가 있는데 지우개가 해야 되는데 왜 안하죠?

00:24:38

안 되면 나중에 그냥 꺼도 나가더라고요. 색깔을 좀 다른 걸로 할까요? 초록색이 좋겠네요. 아키텍처는 센서로부터 결국은 어두운 지갑, 퍼셉트한 거. 퍼셉트한 거. 그거를 프로그램에 전달을 하는 거죠. 아키텍처는 그걸 프로그램에 먹이로 피드한다는 걸 준다는 얘기죠. 프로그램에 전달하고 프로그램을 실행하고 프로그램이 선택한 행동을 생성하고

00:25:11

생성되는 대로 액체이터에 전달하는 그런 역할을 한다 라고 이제 전반적으로 번역을 할 수가 있겠습니다 아 자 전반적으로 이해가 됐습니까 그래서 에이전트를 그 좁게 생각하면 하나의 프로그램의 에이전트라고 1차적으로 생각할 수 있고 그 다음에 조금 더 우리가 배운 거대로 한다 그러면 요 아키텍처까지 포함을 해서 그 프로그램이 동작하는 컴퓨팅 디바이스 까지 포함을 해서 에이전트라고 정의할 수가 있겠습니다

00:25:49

알겠습니까? 그래서 아키텍처는 뭐죠? 센서로부터 얻은 지각을, 자기가 지각한 것을 프로그램에 전달하고 프로그램을 실행하고, 그렇죠? 그 다음에 또 프로그램을 실행한 행동을 다시 액체이트로 전달하고 이렇게 서로서로 상호작용하는 역할을 하게 되는 것입니다. 테이블 드리븐 에이전트에 대해서 설명을 해보면 이건 우리 책에 진도를 많이 빨리빨리 안 나가지만 여러분 꼭 원서를 같이 읽어보라고 그랬죠? 이 그림 2-7번

00:26:41

요거를 얘기하는 겁니다. 그림 2-7번 여기 테이블 드리븐 에이전트라고 나와 있죠. 이거는 퍼셉트 해서 결국은 얘도 액션을 들여오는 것입니다. 그래서 여러분이 이 알고리즘을 보면서 이 에이전트가 무엇을 하는 건지를 이해하면 돼요. 여기 보면 퍼셉트, 시퀀스, 이니셜, MT 초반에는 MT였는데 얘가 뭔가 행동해야 될 시퀀스들을 퍼셉트하고 테이블은 바로 뭐냐면 액션들. 그러니까 결국 퍼셉트한다는 거는 시퀀스. 시퀀스로 퍼셉트하는 거고 테이블은 테이블 오브 액션. 그러니까 인지한. 인지한 시퀀스로부터 너는 무슨 무슨 행동을 해라. 라는 것을 나타내는 테이블이죠. 초반에는 비어있죠. 그러니까 어떻게 돼요? 우리 앞에서 여기서 배운 게

00:27:14

지금 그 에이전트가 우리가 지난 시간에 여기 요거 있죠. 이게 퍼셉트 시퀀스가 있죠. 그래서 A라는 방에 이렇게 있고 A라는 방에 있고 B라는 방에 있는데 이게 로봇이 보니까 A가 클린하다. 그러면 액션은 뭐야? 오른쪽으로 갈 필요 없죠. A가 더티하다. 그러면 썩 청소하라는 얘기죠. 그래서 B에 갔더니 B가 클린하면 다시 레프트로 오고 뭐 이런 시퀀스와 액션, 시퀀스와 액션을 이렇게 맵핑한 거를 아까 뭐라고 그랬어요? 에이전트 펑션이라고 얘기했죠

00:27:56

그런 것을 여러분이 이제 이해를 하고 그런 그 테이블 오브 액션, 인지하는 걸 세퀀스가 들어오면 액션을 테이블 오브 액션, 테이블 오브 액션으로 나타내서 행동할 수 있도록 하고 테이블을 룩업 테이블을 계속 퍼펙트와 테이블을 계속 룩업 테이블 업데이트하는 그런 역할을 테이블 드리븐 에이전트라고 할 수 있습니다. 그래서 지금 이쪽을 보면 여기 보면 이게 지금 바로 그 설명을 하고 있는데요.

00:28:29

테이블 드리븐 어프로치 여기 나와 있죠. 테이블 드리븐 어프로치는 좋긴 좋은데 간단하죠. 어떤 어떤 세컨스가 인지가 되면 이 테이블에서부터 매칭되는 행동을 해라. 그래서 룩업 테이블이 다 있어요. 이렇게 하면 이래라 이렇게 하면 저래라 이렇게 해서 구현하기가 굉장히 쉽고 세플한 거죠. 그렇죠? 룰 기반으로 되어 있고 쉬운 거잖아요. 어떤 행동이 들어오면 어떻게 해라. 아까처럼 그 로봇 A방이 더러우면 청소해라. 깨끗하면 너무 옆방으로 가라. 레프트 라이트.

00:28:32

그런데 이게 단점이 뭘까요?

00:29:40

지금 설명이 되어 있는데 이 테이블이 행동이 뭐 우리가 뭐 10개 20개 100개 이러면 언제 테이블이 되는데 이게 수천 수만 수억 수초 그러면 그거를 그 보유할 테이블이 있을까요 아무리 메모리가 메모리가 많아도 그럼 그럼 메모리를 다 서치해야 되고 거기서 가져와서 처리해야 되고 결국은 이 테이블이 커지면 커질수록 실패할 가능성이 높습니다 왜 그러냐면 너무 많은 거로부터 찾아야 되기 때문에 에이전트가 지금 당장 눈앞에 뭐 불이 났어 그러면은 뭐 테이블 찾을 게 아니라 빨리 튀어나와야 되잖아요 근데 불이 하는데 그 테이블 찾고 액션이 이게 피하는 건지 아니면 있으라는 건지 그걸 찾다가 볼리다 보고 자기는 이 에이전트 자체가 이 로봇이 타 죽을 수도 있거든요 그래서 이게 테이블 드리븐 에이전트는 어떤 크기를 주워졌을 때는 굉장히 퍼포먼스가 좋은데 이 테이블 크기가 커질수록 좀 더 어 칠피할 가능성이

00:30:09

높은 그런 에이전트 타입이 되겠습니다. 이 그림을 보면 왜 이것이 실패할 가능성이 높은가에 대해서 설명을 하고 있는데 이거 이미 조금 전에 내가 설명했죠. 그래서 여기 보면 이게 어디 나오냐면 66페이지 여러분 책 66페이지 보면 테이블 드리븐 이게 지금 테이블 드리븐 어프로치에 대한 에이전트가 나와있어 여기서 지금 이 부분에 설명이 있거든요. 이 부분을 테이블 드리븐 어프로치에 대한

00:30:41

이 부분에 대한 설명을 할 것이고 여기서부터는 그 다음부터는 이런 리플렉스 베이컨 베이컨 에이전트라고 해서 이건 다른 에이전트거든요. 그래서 여기 이런 테이블 드리븐 어프로치에 대한 것, 왜 이게 좀 어려우냐, 실패할 가능성이 높으냐에 대한 설명을 지금부터 할 겁니다. 여러분 원서 꼭 읽어보세요. 그래서 이 경우를 보게 되면 여기서 에이전트를 파서블 퍼시브 세시 세트 그래서 어 가능한

00:31:17

가능한 인지한 셋들, 그걸 P라고 이렇게 얘기를 하고요. 라이프타임을 T, 생존 시간, 이걸 T라고 보고 그러면 테이블은 이것만큼을 가지고 있어요. T는 1부터 T까지. 예를 들면 타임은 1부터 60초까지, 60분까지 아니면 1시간. 이렇게 해서 에이전트의 생존 기간을 T라고 하고 1부터 T까지 있고요. T는 이렇게 돼 있고. 그래서 이거는 인지한 거 대비 T. 티타임에 인지한 것, 티타임에 인지한 것들을 이렇게 이제

00:31:59

표현하도록 써놨죠. 근데 그 T타임에 인지한 것들인데 그게 T, 대문자 T이게만큼 존재를 하는 거죠. 엔트리가 이 정도 됩니다. 그래서 만약에 택시 같은 경우를 생각해봅시다. 가장 난이도가 높은 게 택시라고 그랬죠. 택시는 자율자동차랑 동일한 거예요. 여러분이 택시 운전사라고 생각을 하고 택시 운전사 에이전트를 만든 거예요, 지금. 택시 운전사 에이전트를 만들었는데 우리는 운전 안 하지만 택시 운전사 에이전트라는 게 운전을 해야 되잖아요. 그게 자율자동차죠. 그래서 오토메이티드 택시라는 건 엔트리가 얼마큼 될까. 얘한테 들어오는 엔트리는 어마어마하죠. 어마어마하죠. 왜냐하면 이거는

00:32:35

사람이 굉장히 어마어마한 오브젝트라고 해야 되나? 굉장히 어마어마한 거죠. 우리는 동시에 많은 일을 하거든요. 운전할 때 뭐합니까? 운전할 때 앞에도 보고 옆에도 보고 친구랑 옆에 누가 탔으면 얘기도 하고 먹기도 하고 핸드폰도 가끔 하기도 하고 원래 그러면 안 되지만 라디오도 틀었다가 이거 했다 저거 했다 얘기했다가 온갖 걸 다 하면서 운전을 잘하거든요. 잘해요. 근데 이 사실은 에이전트 입장에서 보면 이 택시 드라이빙이 굉장히 어려운 일이에요.

00:33:09

왜냐하면 들어오는 인풋 자체가 이 관점에서 보면 퍼셉트하는 셋, 피타임의 퍼셉트하는 셋 자체가 너무나 커서 이 테이블을 초과합니다. 체스 같은 경우도 룩업 테이블이, 체스 같은 경우에는 룩업 테이블이, 이것도 굉장히 거대하죠. 체스도. 체스조차도, 체스도 내가 어떤 걸 놓으면 그 다음에 어딜 놔야 될지, 우리 바둑이나 이런 거 생각해보면, 그렇죠? 복잡한 것이긴 한데, 그것보다 택실은 더 어마어마하게 크다. 그래서 이것은 무엇을 의미하는 거냐.

00:33:47

실제로 체스를 둘 때요. 여러분 알파고가 체스를 뒀잖아. 여기 보면 여기 설명이 여기 좀 나오는데 여기 좀 나오는데 그 체스라엘이 실제로 둘 때 룩업 테이블을 계속 내가 지금 오른쪽에 넣으면 그 다음 뭘 해야 되지? 그쵸? 인지한 거 대비 액션, 인지한 거 퍼셉트 대비 액션을 계속 룩업 테이블에서 찾아야 되잖아요. 이런 인지했으면 이렇게 행동을 해라. A가 더티하면 오른쪽으로 가라. A가 더티하면 청소해라. A가 깨끗하면 오른쪽으로 가라. 왼쪽으로 가라. 이런 룩업 테이블을 조회하는 게 10에 150개라고 합니다. 150개.

00:34:22

-이제는 10에 150개 정도. -체스가 자기가 하나 놓고 그다음에 어디로 가지? 조회하는 게 10에 150개래요. -그러면 이게 얼만큼 큰지 여러분은 감이 안 올 텐데 이 우주에 존재하는 원자의 수가 몇 개냐? 10에 80승 정도라고 봅니다. -우주에 존재하는 원자의 수에 거의 두 배에 해당하는 만큼의 무겁게 입을 뒤져야 해요. 누가? 체스 들 때. 체스 들 때. 근데 특히, - 택시는 비교할 수 없이

00:34:54

어마어마하기 때문에 이 룩업테이블을 택시 드라이빙으로 택시 드라이빙을 룩업테이블 방식으로 에이전트를 구현한다. 이거는 임파서블입니다. 임파서블에 가까운 게 아니라 임파서블이에요. 행동을 다 일일이 정의해 줄 수가 없어요. 룩업테이블에는 더러우면 청소해라, 깨끗하면 이래라, 이래면 저래라, 저러면 이래라. 앞에 사람이 있으면 옆으로 가라, 근데 옆으로 갔더니 또 사람이 있으면 또 옆으로 가라. 별거 별거를 다 해줘야 되는 거 아니야, 여기서 또.

00:35:31

이게 언이메지너블리 라지하기 때문에 이거는 불가능하다 임파서블리 이렇게 표현한 거거든요. 그래서 이거는 뭐냐면 이거의 의미는 노 피지컬 에이전트 윌 이너프 스페이스 투 스토어 더 테이블. 그러니까 노 피지컬 에이전트 그러니까 실질적으로 보면 소프트웨어와 있는 피지컬 노 피지컬 에이전트 로 피지컬 에이전트 하면 에이전트인데 실제적으로 형체가 없는 에이전트죠. 그러니까 소프트웨어와 있는 거는 이너프 스페이스 투 스토어 더 테이블 테이블에 아마 그 충분한 스페이스를 가질 수 있을 거야.

00:36:08

왜냐하면 형체가 없기 때문에 디자이너는 테이블을 생성할 수가 없다. No agent can learn all the right entry from experience. 어떤 에이전트도 경험으로부터 올바른 엔트리를 학습할 수가 없다. 여기서도 보면 어떤 피지컬 에이전트도 우주에 어딘가에도 저장할 수 있는 공간이 충분하지 않은 거죠. 앞에 녹아 있으니까 여기 윌 해고 낫에 걸리는 거죠. 어떤 것도 그게 없는 거죠. 그러니까 이 말은 뭐냐면은

00:36:58

지금 체스도 이 정도인데 우주의 크기가 이 정도인데 이거는 택시는 더 어마어마하기 때문에 어떤 피지컬 에이전트도 어떤 에이전트도 어떤 디자이너도 이거를 만족하는 에이전트를 설계할 수가 없다. 그 테이블을 저장할 공간이 없다. 이 우주에는 없다. 이런 얘기를 하고 있는 겁니다. 왜냐하면 우주의 범위를 넘어섰기 때문에. 그래서 여기서는 키 챌린지의 AI는 프로그램을 쓰는 건데 레이저널 비에이비어 레이저널 비에이비어를 해야 되는 거죠. 그래서 이게 레이저널이라고 얘기하는 거는 그래서 좀 합리적이라고 얘기하는 거는 경제적인 것도 고려하고 가능성도 고려하고 그래서 최소한의 최소한을 가지고는 있지만은 그게 동작할 수 있도록 하는 거. 그래서 여기서 여기서 말하고자 하는 거는

00:37:33

그 레셔널에 좀 방점이 있는 거죠. 레셔널. 그러니까 비에이비어는 퍼셉트 한 다음에 액션 하는 거를 결국은 그게 비에이비어인데 퍼셉트하고 액션하는 것. 퍼셉트하고 액션하는 것. 퍼셉트하고 퍼셉트한 시퀀시 이후에 수행된 액션들. 퍼셉트하고 그다음에 그거 수행한 액션들. 이게 결국은 하나의 비에이비어죠. 내가 행동을 했어. 내가 앞으로 한 발짝 옮겨갔어. 행동을 했어. 비에이비어. 그거는 뭐야? 퍼셉트를 하고 그다음에 그거에 따른 액션.

00:38:03

한쪽으로 옮겨가라는 거를 했기 때문에 내가 behavior 행동이 너무 영어가 뉘앙스인데요. 퍼셉트 인지한 거예요. 앞으로 이 앞에 지금 개울이 있으니까 팔짝 뛰어가라. 예를 들어 앞에 물이 있어서 안그러면 빠지니까 팔짝 뛰어가라. 앞에 개울이 있다는 걸 인지했어. 퍼셉트 했어요. 그러면 액션은 뭐야? 뛰어가라. 호프 뛰어라. 액션. 호프 뛰어라야. 그래서 내가 실제로 팔짝 뛰어 넘어갔어요. 그게 behavior인 거죠.

00:38:40

영어 뉘앙스 알겠어요? 비행위한 행동을 내가 한 거야. 액션은 아까 다시 한번 얘기하면 앞에 개울이 있어요. 물이 있어. 그래서 이건 뛰어넘어가면 되는 거야. 그래서 어떤 퍼시브한 시퀀스는 뭐냐면 앞에 개울이 있다. 너가 지금 가고 있는데 앞에 개울이 있다. 잘못하면 네가 빠지기 때문에 개울이 있다는 걸 퍼셉트했어. 룩업 테이블을 봤더니 개울이 있으면 팔짝 뛰어넘겨라. 이렇게 액션이 되어 있단 말이에요. 그래서 나는 룩업 테이블을 보고

00:39:16

나라는 에이전트는 룩 테이블 보고 내가 그 개울 개울에 물이 있기 때문에 만났기 때문에 팔자 띄어서 비행동으로 해서 저쪽으로 확 넘어갔어 내가 그건 비행동이에요 또 참을 번역하면 액션도 행동 비행보도 행동이에요 그쵸 2대 행동이에요 그래서 이거를 원서 말고 번역 번으로 보면 행동 행동 행동 이렇게 번역 돼 있어서 우리는 그냥 액션이 비행기 오기 에 비행기 오행도 인감 따라 고 생각을 하면서 한글 버전을 읽기 때문에 이게 완벽한 이해가 아닐

00:39:51

있다는 얘기입니다 아닐 가능성이 높은 거죠 그래서 원서를 보면서 생각하면서 아 이거는 비해 벼랑 액션은 단어가 다르잖아요 단어가 다르면 어이 다른 겁니다 우리나라 행동 행위 다르지 않을까 행동 행위 어떻게 다르죠 행동 행위 좀 뭐가 다 다르니까 다른 거죠 그래서 여러분 행동 행위가 뭐가 다른지 한번 생각을 해보세요 그래서 여기서는 일단 비해 병 내가 그 레이셔널하게 비해 벼를 한 거야

00:40:25

구체적으로 한 거야. 그렇게 하라는 액션에 따라서 한 거야. 여러분 이해가 됐죠? 그런 겁니다. 여기 좀 설명을 해보면 택시의 경우는 단일 카메라가 하나인 경우에 단일 카메라에 들어오는 비주얼 인풋이 초당 70MB 정도 된다고 합니다. 그래서 초당 30개 프레임이 필요하고요. 그걸 처리하려면 여기 있는 내용들을 지금 여기 설명을 하고 있는 겁니다.

00:41:01

여기 있는 내용을 70MB 있죠. 그래서 택시 같은 경우에는 싱글 카메라로부터 들어오는 비주얼 인풋이 초당 70MB 정도 되고 그리고 이거는 초당 30프레임 정도가 되고요. 그래서 픽셀로 치면 1080 곱하기 720 픽셀이 돼서 또 24비트 색상 정보가 들어오는 그런 정보예요. 그러면은 이런 카메라 하나만 봤을 때 그러면 한 시간 동안은 운전을 위해서 룩업 테이블의 크기는 몇 개가 돼야 되냐면 10에 6천억 개 이상의 엔트리가 필요하다고 합니다.

00:41:34

여기 계산을 해보면 여기 나와 있죠. 10에 6천억. 아까 체스 같은 경우는 10에 150개죠. 150억개가 아니라 150이에요. 150. 그런데 우주에 존재하는 원자수는 10에 80이라고 얘기했어요. 그런데 이 택시 같은 경우는 10에 6천억 이상의 엔트리가 필요하다고 합니다. 이거는 불가능하지 않나요? 우주가 몇 천 개, 몇 억 개 있어야 간신히 풀 정도의 복잡한 엔트리입니다. 그래서 이 자율 자동차를 퍼펙트하게 구현하는 건 굉장히 어려운 일이에요.

00:42:23

그래서 우리는 어떻게 해야 돼? 그럼 자율 자동차를 못하나? 레셔널이라고 붙였잖아요. 그래서. 그래서 우리가 AI를 레셔널 에이전트라고 얘기하는 건 뭐냐면 많이 좀 합리적으로 코스트를 줄이면서 가장 중요한 것만 가지고 구현하는 게 레셔널 에이전트예요. 그 에이전트 자체를 다 완벽하게 구현하기는 사실은 어렵습니다. 왜냐하면 워낙 엔트리가 많기 때문에. 그래서 일단 어쨌든 테이블 기반으로 하는 것 자체는 이 컴퓨터로 구현하기는 굉장히 심플하지만 여러 가지 이러한 룩업 테이블의 메모리 크기 이런 문제로 인해서 굉장히 어려운 임파서블 우리가 풀려고 하는 문제에 어렵다라는 것을 알 수가 있고 그래서 슬리플렉스 에이전트가 등장을 했습니다.

00:43:15

그래서 이게 심플 리플렉스 에이전트는 지금 여기 나와 있죠. 여기 지금 4개가 나와 있어요. 그래서 여기 에이전트 타입에서 룩업 테이블을 하는 거는 조금 어렵고 그래서 여기서 우리가 강조하고 싶은 거는 에이전트 프로그램, 에이전트 그래서 인텔리전트 에이전트를 구현할 수 있는 에이전트. 룩업 테이블은 인텔리전트도 인텔리전트만 굉장히 심플하게 한 거잖아요. 그래서 여기서 보면 리플렉스라는 말이 들어와서 리플렉스가 반응을 하는 거거든. 뭔가 그거를 이렇게 반응을 한 거죠. 그래서 심플 리플렉스, 리플렉스, 골 베이스트, 유틸리티 베이스트, 심플 리플렉스, 모델 베이스트 해서 이 4가지가 인텔리전트 에이전트에서 구현할 수 있고

00:44:02

뭔가 이렇게 좋은 결과를 줄 수 있는 이 네 가지 타입이 됩니다. 이게 기본형이 되겠습니다. 여기서 룩업 테이블 같은 경우도 이게 좋긴 한데 이거는 어떻게 보면 테이블 드리블은 에이전트를 완벽하게 하기 전에 그냥 심플하게 한번 생각을 해본 건데 했더니 이러이러한 어마어마한 문제 때문에 불가능하다는 걸 알았고 그래서 이거를 레셔널하게 우리가 원하는 레셔널하게 풀기 위한 전략으로 좀 고민한 게 바로 이 네 가지가 되겠습니다. 그래서 지금부터는 이 네 가지 타입을 설명을 할 것이고요. 이 네 가지가 결국은 인텔리전트 에이전트 시스템의 중요한 요소 기술이 되겠습니다. 그래서 이거는 시험에 여러분 우리 중간고사하는 필기 시험을 볼 건데요.

00:44:36

어 어 뭐 온라인 필기 시험이 될 것 같긴 한데 지금 그 정확하게 시험 방식은 아직 여러분한테 공지를 아직 안 했습니다 가능하면 오프라인으로 어딘가에 모여서 했으면 좋겠는데 강의실이 지금 우리가 80명 90명 정도 되는데 이 학생이 들어갈 만한 공간이 없다 그래서 그러는데 뭐 가능하면 한 번이라도 여러분 얼굴도 봐야 되기 때문에 모여서 있으면 하는 생각도 좀 들긴 들어요 그래서 일단은 시험 기간 중에 다시 공지를 하겠습니다

00:45:12

어쨌든 지금 내가 얘기하는 이유는 뭐냐면 이런 인텔리전트 에이전트를 구현하는 에이전트 타입 네 가지가 무엇이냐고 시험에 이건 분명히 나옵니다. 이 네 가지는 이거는 매우 중요하고요. 매우 중요하기 때문에 이거는 여러분 반드시 알아봐야 되고 원서도 반드시 읽어봐야 돼요. 그래서 첫 번째 심플 리플렉스 에이전트에 대한 설명을 하도록 하겠습니다. 심플 리플렉스 에이전트는 그림 2-9에 지금 설명이 돼 있어요. 그래서 예를 보면 그 에이전트가 센서에 취해 인바이로먼트 있죠. 이 그림 어디서 봤나요.

00:45:25

우리 그림 여기 책에서 보면 제일 처음에 설명을 했어요. 에이전트가 있어서 환경으로부터 퍼셉트 퍼셉트에서 센서를 통해서 퍼셉트 한 다음에 액취에이터를 통해서 바깥으로 내보내요. 그렇죠?