IT/AItudy

ChatGPT 활용) Reward-Based Learning 게임을 만들어보자.

참치김밥B 2025. 3. 5. 21:32

 

유튜브를 보던 중 AI Warehouse 채널을 보고 흥미가 생겼다.

 

AI에게 자율성을 부여하고 마음대로 움직이는 대신 특정 행동을 통해 보상을 줌 으로써

학습을 통해 AI가 시간이 갈수록 성장하는 과정을 영상으로 편집한 영상이 전부이다.

 

영상의 업로드 주기가 긴 것을 보면 하나의 영상 당 소요되는 시간은 많이 소요되는 것으로 보이지만

8개 남짓한 영상으로 60만명의 구독자가 있다.

 

점점 성장하는 AI를 보며 단순히 보는 것 만으로도 재미가 있었고

나도 이런 저런 작업을 수행하도록 설정하고 성장하는 AI를 만들어보고 싶다는 생각이 들었다.

 

 

금방 지칠 것 같기에 더 진행이 될 것 같아도 최대 2시간만 하려고 한다.

이 카테고리는 그로인해 시작되는 기록이며 설치, 세팅, 개발, 디버깅 등의 모든 작업은 ChatGPT로 진행한다.

 

그럼 시작이다.

 

 

 

 

저 채널처럼 AI를 학습시키고 싶으나, 어떤 툴로 어떻게 시작해야 하는지 조차 모르니 GPT의 도움을 우선 받는다.

 

AI Warehouse 채널의 영상들은

RB(Reward-Based) Learning 게임이라고 하며

 

보상을 최대화하는 방향으로 AI가 스스로 학습하는 기법이라고 한다.

 

GPT가 추천해준 해당 RB 게임들 중 "퍼즐 AI문제를 해결하는 최적의 방법 찾기"를 목표로 우선 진행해보자.

 

 

3001 x 3001의 미로를 만들었고, A* 알고리즘으로 탐색을 한다고 한다 ...

알고리즘은 자세히 보지 않았고, 나중에 필요하면 공부 해 보겠다.

 

15초정도 걸렸는데 많이 복잡한 것 치고는 얼마 안 걸린 것 같기도 하다.

 

 

 

 

 

추가로 3D 미로로 구현해서 해보았다.

 

 

 

 

 

 

대학생때는 몇주가 걸려도 힘들었을 내용인데 GPT로 10분도 안되서 뚝딱 만들어버린다 .. 

 

회사에서도 느끼지만 데이터는 컴퓨터가 처리하고 번뜩이는 아이디어 싸움인데,

 

이런 새로운 걸 창조해내는 역할 또한 조만간 처리해주지 않을까 싶다. 

 

 

 

 

 

unity로 구현하는게 좀 더 좋을 것 같아서

unity를 설치하고 간단한 몇가지 세팅을 해주고 오늘은 끝을 내자.

 

 

 

 

이렇게 3D로 구현된 미로까지 만들었다.