RL 대회 참가하는 친구를 위해 만든 자료

NC 대회 전략.pdf (477.7 KB)

NC Fellowship이라는 대학생 동아리 대회가 있습니다
저도 1회 당시 참여했었는데요,

친구도 여기에 참여한다고 해서 도와주기 위해
참여 당시의 경험을 생각하며 만든 자료입니다

만들고보니 내용이 괜찮게 나와서 공유!


pdf로 만드니 하이퍼링크가 사라져서 추가합니당
Intrinsic Reward: RL - Intrinsic Motivation | Khanrc’s blog
RIDE: Rewarding impact-driven exploration for procedurally-generated environments. (tistory.com)
NGU: NEVER GIVE UP: LEARNING DIRECTED EXPLORATION STRATEGIES (tistory.com)
SMiRL: Surprise Minimizing Reinforcement Learning(SMiRL) (tistory.com)

5 Likes

인공지능의 학습과 관련된 자료들이군요. 전공 분야는 아니지만 흥미롭게 읽었습니다.
인공지능이 설계자의 의도대로 움직이게 하기 위한 행동 동기를
보너스라고 일괄적으로 명칭하는 부분이 꽤 재미있었습니다.
논문 소개를 쭉 읽다보니 행동 동기를 설정하기 위한 설계자의
메타 인지 능력이 굉장히 중요하다는 생각이 들었습니다.
논문에서 소개된 게임은 다음 스테이지로 진행 할 수 있는 길을 획득하는 것이 보너스로 취급되고 있지요.
RPG 게임들 중에서는 함정 루트가 있는 게임들도 왕왕 있습니다.
이 경우에는 루트를 진행하면서 감소된 HP와 회복 아이템의 소모가 얼마나 적은지가 보너스가 될 수도 있겠다고 봅니다.
많은 생각이 들지만 일단 정리되는 것은 여기까지네요. 유익한 글 감사드립니다.

제가 관심있는 분야는 아니지만, 좋은 자료 고맙읍니다!

:+1: