ITPE metacog
MCTS
잘 배우고, 잘 익히기
2021. 3. 21. 07:58
ㅇ 개념
정의 | 특징 |
모든 트리 노드를 대상으로 하는 대신 게임 시뮬레이션을 통해 가장 가능성이 높아보이는 방향으로 행동을 결정하는 탐색 방법 | - 최대-최소 알고리즘 - 확률적 탐색 |
ㅇ 처리 구조 및 연산 과정
선택 | 확장 | 시뮬레이션 | 역전파 |
특정 경로수 읽기 진행 | 한 단계 더 착수지점 예측(트리 확장) | 무작위 진행 | 한 단계 더 착수 승산 역전파로 승산 갱신 |
- 정책 : 트리 폭을 제한, 확장에서 주로 사용
- 가치 : 트리 깊이 제한, 현재의 승산
ㅇ 활용
- 알파고 : 이세돌 9단과의 바둑 대국
- ARK : 테슬라 주가 예측 (github)