잘 배우고, 잘 익히기 2021. 3. 21. 07:58

ㅇ 개념

정의 특징
모든 트리 노드를 대상으로 하는 대신 게임 시뮬레이션을 통해 가장 가능성이 높아보이는 방향으로 행동을 결정하는 탐색 방법 - 최대-최소 알고리즘
- 확률적 탐색

  

ㅇ 처리 구조 및 연산 과정

선택 확장 시뮬레이션 역전파
특정 경로수 읽기 진행 한 단계 더 착수지점 예측(트리 확장) 무작위 진행 한 단계 더 착수 승산 역전파로 승산 갱신

  - 정책 : 트리 폭을 제한, 확장에서 주로 사용

  - 가치 : 트리 깊이 제한, 현재의 승산

ㅇ 활용 

    - 알파고 : 이세돌 9단과의 바둑 대국 

    - ARK : 테슬라 주가 예측 (github)