728x90 반응형 한번 전체적으로 읽었는데, 요약은 더 걸릴거 같다.. PPO라는 강화학습 방식을 사용했다는데, 구현까지 꽤나 오래 걸릴것 같다. 공유하기 게시글 관리 ideaDummy 저작자표시 비영리