behaviors:
RollerBall:
trainer_type: ppo
hyperparameters:
batch_size: 10
buffer_size: 100
learning_rate: 3.0e-4
beta: 5.0e-4
epsilon: 0.2
lambd: 0.99
num_epoch: 3
learning_rate_schedule: linear
beta_schedule: constant
epsilon_schedule: linear
network_settings:
normalize: false
hidden_units: 128
num_layers: 2
reward_signals:
extrinsic:
gamma: 0.99
strength: 1.0
max_steps: 500000
time_horizon: 64
summary_freq: 10000
Config 폴더 안에 텍스트 파일을 만들어서 위의 내용 입력 후,
rollerball_config.yaml
로 저장
학습을 위해 명령 프롬프트에서
mlagents-learn config/rollerball_config.yaml --run-id=RollerBall
입력 및 실행
훈련이 진행 되는 과정
위와 같이 훈련을 종료하고, onnx 파일 생성
생성된 onnx 파일 확인
Project로 생성된 onnx 파일을 이동
RollerAgent - Behavior Parametes의 Model에 가져온 onnx 파일을 드래그 앤 드랍
훈련 결과 및 동작 테스트

반응형
'산대특 > 게임 인공지능 프로그래밍' 카테고리의 다른 글
ML-Agent를 이용한 FlappyBird 학습시키기 (0) | 2024.05.14 |
---|