RollerAgent의 Inspector 설정

 

 

behaviors:
  RollerBall:
    trainer_type: ppo
    hyperparameters:
      batch_size: 10
      buffer_size: 100
      learning_rate: 3.0e-4
      beta: 5.0e-4
      epsilon: 0.2
      lambd: 0.99
      num_epoch: 3
      learning_rate_schedule: linear
      beta_schedule: constant
      epsilon_schedule: linear
    network_settings:
      normalize: false
      hidden_units: 128
      num_layers: 2
    reward_signals:
      extrinsic:
        gamma: 0.99
        strength: 1.0
    max_steps: 500000
    time_horizon: 64
    summary_freq: 10000

Config 폴더 안에 텍스트 파일을 만들어서 위의 내용 입력 후,

 

rollerball_config.yaml

 

로 저장

 

학습을 위해 명령 프롬프트에서 

 

mlagents-learn config/rollerball_config.yaml --run-id=RollerBall

 

입력 및 실행

 

훈련이 진행 되는 과정

 

 

위와 같이 훈련을 종료하고, onnx 파일 생성

 

 

생성된 onnx 파일 확인

 

 

Project로 생성된 onnx 파일을 이동

 

 

RollerAgent - Behavior Parametes의 Model에 가져온 onnx 파일을 드래그 앤 드랍

 

 

 

훈련 결과 및 동작 테스트

 

+ Recent posts