학습을 위한 씬 세팅

 

 

빠른 학습을 위해 9개로 늘려준다.

 

 

ml-agent를 실행하기 위한 파일 생성 (Penguin-yaml)

 

코드는 아래와 같이 작성한다.

 

behaviors:
    Penguin:
        trainer_type: ppo
        hyperparameters:
            batch_size: 128
            buffer_size: 2048
            learning_rate: 0.0003
            beta: 0.01
            epsilon: 0.2
            lambd: 0.95
            num_epoch: 3
            learning_rate_schedule: linear
        network_settings:
            normalize: false
            hidden_units: 256
            num_layers: 2
            vis_encode_type: simple
        reward_signals:
            extrinsic:
                gamma: 0.99
                strength: 1.0
        keep_checkpoints: 5
        max_steps: 1000000
        time_horizon: 128
        summary_freq: 5000
        threaded: true

Penguin-yaml

 

 

훈련이 진행되는 과정

 

 

훈련 과정 - 완료 - 

 

 

생성된 onnx 파일 확인

 

 

onnx 파일을 Assets 폴더에 드래그 앤 드롭 한 뒤, Agent 오브젝트의 Behavior Parameters - Model에 등록

 

 

씬 실행으로 훈련된 모델 확인

 

무사히 잘 수행한다.

 

+ Recent posts