ML-Agent를 이용한 펭귄 학습시키기 (Reinforcement Learning Penguins)

Kastro777 2024. 5. 8. 14:41

2024. 5. 8. 14:41

학습을 위한 씬 세팅

빠른 학습을 위해 9개로 늘려준다.

ml-agent를 실행하기 위한 파일 생성 (Penguin-yaml)

코드는 아래와 같이 작성한다.

behaviors:
    Penguin:
        trainer_type: ppo
        hyperparameters:
            batch_size: 128
            buffer_size: 2048
            learning_rate: 0.0003
            beta: 0.01
            epsilon: 0.2
            lambd: 0.95
            num_epoch: 3
            learning_rate_schedule: linear
        network_settings:
            normalize: false
            hidden_units: 256
            num_layers: 2
            vis_encode_type: simple
        reward_signals:
            extrinsic:
                gamma: 0.99
                strength: 1.0
        keep_checkpoints: 5
        max_steps: 1000000
        time_horizon: 128
        summary_freq: 5000
        threaded: true

Penguin-yaml