Skip to main content

在 Hugging Face 使用 RL-Baselines3-Zoo

rl-baselines3-zoo 是一个使用 Stable Baselines3 的强化学习训练框架。

在 Hub 上探索 RL-Baselines3-Zoo

你可以通过在模型页面左侧筛选来找到 RL-Baselines3-Zoo 模型。

Stable-Baselines3 团队托管了 150+ 个经过训练的强化学习智能体集合，包含调优的超参数，你可以在这里找到。

Hub 上的所有模型都配备了有用的功能：

自动生成的模型卡片，包含描述、训练配置等。
有助于可发现性的元数据标签。
评估结果以与其他模型进行比较。
一个视频小部件，你可以观看智能体的表现。

使用现有模型

你可以使用 load_from_hub 简单地从 Hub 下载模型：

# Download ppo SpaceInvadersNoFrameskip-v4 model and save it into the logs/ folder
python -m rl_zoo3.load_from_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 -f logs/ -orga sb3
python enjoy.py --algo dqn --env SpaceInvadersNoFrameskip-v4  -f logs/

你可以定义三个参数：

--repo-name：仓库名称。
-orga：Hugging Face 用户名或组织。
-f：目标文件夹。

分享你的模型

你可以使用 push_to_hub 轻松上传模型。这将保存模型、评估它、生成模型卡片并录制智能体的重放视频，然后将完整的仓库推送到 Hub。

python -m rl_zoo3.push_to_hub  --algo dqn  --env SpaceInvadersNoFrameskip-v4  --repo-name dqn-SpaceInvadersNoFrameskip-v4  -orga ThomasSimonini  -f logs/

你可以定义三个参数：

--repo-name：仓库名称。
-orga：你的 Hugging Face 用户名。
-f：保存模型的文件夹。

其他资源

RL-Baselines3-Zoo 官方训练模型
RL-Baselines3-Zoo 文档

在 Hub 上探索 RL-Baselines3-Zoo
使用现有模型
分享你的模型
其他资源