跳到主要内容

Disk usage on Spaces

每个 Space 都会附带一小块磁盘空间。该空间是临时的(ephemeral),这意味着当 Space 重启或被停止时,其中的内容会丢失。
如果你需要让数据在 Space 生命周期之外继续存在,可以:

Persistent storage

你可以在 Settings 标签页为 Space 升级持久磁盘空间。

Spaces Storage SettingsSpaces Storage Settings

你可以根据需要选择不同的存储等级,从而获得在 Space 重启后仍然保留内容的磁盘空间。

持久存储会作为挂载在 /data 上的传统磁盘使用。

也就是说,你可以在 Space 中像操作普通硬盘或 SSD 一样对该路径进行 读写

持久磁盘空间可以随时升级到更高等级,但不能降级到更低等级。如果你希望使用更小的持久存储,需要先删除当前(更大)的存储。

如果你在使用 Hugging Face 的开源库,可以通过将 HF_HOME 环境变量设置为 /data/.huggingface 来加快 Space 的重启速度。transformersdiffusersdatasets 等库都会使用这个环境变量缓存从 Hugging Face Hub 下载的各种资源。将其指向持久存储路径,可以避免 Space 重启后重新下载缓存资源。

注意

注意:删除存储时,其中所有数据都会被清空。

Persistent storage 规格

以下是各存储等级的规格:

Tier磁盘空间持久化每月价格
Free tier50GBNo (ephemeral)Free!
Small20GBYes$5
Medium150 GBYes$25
Large1TBYes$100

Billing

Spaces 的计费基于硬件使用时间,并按分钟计算:只要 Space 在所选择的硬件上处于运行状态,你就会被计费,与是否有访问无关。

持久存储升级在删除前都会持续计费,即使 Space 不在运行或处于非运行状态也一样。

更多关于计费的信息,请参阅 Hub 级计费章节

Dataset storage

如果你需要数据存在的时间长于 Space 本身的生命周期,可以考虑使用 dataset 仓库

这里有一个持久化的示例 Space:space_to_dataset_saver,它使用 huggingface_hub 以编程方式向数据集仓库上传文件。这个 Space 示例以及这篇指南可以帮助你评估哪种方案更适合你的数据类型。

要了解如何以编程方式与数据集仓库交互,请参阅 datasets文档以及 huggingface_hub 客户端库 文档。