跳到主要内容

数据集概览

Hub 上的数据集

Hugging Face Hub 托管着海量由社区整理的数据集,涵盖翻译、自动语音识别、图像分类等多种任务。除了数据集卡片提供的说明外,许多数据集(如 GLUE)还配有数据集查看器,用于展示数据内容。

每个数据集都是一个Git 仓库,其中包含生成训练、验证和测试切分所需的数据。关于数据集仓库的结构,请参阅数据文件配置页面。遵循支持的仓库结构可确保 Hub 上的数据集页面显示 Viewer。

搜索数据集

与模型和 Space 一样,你可以通过顶部导航的搜索栏或数据集主页搜索 Hub 上的数据集。你可以按语言、任务、许可证等多种条件筛选,快速找到符合需求的数据集。

数据集搜索数据集搜索

隐私

由于数据集是仓库,你可以在 Settings 标签中将其可见性在私有与公开之间切换。如果数据集归属于某个组织,隐私设置同样适用于组织的所有成员。