跳到主要内容

在网页中嵌入数据集查看器

你可以使用 iframe 在自己的网页中嵌入数据集查看器。

使用的 URL 是 https://huggingface.co/datasets/<namespace>/<dataset-name>/embed/viewer,其中 <namespace> 是数据集的所有者(用户或组织),<dataset-name> 是数据集的名称。你还可以传递其他参数,如子集、切分、筛选、搜索或选中的行。

例如,以下 iframe 嵌入了来自 nyu-mll 组织的 glue 数据集的数据集查看器:

<iframe
src="https://huggingface.co/datasets/nyu-mll/glue/embed/viewer"
frameborder="0"
width="100%"
height="560px"
></iframe>

你也可以直接从数据集查看器界面获取嵌入代码。点击数据集查看器右上角的 Embed 按钮:

数据集查看器嵌入按钮数据集查看器嵌入按钮

它将打开一个包含 iframe 代码的模态框,你可以复制并粘贴到网页中:

数据集查看器嵌入按钮数据集查看器嵌入按钮

参数

数据集查看器页面的所有参数也可以通过将它们添加到 iframe URL 传递给嵌入式查看器(筛选、搜索、特定切分等)。例如,要在 nyu-mll/glue 数据集的 rte 子集的 test 切分中显示对 mangrove 的搜索结果,可以使用以下 URL:

<iframe
src="https://huggingface.co/datasets/nyu-mll/glue/embed/viewer/rte/split?search=mangrove"
frameborder="0"
width="100%"
height="560px"
></iframe>

你可以通过执行搜索,点击 按钮,然后点击 Embed,直接从数据集查看器界面获取此代码:

数据集查看器嵌入按钮数据集查看器嵌入按钮

它将打开一个包含 iframe 代码的模态框,你可以复制并粘贴到网页中:

数据集查看器嵌入按钮数据集查看器嵌入按钮

示例

嵌入式数据集查看器在多个机器学习和平台中用于显示数据集。以下是一些示例。

如果你想出现在此部分,请开启一个拉取请求

工具:ZenML

htahir1 分享了一篇博客文章,展示了如何使用 ZenML 与数据集查看器的集成在 ZenML 管道中可视化 Hugging Face 数据集。

数据集查看器嵌入按钮数据集查看器嵌入按钮

工具:Metaflow + Outerbounds

eddie-OB演示视频中展示了如何在 Outerbounds 上的 Metaflow 卡片中包含数据集查看器。

工具:AutoTrain

abhishek演示视频中展示了数据集查看器如何集成到 AutoTrain 中。

数据集:Alpaca 风格数据集画廊

davanstrien空间中展示了Alpaca 风格数据集集合

数据集:Docmatix

andito 在宣布发布 Docmatix(一个用于文档视觉问答(DocVQA)的大型数据集)的博客文章中使用了嵌入式查看器。

应用:Electric Vehicle Charge Finder

cfahlgren1Electric Vehicle Charge Finder 应用嵌入了数据集查看器。

应用:Masader - 阿拉伯语 NLP 数据目录

ZaidMasader - 阿拉伯语 NLP 数据目录展示了数据集查看器。