在网页中嵌入数据集查看器
你可以使用 iframe 在自己的网页中嵌入数据集查看器。
使用的 URL 是 https://huggingface.co/datasets/<namespace>/<dataset-name>/embed/viewer,其中 <namespace> 是数据集的所有者(用户或组织),<dataset-name> 是数据集的名称。你还可以传递其他参数,如子集、切分、筛选、搜索或选中的行。
例如,以下 iframe 嵌入了来自 nyu-mll 组织的 glue 数据集的数据集查看器:
<iframe
src="https://huggingface.co/datasets/nyu-mll/glue/embed/viewer"
frameborder="0"
width="100%"
height="560px"
></iframe>
你也可以直接从数据集查看器界面获取嵌入代码。点击数据集查看器右上角的 Embed 按钮:


它将打开一个包含 iframe 代码的模态框,你可以复制并粘贴到网页中:


参数
数据集查看器页面的所有参数也可以通过将它们添加到 iframe URL 传递给嵌入式查看器(筛选、搜索、特定切分等)。例如,要在 nyu-mll/glue 数据集的 rte 子集的 test 切分中显示对 mangrove 的搜索结果,可以使用以下 URL:
<iframe
src="https://huggingface.co/datasets/nyu-mll/glue/embed/viewer/rte/split?search=mangrove"
frameborder="0"
width="100%"
height="560px"
></iframe>
你可以通过执行搜索,点击 ⋮ 按钮,然后点击 Embed,直接从数据集查看器界面获取此代码:


它将打开一个包含 iframe 代码的模态框,你可以复制并粘贴到网页中:


示例
嵌入式数据集查看器在多个机器学习和平台中用于显示数据集。以下是一些示例。
如果你想出现在此部分,请开启一个拉取请求!
工具:ZenML
htahir1 分享了一篇博客文章,展示了如何使用 ZenML 与数据集查看器的集成在 ZenML 管道中可视化 Hugging Face 数据集。


工具:Metaflow + Outerbounds
eddie-OB 在演示视频中展示了如何在 Outerbounds 上的 Metaflow 卡片中包含数据集查看器。
工具:AutoTrain
abhishek 在演示视频中展示了数据集查看器如何集成到 AutoTrain 中。
数据集:Alpaca 风格数据集画廊
davanstrien 在空间中展示了Alpaca 风格数据集集合。
数据集:Docmatix
andito 在宣布发布 Docmatix(一个用于文档视觉问答(DocVQA)的大型数据集)的博客文章中使用了嵌入式查看器。
应用:Electric Vehicle Charge Finder
cfahlgren1 在Electric Vehicle Charge Finder 应用中嵌入了数据集查看器。