推理提供商

Hugging Face 的模型页面为数千个模型提供按需付费的推理服务，因此你可以直接在浏览器中试用它们。该服务由推理提供商提供支持，并包含免费层级。

推理提供商为开发者提供简化的、统一的访问数百个机器学习模型的途径，由最佳的无服务器推理合作伙伴提供支持。👉 有关完整文档，请访问推理提供商文档。

Hub 上的推理提供商

推理提供商与 Hugging Face Hub 深度集成，你可以通过以下几种方式使用它：

交互式小部件 - 在模型页面上使用交互式小部件直接测试模型，这些小部件在底层使用推理提供商。查看 DeepSeek-R1-0528 模型页面作为示例。
推理 Playground - 使用你的提示轻松测试和比较聊天完成模型。查看推理 Playground开始使用。
搜索 - 在模型页面上按推理提供商筛选模型，以查找通过特定提供商可用的模型。
Data Studio - 使用 AI 探索 Hub 上的数据集。在你喜欢的数据集上查看 Data Studio。

使用推理提供商构建

你可以使用我们的 SDK 或 HTTP 客户端将推理提供商集成到你自己的应用程序中。以下是 Python 和 JavaScript 的快速入门，更多详细信息，请查看推理提供商文档。

你可以使用我们的 Python SDK 与推理提供商交互。

from huggingface_hub import InferenceClient

import os

client = InferenceClient(
    api_key=os.environ["HF_TOKEN"],
    provider="auto",   # 自动选择最佳提供商
)

# 聊天完成
completion = client.chat.completions.create(
    model="deepseek-ai/DeepSeek-V3-0324",
    messages=[{"role": "user", "content": "A story about hiking in the mountains"}]
)

# 图像生成
image = client.text_to_image(
    prompt="A serene lake surrounded by mountains at sunset, photorealistic style",
    model="black-forest-labs/FLUX.1-dev"
)

或者，你可以直接使用 OpenAI API 兼容客户端。

import os
from openai import OpenAI

client = OpenAI(
    base_url="https://router.huggingface.co/v1",
    api_key=os.environ["HF_TOKEN"],
)

completion = client.chat.completions.create(
    model="deepseek-ai/DeepSeek-V3-0324",
    messages=[
        {
            "role": "user",
            "content": "A story about hiking in the mountains"
        }
    ],
)

注意

OpenAI API 兼容客户端不支持图像生成。

你可以使用我们的 JavaScript SDK 与推理提供商交互。

import { InferenceClient } from "@huggingface/inference";

const client = new InferenceClient(process.env.HF_TOKEN);

const chatCompletion = await client.chatCompletion({
    provider: "auto",  // 自动选择最佳提供商  
    model: "deepseek-ai/DeepSeek-V3-0324",
    messages: [{ role: "user", content: "Hello!" }]
});

const imageBlob = await client.textToImage({
  model: "black-forest-labs/FLUX.1-dev",
  inputs:
    "A serene lake surrounded by mountains at sunset, photorealistic style",
});

或者，你可以直接使用 OpenAI API 兼容客户端。

import { OpenAI } from "openai";

const client = new OpenAI({
  baseURL: "https://router.huggingface.co/v1",
  apiKey: process.env.HF_TOKEN,
});

const completion = await client.chat.completions.create({
  model: "meta-llama/Llama-3.1-8B-Instruct",
  messages: [{ role: "user", content: "A story about hiking in the mountains" }],
});

注意

OpenAI API 兼容客户端不支持图像生成。

你需要一个具有推理权限的 Hugging Face 令牌。在设置 > 令牌创建一个。

推理提供商的工作原理

要深入了解推理提供商，请查看推理提供商文档。以下是一些关键资源：

什么是 HF-Inference API？

HF-Inference API 是通过推理提供商可用的提供商之一。它以前被称为"Inference API (serverless)"，在底层由推理端点提供支持。

有关 HF-Inference 提供商的更多详细信息，请查看其专门页面。

Hub 上的推理提供商​

使用推理提供商构建​

推理提供商的工作原理​

什么是 HF-Inference API？​

Hub 上的推理提供商

使用推理提供商构建

推理提供商的工作原理

什么是 HF-Inference API？