smai.aismai.ai
API 文档

Responses API

推理模型专用 API 端点

概述

Responses API 是专为推理模型设计的端点,支持 OpenAI 的 o 系列模型和其他推理类模型。

POST https://api.smai.ai/v1/responses

必须使用此端点的模型

以下模型必须使用 Responses API: - gpt-5.2-pro - o3-pro - o3-mini - o1-pro - o1-mini - 其他推理类模型

与 Chat Completions 的区别

特性Chat CompletionsResponses API
端点/v1/chat/completions/v1/responses
适用模型通用模型推理模型
推理过程不可见可选择显示
响应格式标准格式扩展格式

请求参数

参数类型必填说明
modelstring推理模型名称
inputstring/array输入内容
reasoningobject推理配置
max_output_tokensinteger最大输出 Token
streamboolean是否流式输出

请求示例

curl https://api.smai.ai/v1/responses \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-your-api-key" \
  -d '{
    "model": "o3-pro",
    "input": "解释量子纠缠的原理",
    "reasoning": {
      "effort": "high"
    }
  }'

推理配置

reasoning 参数用于控制推理行为:

{
  "reasoning": {
    "effort": "high", // 推理努力程度: low, medium, high
    "summary": "auto" // 是否返回推理摘要: auto, always, never
  }
}

effort 参数

说明适用场景
low快速推理简单问题
medium平衡模式一般问题
high深度推理复杂问题

响应格式

{
  "id": "resp-xxx",
  "object": "response",
  "created": 1234567890,
  "model": "o3-pro",
  "output": [
    {
      "type": "message",
      "content": "量子纠缠是一种量子力学现象..."
    }
  ],
  "usage": {
    "input_tokens": 10,
    "output_tokens": 500,
    "reasoning_tokens": 1000,
    "total_tokens": 1510
  }
}

支持的模型

模型说明
gpt-5.2-proOpenAI 最新推理模型
o3-proOpenAI o3 专业版
o3-miniOpenAI o3 轻量版
o1-proOpenAI o1 专业版
o1-miniOpenAI o1 轻量版

注意事项

Token 消耗

推理模型会消耗额外的 reasoning_tokens,这部分也会计入费用。

响应时间

推理模型的响应时间通常比普通模型更长,特别是在 effort: high 模式下。

目录