OpenResponses Gateway 集成计划

背景

Clawdbot Gateway 目前在 /v1/chat/completions 暴露了一个最小的 OpenAI 兼容聊天补全端点（见 OpenAI 聊天补全）。

Open Responses 是基于 OpenAI Responses API 的开放推理标准。它专为 agent 工作流设计，使用基于项的输入和语义流式事件。OpenResponses 规范定义 /v1/responses，而非 /v1/chat/completions。

来源：OpenResponses OpenAPI、OpenResponses 规范站点和 Hugging Face 博客文章。

提取的关键点：

POST /v1/responses 接受 CreateResponseBody 字段，如 model、input（字符串或 ItemParam[]）、instructions、tools、tool_choice、stream、max_output_tokens 和 max_tool_calls。
ItemParam 是一个可区分联合：
- 带有角色 system、developer、user、assistant 的 message 项
- function_call 和 function_call_output
- reasoning
- item_reference
成功的响应返回带有 object: "response"、status 和 output 项的 ResponseResource。
流式使用语义事件，例如：
- response.created、response.in_progress、response.completed、response.failed
- response.output_item.added、response.output_item.done
- response.content_part.added、response.content_part.done
- response.output_text.delta、response.output_text.done
规范要求：
- Content-Type: text/event-stream
- event: 必须匹配 JSON type 字段
- 终端事件必须是字面量 [DONE]
推理项可能暴露 content、encrypted_content 和 summary。
HF 示例在请求中包含 OpenResponses-Version: latest（可选标头）。

添加 src/gateway/open-responses.schema.ts，仅包含 Zod 架构（无 gateway 导入）。
添加 src/gateway/openresponses-http.ts（或 open-responses-http.ts）用于 /v1/responses。
保持 src/gateway/openai-http.ts 完整，作为传统兼容适配器。
添加配置 gateway.http.endpoints.responses.enabled（默认 false）。
保持 gateway.http.endpoints.chatCompletions.enabled 独立；允许两个端点分别切换。
当聊天补全启用时，发出启动警告以表示传统状态。

为支持的子集实现 Zod 架构：
- CreateResponseBody
- ItemParam + 消息内容部分联合
- ResponseResource
- Gateway 使用的流式事件形状
将架构保存在单个隔离模块中，以避免漂移并允许未来的代码生成。

为 /v1/responses 添加 e2e 覆盖：
- 需要身份验证
- 非流式响应形状
- 流式事件排序和 [DONE]
- 使用标头和 user 的会话路由
保持 src/gateway/openai-http.e2e.test.ts 不变。
手动：使用 stream: true curl 到 /v1/responses 并验证事件排序和终端 [DONE]。