认证相关
如何获取 API Key?
如何获取 API Key?
- 访问 Wolian AI 客户端管理
- 使用你的账户登录
- 点击”+ 创建”按钮创建新的客户端
- 确保密钥状态为”已激活”(绿色标识)
- 点击复制按钮,复制并安全保存 API Key
API Key 泄露了怎么办?
API Key 泄露了怎么办?
如果怀疑 API Key 泄露,请立即: 1. 在 Wolian AI 平台 中撤销该密钥 2. 创建新的 API
Key 并激活 3. 更新所有使用旧 Key 的应用 4. 监控账户使用情况是否异常
为什么一直返回 401 错误?
为什么一直返回 401 错误?
常见原因:
- API Key 格式错误(检查是否包含
Bearer前缀) - API Key 已过期或被撤销
- 请求头中缺少
Authorization字段 - 使用了错误的环境变量名
模型与工具
如何查看我可以使用哪些模型?
如何查看我可以使用哪些模型?
调用 返回你账户可访问的所有模型列表。
GET /api/v1/models 端点:为什么某个模型返回 403 错误?
为什么某个模型返回 403 错误?
可能原因:
- 该模型不在你的许可列表中
- 账户权限不足
- 模型 ID 拼写错误
- 使用
GET /api/v1/models查看可用模型 - 联系销售团队申请权限
- 检查模型 ID 是否正确(区分大小写)
如何启用工具调用?
如何启用工具调用?
在请求中添加 查看可用工具:
allowedTools 数组,并提供必要的上下文:启用工具示例
查看工具列表
工具需要哪些上下文?
工具需要哪些上下文?
每个工具的
requiredContext 不同:- zhipin_reply_generator: 需要
configData和replyPrompts✅ 推荐用于业务场景 - bash: 需要
sandboxId(E2B 沙盒环境)⚠️ 一般不推荐使用
GET /api/v1/tools 查看每个工具的具体要求。工具调用是如何工作的?
工具调用是如何工作的?
如何查看工具执行的中间过程?
如何查看工具执行的中间过程?
功能使用
流式输出和非流式输出有什么区别?
流式输出和非流式输出有什么区别?
| 特性 | 流式 (stream: true) | 非流式 (stream: false) |
|---|---|---|
| 响应方式 | 实时逐字返回 | 一次性返回完整内容 |
| 用户体验 | 打字机效果,感知更快 | 需要等待完整生成 |
| 适用场景 | 聊天界面、交互应用 | 后台处理、批量任务 |
| Token 计费 | 相同 | 相同 |
什么时候应该使用消息剪裁?
什么时候应该使用消息剪裁?
建议在以下情况启用消息剪裁:
- 对话轮次超过 20 轮
- 历史消息包含大量重复信息
- 需要优化成本
- 遇到上下文长度限制
- 短对话(< 10 轮)
- 需要完整历史信息的任务
- 关键业务对话
如何自定义系统提示词?
如何自定义系统提示词?
三种方式:方式 1:直接指定(推荐)✅ 最简单,直接覆盖 system prompt方式 2:使用 promptType + context.systemPrompts✅
promptType 同时决定工具集和 system prompt✅ 适合多场景管理方式 3:使用默认值
不设置任何参数,使用 "You are a helpful AI assistant."详见系统提示词文档promptType 有什么作用?
promptType 有什么作用?
promptType 有两个独立的作用:1. 决定工具集(内置、强制)- 通过内置的
PROMPT_TOOL_MAPPING自动启用对应工具 - 例如:
bossZhipinSystemPrompt自动启用招聘相关工具
- 从
context.systemPrompts[promptType]查找提示词文本 - 如果没有提供
context.systemPrompts,使用默认 system prompt
promptType:性能与成本
如何降低 API 调用成本?
如何降低 API 调用成本?
立即生效的方法:
- 启用消息剪裁(节省 40-70%)
- 使用成本更低的模型(如 Qwen Plus)
- 精简系统提示词
- 实现结果缓存
- 监控 Token 使用情况
- 批量处理请求
- 仅在必要时启用工具
- 定期审查和优化提示词
为什么响应很慢?
为什么响应很慢?
可能原因:
- 输入消息太长(检查 Token 数量)
- 启用了多个复杂工具
- 网络延迟
- 服务端负载高
- 启用消息剪裁
- 减少不必要的工具
- 使用流式输出改善用户体验
- 检查网络连接
速率限制是多少?
速率限制是多少?
默认限制:
- 每秒请求数 (RPS): 10
- 每分钟请求数 (RPM): 500
- 并发请求数: 5
429 Too Many Requests 错误。如需更高限额,请联系销售团队。错误处理
收到 400 BadRequest 错误
收到 400 BadRequest 错误
常见原因:
- 请求参数格式错误
- 缺少必需的工具上下文
- 无效的
promptType
- 检查错误消息中的
details字段 - 使用
validateOnly: true预检查配置 - 查看 API 文档确认参数格式
收到 429 RateLimitExceeded 错误
收到 429 RateLimitExceeded 错误
说明超过了速率限制。解决方法:
如何追踪和报告问题?
如何追踪和报告问题?
每个响应都包含 向技术支持报告问题时,请提供:
correlationId:- correlationId
- 请求时间
- 错误消息
- 请求参数(不要包含 API Key)
集成与开发
支持哪些编程语言?
支持哪些编程语言?
花卷智能体 API 是标准的 REST API,支持所有能发送 HTTP 请求的编程语言:
- JavaScript/TypeScript (Node.js, Browser)
- Python
- Java
- Go
- Ruby
- PHP
- C#/.NET
- 等等…
如何在 React 中集成?
如何在 React 中集成?
如何处理长时间运行的请求?
如何处理长时间运行的请求?
建议:
- 使用流式输出,可以实时看到进度
- 设置合理的超时时间(建议 60-120 秒)
- 实现重试机制
- 向用户显示加载状态

