AI 生文模型 HTTP 调用超时问题
使用 HTTP 方式调用云开发 AI 生文大模型时,如果未正确设置流式响应,可能会遇到超时问题。
使用 HTTP 方式调用云开发 AI 生文大模型时,如果未正确设置流式响应,可能会遇到超时问题。
在调用云开发 AI 大模型时,可能会遇到 429 Too Many Requests 或 EXCEEDTOKENQUOTA_LIMIT 错误。本文介绍常见原因和解决方案。
云开发 AI 提供的 hunyuan-image 生图模型支持通过文本描述生成图片,本文介绍该模型支持的参数。
Next.js Route Handler 拿到用户上传图片转 base64,调 @cloudbase/node-sdk 的 app.ai().createModel('cloudbase').generateText,用 model: 'deepseek-v4-pro' 传多模态 messages,拿到图片描述/OCR/内容分析结果。覆盖单图、多图、图+文本提问。
用 @cloudbase/node-sdk 在 Next.js Route Handler 调 CloudBase AI streamText,把 AsyncIterable 转 ReadableStream 给前端,Client Component 用 fetch + getReader 消费流式响应。
RN 0.74+ 前端通过 fetch + ReadableStream(或 react-native-fetch-api polyfill / XHR onprogress fallback)消费后端 Route Handler 的流式响应,后端用 @cloudbase/node-sdk 调 streamText,凭证只放服务端,绝不进 JS bundle。
用 wx.cloud.extend.AI 在小程序里直接调 DeepSeek / 混元等 CloudBase 平台模型,流式输出用 for-await 消费 textStream,无需自建后端 LLM 网关。
用 @ai-sdk/codemod 自动迁移 4.x → 6.x,验证 streamText / useChat 兼容性,引入 ToolLoopAgent + tool approval 重写更简洁的版本。
claude mcp add cloudbase -- npx -y @cloudbase/cloudbase-mcp@latest,Claude Code 拿到 36 个 CloudBase tool(数据库 / 云函数 / 静态托管 / 云托管 / 云存储 / 搜索 / AI Agent 等),自然语言一句话从需求到上线整套 CloudBase 应用。
用 @deepgram/sdk 在 CloudBase 云函数里调 nova-3,把 CloudBase 云存储里的音频转成带时间戳/说话人分离的文字,结果写回数据库。
在 CloudBase 云函数里用 @fal-ai/client 调 fal.ai 的 FLUX 模型出图,把图片落到云存储,前端拿临时链接展示。
用 @tavily/core 在 CloudBase 云函数里调 Tavily Search API,把 LLM agent 的实时联网检索能力包装成 HTTP 触发函数,前端/小程序直接调,key 不进前端。
用 @modelcontextprotocol/sdk + Hono 写一个支持 Streamable HTTP transport 的 MCP Server,多阶段 Dockerfile 打包后通过 tcb cloudrun deploy 部署到 CloudBase 云托管,Cursor / Claude Code / Windsurf 直接通过 URL 接入。
PDF / 整套代码 / Excel 解析成纯文本,整篇丢进 prompt,调 CloudBase AI streamText({ model: 'deepseek-v4-pro' }) 直接问答,跳过 embedding 和向量库,适合一次性长文档问答场景。
购买 Token 资源包后,如果业务代码里还在使用旧配置(如 hunyuan-exp/hunyuan-v3 和历史模型名),需要完成一次模型迁移,否则可能出现调用失败或模型不生效。
用 Mastra 1.x 写 agent + tool,mastra build 输出 Hono server,多阶段 Dockerfile + tcb cloudrun deploy 部署到 CloudBase 云托管,含 OpenAI key 注入和云数据库工具集成。