在 CloudBase AI 中用 DeepSeek V4-Pro 做图片理解(多模态)
Next.js Route Handler 拿到用户上传图片转 base64,调 @cloudbase/node-sdk 的 app.ai().createModel('cloudbase').generateText,用 model: 'deepseek-v4-pro' 传多模态 messages,拿到图片描述/OCR/内容分析结果。覆盖单图、多图、图+文本提问。
Next.js Route Handler 拿到用户上传图片转 base64,调 @cloudbase/node-sdk 的 app.ai().createModel('cloudbase').generateText,用 model: 'deepseek-v4-pro' 传多模态 messages,拿到图片描述/OCR/内容分析结果。覆盖单图、多图、图+文本提问。
RN 0.74+ 前端通过 fetch + ReadableStream(或 react-native-fetch-api polyfill / XHR onprogress fallback)消费后端 Route Handler 的流式响应,后端用 @cloudbase/node-sdk 调 streamText,凭证只放服务端,绝不进 JS bundle。
用 wx.cloud.extend.AI 在小程序里直接调 DeepSeek / 混元等 CloudBase 平台模型,流式输出用 for-await 消费 textStream,无需自建后端 LLM 网关。
PDF / 整套代码 / Excel 解析成纯文本,整篇丢进 prompt,调 CloudBase AI streamText({ model: 'deepseek-v4-pro' }) 直接问答,跳过 embedding 和向量库,适合一次性长文档问答场景。