跳到主要内容

1 篇文档带有标签「multimodal」

查看所有标签

在 CloudBase AI 中用 DeepSeek V4-Pro 做图片理解(多模态)

Next.js Route Handler 拿到用户上传图片转 base64,调 @cloudbase/node-sdk 的 app.ai().createModel('cloudbase').generateText,用 model: 'deepseek-v4-pro' 传多模态 messages,拿到图片描述/OCR/内容分析结果。覆盖单图、多图、图+文本提问。