跳到主要内容

混元大模型使用指南

图生文

提示

调用 createModel 并传入 "hunyuan-exp""hunyuan-open" 创建混元大模型,并且使用 "hunyuan-vision" 作为调用 streamText / generateText 时传入的 model 参数。

详情可参考下文示例代码。

在使用图生文时,传入的参数与普通对话生文有所不同,messages[n].content 为数组,数组内的元素可以为表示文字/图片的对象,如下所示:

async function readImage() {
const model = ai.createModel("hunyuan-exp");
const res = await model.streamText({
model: "hunyuan-vision",
messages: [
{
role: "user",
content: [
{
type: "text",
text: "下面图片的内容是什么?",
},
{
type: "image_url",
image_url: {
url: "https://cloudcache.tencent-cloud.com/qcloud/ui/portal-set/build/About/images/bg-product-series_87d.png",
},
},
],
},
],
});

for await (let x of res.textStream) {
console.log(x);
}
}

messages[n].content 表示文字时,对象类型表示为:

interface TextContent {
type: "text", // 固定值
text: string, // 文字内容
}

messages[n].content 表示图片时,对象类型表示为:

interface ImageContent {
type: "image_url", // 固定值
image_url: {
url: string, // 图片链接
},
}