智能检索

智能检索（MetaInsight）是基于腾讯云数据万象的 AI 能力，为云存储中的图片、视频、文档等多媒体文件提供智能内容分析和检索功能，帮助您快速定位和管理海量文件资源。

功能介绍

智能检索整合了多种检索能力，支持标量检索（基于元数据的传统检索）和向量检索（基于语义的 AI 检索），提供多模态混合检索能力。

核心能力

检索类型	说明	应用场景
基础信息检索	基于文件元数据检索，如文件名、大小、类型、创建时间等	文件管理、数据统计
图片检索	支持以图搜图、以文搜图，基于图片内容的语义检索	网盘相册、商品检索推荐
人脸检索	识别图片中的人脸特征，按人脸搜索包含同一人物的照片	安防监控、考勤系统、智能相册

检索方式对比

特性	标量检索	向量检索
原理	基于文件属性（元数据）精确匹配	基于 AI 语义理解相似度匹配
典型用途	按文件名、类型、时间查询	图片内容搜索、文档语义检索
优势	查询速度快、结果精确	智能理解、支持模糊匹配
适用场景	已知文件属性的查询	内容相关性查询

应用场景

图片资源管理：快速定位需要的图片素材
相册应用：按人物、地点、事物分类照片
电商平台：商品图片智能分类和搜索
媒体资产管理：视频素材的智能标签和检索
内容创作：快速找到符合需求的素材

使用前准备

使用智能检索功能前，需要先开通数据万象能力并创建数据集。

第 1 步：开通智能检索

在云开发平台-云存储页面，点击「高级能力」→「智能检索」，前往COS控制台进行配置
按照页面提示开通数据万象智能检索能力，开通后默认会创建基础信息检索模版

第 2 步：管理数据集

⚠️ 注意事项

目前仅支持使用开通数据万象时创建的基础信息模板，云存储桶暂不支持单独创建新的数据集。

在 COS 控制台左侧导航栏选择「智能检索」→「数据集管理」
点击「创建数据集」按钮
配置数据集信息：
- 数据集名称：自定义数据集名称
- 数据集描述：选填，描述数据集用途
- 关联存储桶：选择您的 CloudBase 云存储对应的 COS 存储桶
- 文件路径：指定需要检索的文件路径（可选全部或指定前缀）
点击「确定」完成创建

第 3 步：等待元数据索引建立完成

创建数据集后，需要为文件建立索引：

在数据集列表中，点击数据集名称进入详情页
系统将自动分析文件并建立索引

索引时间：通常在任务提交后 1-10 分钟内完成，具体时间取决于文件数量和大小。

使用智能检索

智能检索提供两种使用方式：控制台操作和 API 调用。

控制台检索

通过 COS 控制台可视化界面进行检索，支持基础信息、多模态混合检索两种检索类型。

基础信息检索

适用于基于文件属性的查询，如文件名、contentType、文件大小等。

操作步骤：

登录 COS 控制台
在左侧导航栏选择「智能检索」→「数据检索」
选择检索场景为「基础信息检索」
配置查询条件：
- 选择数据集
- 设置查询条件（支持多个条件组合）：
  - 文件名称：支持精确匹配或模糊匹配
  - 内容类型（contentType）：如 image/jpeg、application/pdf
  - 文件大小：支持范围查询
  - 创建时间：支持时间范围查询
  - 自定义标签：基于文件的自定义元数据
高级配置（可选）：
- 设置排序方式（按时间、大小等）
- 配置数据聚合规则
- 设置返回结果数量
点击「查询」获取结果

查询条件示例：

查询需求	查询条件设置
查找所有 JPG 图片	contentType = "image/jpeg"
查找大于 1MB 的文件	文件大小 > 1048576
查找最近 7 天的文件	创建时间 >= 当前时间-7天
查找文件名包含"产品"的图片	文件名称 contains "产品" AND contentType starts with "image/"

支持的操作符：=、!=、>、>=、<、<=、contains、starts with、ends with 等。

详细的字段和操作符支持列表，请参考：COS 字段和操作符文档

多模态检索

⚠️ 功能状态

多模态检索功能暂未开放。

多模态检索支持基于图像内容和人脸识别的 AI 检索场景，包括以图搜图、以文搜图、人脸检索等。

操作步骤：

登录 COS 控制台
在左侧导航栏选择「智能检索」→「数据检索」
选择检索场景为「多模态混合检索」
输入检索内容：
- 文字检索：输入描述性文字，如"蓝天白云的风景照"、"红色的连衣裙"
- 图片检索：上传参考图片或选择存储桶中的图片（支持普通图像检索和人脸检索）
高级设置：
- 返回数量：设置返回结果的最大数量（默认 10，最大 100）
- 相似度阈值：设置最低相似度分数（0-100，图像检索推荐 60-80，人脸检索推荐 70-85）
- 检索类型：选择检索图片或全部
元数据过滤（可选）：
- 在检索结果基础上，进一步通过元数据条件过滤
- 例如：只返回 2024 年创建的图片
点击「查询」获取结果

多模态检索示例：

以图搜图：

上传一张"海滩风景"的图片
设置相似度阈值为 70
系统返回所有与该图片内容相似的照片

以文搜图：

输入文字描述："穿着白色婚纱的新娘"
设置返回数量为 20
系统返回语义匹配的图片

人脸检索：

上传一张清晰的人脸照片
设置相似度阈值为 75
系统返回包含该人物的所有照片
可按时间、相似度排序

💡 检索优化建议

图像检索：使用清晰、主体明确的图片，相似度阈值推荐 60-80
人脸检索：使用清晰、正面的人脸照片作为参考图，相似度阈值推荐 70-85
索引配置：人脸检索需要提前在数据集中配置人脸索引

API 调用

智能检索支持通过 API 调用，可集成到您的应用中。

📚 使用方式参考

完整的 API 调用方式和参数说明，请参考：数据检索 API 文档

常见问题

索引多久能完成？

通常在文件上传后 1-5 分钟内完成，具体时间取决于文件大小和数量。

支持哪些文件格式？

图片：JPG、PNG、BMP、GIF、WebP、HEIF
视频：MP4、AVI、MOV、FLV 等主流格式

检索文件：

📚 更多 API 示例

完整的 API 调用方式和更多语言示例，请参考：

如何提高检索准确度？

高质量图片：使用清晰、主体明确的图片
多标签组合：使用多个标签组合检索
合理阈值：以图搜图时适当调整相似度阈值
人工审核：对重要检索结果进行人工二次确认

索引数据如何存储？

智能检索的索引数据由数据万象服务管理，不占用您的云存储空间。建议将标签信息同步存储到 CloudBase 数据库，便于复杂查询。

功能介绍​

核心能力​

检索方式对比​

应用场景​

使用前准备​

第 1 步：开通智能检索​

第 2 步：管理数据集​

第 3 步：等待元数据索引建立完成​

使用智能检索​

控制台检索​

基础信息检索​

多模态检索​

API 调用​

常见问题​

索引多久能完成？​

支持哪些文件格式？​

如何提高检索准确度？​

索引数据如何存储？​

相关资源​