智能检索
智能检索(MetaInsight)是基于腾讯云数据万象的 AI 能力,为云存储中的图片、视频、文档等多媒体文件提供智能内容分析和检索功能,帮助您快速定位和管理海量文件资源。
功能介绍
智能检索整合了多种检索能力,支持标量检索(基于元数据的传统检索)和向量检索(基于语义的 AI 检索),提供多模态混合检索能力。
核心能力
| 检索类型 | 说明 | 应用场景 |
|---|---|---|
| 基础信息检索 | 基于文件元数据检索,如文件名、大小、类型、创建时间等 | 文件管理、数据统计 |
| 图片检索 | 支持以图搜图、以文搜图,基于图片内容的语义检索 | 网盘相册、商品检索推荐 |
| 人脸检索 | 识别图片中的人脸特征,按人脸搜索包含同一人物的照片 | 安防监控、考勤系统、智能相册 |
检索方式对比
| 特性 | 标量检索 | 向量检索 |
|---|---|---|
| 原理 | 基于文件属性(元数据)精确匹配 | 基于 AI 语义理解相似度匹配 |
| 典型用途 | 按文件名、类型、时间查询 | 图片内容搜索、文档语义检索 |
| 优势 | 查询速度快、结果精确 | 智能理解、支持模糊匹配 |
| 适用场景 | 已知文件属性的查询 | 内容相关性查询 |
应用场景
- 图片资源管理:快速定位需要的图片素材
- 相册应用:按人物、地点、事物分类照片
- 电商平台:商品图片智能分类和搜索
- 媒体资产管理:视频素材的智能标签和检索
- 内容创作:快速找到符合需求的素材
使用前准备
使用智能检索功能前,需要先开通数据万象能力并创建数据集。
第 1 步:开通智能检索
- 在 云开发平台-云存储 页面,点击「高级能力」→「智能检索」,前往COS控制台进行配置
- 按照页面提示开通数据万象智能检索能力,开通后默认会创建基础信息检索模版

第 2 步:管理数据集
目前仅支持使用开通数据万象时创建的基础信息模板,云存储桶暂不支持单独创建新的数据集,该功能后续将开放。
在 COS 控制台左侧导航栏选择「智能检索」→「数据集管理」
点击「创建数据集」按钮
配置数据集信息:
- 数据集名称:自定义数据集名称
- 数据集描述:选填,描述数据集用途
- 关联存储桶:选择您的 CloudBase 云存储对应的 COS 存储桶
- 文件路径:指定需要检索的文件路径(可选全部或指定前缀)
点击「确定」完成创建
第 3 步:等待元数据索引建立完成
创建数据集后,需要为文件建立索引:
- 在数据集列表中,点击数据集名称进入详情页
- 系统将自动分析文件并建立索引

索引时间:通常在任务提交后 1-10 分钟内完成,具体时间取决于文件数量和大小。
使用智能检索
智能检索提供两种使用方式:控制台操作和 API 调用。
控制台检索
通过 COS 控制台可视化界面进行检索,支持基础信息、多模态混合检索两种检索类型。
基础信息检索
适用于基于文件属性的查询,如文件名、contentType、文件大小等。
操作步骤:
- 登录 COS 控制台
- 在左侧导航栏选择「智能检索」→「数据检索」
- 选择检索场景为「基础信息检索」
- 配置查询条件:
- 选择数据集
- 设置查询条件(支持多个条件组合):
- 文件名称:支持精确匹配或模糊匹配
- 内容类型(contentType):如 image/jpeg、application/pdf
- 文件大小:支持范围查询
- 创建时间:支持时间范围查询
- 自定义标签:基于文件的自定义元数据
- 高级配置(可选):
- 设置排序方式(按时间、大小等)
- 配置数据聚合规则
- 设置返回结果数量
- 点击「查询」获取结果
查询条件示例:
| 查询需求 | 查询条件设置 |
|---|---|
| 查找所有 JPG 图片 | contentType = "image/jpeg" |
| 查找大于 1MB 的文件 | 文件大小 > 1048576 |
| 查找最近 7 天的文件 | 创建时间 >= 当前时间-7天 |
| 查找文件名包含"产品"的图片 | 文件名称 contains "产品" AND contentType starts with "image/" |
支持的操作符:=、!=、>、>=、<、<=、contains、starts with、ends with 等。
详细的字段和操作符支持列表,请参考:COS 字段和操作符文档
多模态检索
多模态检索功能暂未开放,敬请期待。
多模态检索支持基于图像内容和人脸识别的 AI 检索场景,包括以图搜图、以文搜图、人脸检索等。
操作步骤:
- 登录 COS 控制台
- 在左侧导航栏选择「智能检索」→「数据检索」
- 选择检索场景为「多模态混合检索」
- 输入检索内容:
- 文字检索:输入描述性文字,如"蓝天白云的风景照"、"红色的连衣裙"
- 图片检索:上传参考图片或选择存储桶中的图片(支持普通图像检索和人脸检索)
- 高级设置:
- 返回数量:设置返回结果的最大数量(默认 10,最大 100)
- 相似度阈值:设置最低相似度分数(0-100,图像检索推荐 60-80,人脸检索推荐 70-85)
- 检索类型:选择检索图片或全部
- 元数据过滤(可选):
- 在检索结果基础上,进一步通过元数据条件过滤
- 例如:只返回 2024 年创建的图片
- 点击「查询」获取结果
多模态检索示例:
以图搜图:
1. 上传一张"海滩风景"的图片
2. 设置相似度阈值为 70
3. 系统返回所有与该图片内容相似的照片
以文搜图:
1. 输入文字描述:"穿着白色婚纱的新娘"
2. 设置返回数量为 20
3. 系统返回语义匹配的图片
人脸检索:
1. 上传一张清晰的人脸照片
2. 设置相似度阈值为 75
3. 系统返回包含该人物的所有照片
4. 可按时间、相似度排序
- 图像检索:使用清晰、主体明确的图片,相似度阈值推荐 60-80
- 人脸检索:使用清晰、正面的人脸照片作为参考图,相似度阈值推荐 70-85
- 索引配置:人脸检索需要提前在数据集中配置人脸索引
API 调用
智能检索支持通过 API 调用,可集成到您的应用中。
完整的 API 调用方式和参数说明,请参考:数据检索 API 文档
常见问题
索引多久能完成?
通常在文件上传后 1-5 分钟内完成,具体时间取决于文件大小和数量。
支持哪些文件格式?
- 图片:JPG、PNG、BMP、GIF、WebP、HEIF
- 视频:MP4、AVI、MOV、FLV 等主流格式
检索文件:
完整的 API 调用方式和更多语言示例,请参考:
如何提高检索准确度?
- 高质量图片:使用清晰、主体明确的图片
- 多标签组合:使用多个标签组合检索
- 合理阈值:以图搜图时适当调整相似度阈值
- 人工审核:对重要检索结果进行人工二次确认
索引数据如何存储?
智能检索的索引数据由数据万象服务管理,不占用您的云存储空间。建议将标签信息同步存储到 CloudBase 数据库,便于复杂查询。
