跳到主要内容

智能检索

智能检索(MetaInsight)是基于腾讯云数据万象的 AI 能力,为云存储中的图片、视频、文档等多媒体文件提供智能内容分析和检索功能,帮助您快速定位和管理海量文件资源。

📌 功能说明

如若在 COS 控制台未看到智能检索菜单,说明当前账号需要先开通白名单才可使用,详情请参考 COS 智能检索。如需使用,请提交工单向 COS 侧申请开通白名单。

功能介绍

智能检索整合了多种检索能力,支持标量检索(基于元数据的传统检索)和向量检索(基于语义的 AI 检索),提供多模态混合检索能力。

核心能力

检索类型说明应用场景
基础信息检索基于文件元数据检索,如文件名、大小、类型、创建时间等文件管理、数据统计
图片检索支持以图搜图、以文搜图,基于图片内容的语义检索网盘相册、商品检索推荐
人脸检索识别图片中的人脸特征,按人脸搜索包含同一人物的照片安防监控、考勤系统、智能相册

检索方式对比

特性标量检索向量检索
原理基于文件属性(元数据)精确匹配基于 AI 语义理解相似度匹配
典型用途按文件名、类型、时间查询图片内容搜索、文档语义检索
优势查询速度快、结果精确智能理解、支持模糊匹配
适用场景已知文件属性的查询内容相关性查询

应用场景

  • 图片资源管理:快速定位需要的图片素材
  • 相册应用:按人物、地点、事物分类照片
  • 电商平台:商品图片智能分类和搜索
  • 媒体资产管理:视频素材的智能标签和检索
  • 内容创作:快速找到符合需求的素材

使用前准备

使用智能检索功能前,需要先开通数据万象能力并创建数据集

第 1 步:开通智能检索

  1. 云开发平台-云存储 页面,点击「高级能力」→「智能检索」,前往COS控制台进行配置
  2. 按照页面提示开通数据万象智能检索能力,开通后默认会创建基础信息检索模版
智能检索

第 2 步:管理数据集

⚠️ 注意事项

目前仅支持使用开通数据万象时创建的基础信息模板,云存储桶暂不支持单独创建新的数据集,该功能后续将开放。

  1. COS 控制台左侧导航栏选择「智能检索」→「数据集管理

  2. 点击「创建数据集」按钮

  3. 配置数据集信息:

    • 数据集名称:自定义数据集名称
    • 数据集描述:选填,描述数据集用途
    • 关联存储桶:选择您的 CloudBase 云存储对应的 COS 存储桶
    • 文件路径:指定需要检索的文件路径(可选全部或指定前缀)
  4. 点击「确定」完成创建

第 3 步:等待元数据索引建立完成

创建数据集后,需要为文件建立索引:

  1. 在数据集列表中,点击数据集名称进入详情页
  2. 系统将自动分析文件并建立索引
智能检索

索引时间:通常在任务提交后 1-10 分钟内完成,具体时间取决于文件数量和大小。


使用智能检索

智能检索提供两种使用方式:控制台操作和 API 调用。

控制台检索

通过 COS 控制台可视化界面进行检索,支持基础信息、多模态混合检索两种检索类型。

基础信息检索

适用于基于文件属性的查询,如文件名、contentType、文件大小等。

操作步骤:

  1. 登录 COS 控制台
  2. 在左侧导航栏选择「智能检索」→「数据检索
  3. 选择检索场景为「基础信息检索
  4. 配置查询条件:
    • 选择数据集
    • 设置查询条件(支持多个条件组合):
      • 文件名称:支持精确匹配或模糊匹配
      • 内容类型(contentType):如 image/jpeg、application/pdf
      • 文件大小:支持范围查询
      • 创建时间:支持时间范围查询
      • 自定义标签:基于文件的自定义元数据
  5. 高级配置(可选):
    • 设置排序方式(按时间、大小等)
    • 配置数据聚合规则
    • 设置返回结果数量
  6. 点击「查询」获取结果

查询条件示例:

查询需求查询条件设置
查找所有 JPG 图片contentType = "image/jpeg"
查找大于 1MB 的文件文件大小 > 1048576
查找最近 7 天的文件创建时间 >= 当前时间-7天
查找文件名包含"产品"的图片文件名称 contains "产品" AND contentType starts with "image/"

支持的操作符=!=>>=<<=containsstarts withends with 等。

详细的字段和操作符支持列表,请参考:COS 字段和操作符文档


多模态检索

⚠️ 功能状态

多模态检索功能暂未开放,敬请期待。

多模态检索支持基于图像内容和人脸识别的 AI 检索场景,包括以图搜图、以文搜图、人脸检索等。

操作步骤:

  1. 登录 COS 控制台
  2. 在左侧导航栏选择「智能检索」→「数据检索
  3. 选择检索场景为「多模态混合检索
  4. 输入检索内容:
    • 文字检索:输入描述性文字,如"蓝天白云的风景照"、"红色的连衣裙"
    • 图片检索:上传参考图片或选择存储桶中的图片(支持普通图像检索和人脸检索)
  5. 高级设置
    • 返回数量:设置返回结果的最大数量(默认 10,最大 100)
    • 相似度阈值:设置最低相似度分数(0-100,图像检索推荐 60-80,人脸检索推荐 70-85)
    • 检索类型:选择检索图片或全部
  6. 元数据过滤(可选):
    • 在检索结果基础上,进一步通过元数据条件过滤
    • 例如:只返回 2024 年创建的图片
  7. 点击「查询」获取结果

多模态检索示例:

以图搜图:

1. 上传一张"海滩风景"的图片
2. 设置相似度阈值为 70
3. 系统返回所有与该图片内容相似的照片

以文搜图:

1. 输入文字描述:"穿着白色婚纱的新娘"
2. 设置返回数量为 20
3. 系统返回语义匹配的图片

人脸检索:

1. 上传一张清晰的人脸照片
2. 设置相似度阈值为 75
3. 系统返回包含该人物的所有照片
4. 可按时间、相似度排序
💡 检索优化建议
  • 图像检索:使用清晰、主体明确的图片,相似度阈值推荐 60-80
  • 人脸检索:使用清晰、正面的人脸照片作为参考图,相似度阈值推荐 70-85
  • 索引配置:人脸检索需要提前在数据集中配置人脸索引

API 调用

智能检索支持通过 API 调用,可集成到您的应用中。

📚 使用方式参考

完整的 API 调用方式和参数说明,请参考:数据检索 API 文档


常见问题

索引多久能完成?

通常在文件上传后 1-5 分钟内完成,具体时间取决于文件大小和数量。

支持哪些文件格式?

  • 图片:JPG、PNG、BMP、GIF、WebP、HEIF
  • 视频:MP4、AVI、MOV、FLV 等主流格式

检索文件:

📚 更多 API 示例

完整的 API 调用方式和更多语言示例,请参考:

如何提高检索准确度?

  1. 高质量图片:使用清晰、主体明确的图片
  2. 多标签组合:使用多个标签组合检索
  3. 合理阈值:以图搜图时适当调整相似度阈值
  4. 人工审核:对重要检索结果进行人工二次确认

索引数据如何存储?

智能检索的索引数据由数据万象服务管理,不占用您的云存储空间。建议将标签信息同步存储到 CloudBase 数据库,便于复杂查询。


相关资源