认知搜索

aws 和azure 的认知搜索其实就是,异构文本索引,利用人工智能能力分析已有信息,提供OCR 、翻译,情绪分析等更多的能力。

https://docs.microsoft.com/zh-cn/azure/search/search-what-is-azure-search

 

  • 为非结构化文本编制索引,或者从图像文件中提取文本和信息。 认知搜索的 AI 扩充功能将 AI 处理添加到索引管道。 一些常见用例包括对扫描的文档进行 OCR 识别、在大型文档中进行实体识别和关键短语提取、语言检测和文本翻译,以及情绪分析。
  • 使用 Azure 认知搜索的自定义和语言分析器可以满足语言要求。 如果你使用非英语内容,Azure 认知搜索支持 Lucene 分析器和 Microsoft 的自然语言处理器。 还可以配置分析器以实现原始内容的专业处理,例如筛选出标注字符。
  • 将异构内容类型整合成单个专用的可搜索索引。 查询始终基于你创建并连同文档一起加载的索引,索引始终驻留在云中的 Azure 认知搜索服务上。 可以在索引中填充来自任何源或平台的 JSON 文档流。 或者,对于源自 Azure 的内容,可以使用索引器将数据提取到索引中。 索引定义和管理/所有权是使用 Azure 认知搜索的重要原因。
  • 原始内容是 Azure 数据源(例如 Azure Blob 存储或 Cosmos DB)中的大型无差别文本、图像文件或应用程序文件(例如 Office 内容类型)。 可以在编制索引期间应用认知技能,以添加结构,或者从图像和应用程序文件中提取含义。
  • 轻松实现搜索相关的功能。 Azure 认知搜索 API 简化了查询构造、分面导航、筛选器(包括地理空间搜索)、同义词映射、自动提示查询和相关性优化。 使用内置功能可以满足最终用户对搜索体验的预期,使其觉得该体验类似于商用 Web 搜索引擎。
  • 为非结构化文本编制索引,或者从图像文件中提取文本和信息。 Azure 认知搜索的 AI 扩充功能将 AI 处理添加到索引管道。 一些常见用例包括对扫描的文档进行 OCR 识别、在大型文档中进行实体识别和关键短语提取、语言检测和文本翻译,以及情绪分析。
  • AI 扩充            功能
    在编制索引期间进行 AI 处理 适用于图像和文本分析的 AI 扩充可以应用于索引管道,以从原始内容中提取文本信息。 内置技术的一些示例包括:光学字符识别(使扫描的 JPEG 变得可搜索)、实体识别(标识组织、名称或位置)、关键短语识别。 也可将自定义技术编码,以便将其附加到管道。
    存储丰富的内容以供在非搜索场景中分析和使用 知识存储(预览版) 是基于 AI 的索引编制的一个扩展。 通过将 Azure 存储用作后端,可以保存在编制索引期间创建的扩充。 这些项目可用于帮助你设计更好的技能集,或创建不含无固定结构或不明确数据的形状和结构。 可以创建定目标到特定工作负荷或用户的这些结构的投影。 还可以直接分析已提取的数据,或将它加载到其他应用中。

发表评论

电子邮件地址不会被公开。 必填项已用*标注