Lucene - 索引类

  • 简述

    索引过程是 Lucene 提供的核心功能之一。下图说明了索引过程和类的使用。IndexWriter 是索引过程中最重要和核心的组成部分。
    索引过程
    我们增加 Document(s) 包含 Field(s) 到分析 Document(s) 使用 Analyzer 然后根据需要创建/打开/编辑索引并将它们存储/更新到一个 Directory. IndexWriter 用于更新或创建索引。它不用于读取索引。
  • 索引类

    以下是索引过程中常用的类列表。
    序号 类别和描述
    1 IndexWriter
    此类充当在索引过程中创建/更新索引的核心组件。
    2 Directory
    此类表示索引的存储位置。
    3 Analyzer
    该类负责分析文档并从要索引的文本中获取标记/单词。没有完成分析,IndexWriter 无法创建索引。
    4 Document
    此类表示具有字段的虚拟文档,其中 Field 是一个对象,可以包含物理文档的内容、其元数据等。分析器只能理解一个文档。
    5 Field
    这是索引过程的最低单位或起点。它表示键值对关系,其中一个键用于标识要索引的值。让我们假设用于表示文档内容的字段将具有作为“内容”的键,并且该值可能包含文档的部分或全部文本或数字内容。Lucene 只能索引文本或数字内容。