我只是想知道我们是否可以在lucene中实现一些RDBMS功能.
例:
1)我有10,000个项目文档(pdf文件),必须将其内容编入索引以使其可供搜索.
2)每份文件都与单一项目有关.项目可以包含项目名称,编号,开始日期,结束日期,位置,类型等详细信息.
我必须在pdf文件的内容中搜索给定的关键字,但在显示结果时,我想显示项目元数据,如第(2)点所述.
我的想法是在索引时将名为projectId的字段与每个pdf文件相关联.一旦我们得到了,我们将再次触发搜索以获取项目元数据.
这样我们就可以避免重复数据.此外,如果我们想要更新项目元数据,我们最终只能在SINGLE PLACE更新.否则,如果我们使用所有pdf doument索引存储这个元数据,我们将最终更新所有文档,这不是我想要的方式.
请指教.