我有大约80,000个文本文件,我希望能够对它们进行高级搜索.
假设我有两个关键字列表,我想返回包含第一个列表中至少一个关键字和第二个列表中至少一个关键字的所有文件.
是否已经有一个库可以做到这一点,如果它存在,我不想重写它.
最佳答案
由于您需要多次搜索文档,因此您很可能希望索引文本文件以尽可能快地进行搜索.
> https://pypi.python.org/pypi/Whoosh/
> http://pythonhosted.org/Whoosh/
看一下文档.希望实现所期望的行为是相当微不足道的.