解决方法
基本上你需要的是可以处理流的状态机.该流被绑定到文件…每次文件增长时,您都会读取附加到的内容(如附加到文件的行的标准输出的tail linux命令).
如果您需要停止/重新启动分析仪,您可以将其存储在起始位置的某个位置(这可以取决于您需要的模式匹配的窗口),然后重新启动.或者您可以从头重新启动.
为了处理内容的最佳方法,它取决于您真正需要的内容,要应用哪种数据和模式.正则表达式可能是最好的解决方案:灵活,快速,比较方便.
从我的理解,如果您想为一些自然语言内容进行文档搜索匹配,Lucene会很好.这将是一个不好的选择,以匹配所有日期或所有行与特定的财产.也是因为Lucene首先创建了一个索引的文档…这将有助于只有真正重的处理,因为索引首先需要时间.