java – 模式搜索如何更快?

前端之家收集整理的这篇文章主要介绍了java – 模式搜索如何更快?前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我正在处理大约1GB的增量文件,我想搜索一个特定的模式.
目前我正在使用 Java正则表达式,你有什么想法可以如何更快地做到这一点?

解决方法

基本上你需要的是可以处理流的状态机.该流被绑定到文件…每次文件增长时,您都会读取附加到的内容(如附加到文件的行的标准输出的tail linux命令).

如果您需要停止/重新启动分析仪,您可以将其存储在起始位置的某个位置(这可以取决于您需要的模式匹配的窗口),然后重新启动.或者您可以从头重新启动.

那是针对“增加文件”的一部分问题.

为了处理内容的最佳方法,它取决于您真正需要的内容,要应用哪种数据和模式.正则表达式可能是最好的解决方案:灵活,快速,比较方便.

从我的理解,如果您想为一些自然语言内容进行文档搜索匹配,Lucene会很好.这将是一个不好的选择,以匹配所有日期或所有行与特定的财产.也是因为Lucene首先创建了一个索引的文档…这将有助于只有真正重的处理,因为索引首先需要时间.

猜你在找的Java相关文章