频道导航

java – 模式搜索如何更快？

2019-05-10 Java 前端之家

前端之家收集整理的这篇文章主要介绍了java – 模式搜索如何更快？，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

我正在处理大约1GB的增量文件,我想搜索一个特定的模式.
目前我正在使用 Java正则表达式,你有什么想法可以如何更快地做到这一点？

解决方法

基本上你需要的是可以处理流的状态机.该流被绑定到文件…每次文件增长时,您都会读取附加到的内容(如附加到文件的行的标准输出的tail linux命令).

如果您需要停止/重新启动分析仪,您可以将其存储在起始位置的某个位置(这可以取决于您需要的模式匹配的窗口),然后重新启动.或者您可以从头重新启动.

那是针对“增加文件”的一部分问题.

为了处理内容的最佳方法,它取决于您真正需要的内容,要应用哪种数据和模式.正则表达式可能是最好的解决方案：灵活,快速,比较方便.

从我的理解,如果您想为一些自然语言内容进行文档搜索匹配,Lucene会很好.这将是一个不好的选择,以匹配所有日期或所有行与特定的财产.也是因为Lucene首先创建了一个索引的文档…这将有助于只有真正重的处理,因为索引首先需要时间.

上一篇：java-ee – GlassFish v3域服务器无下一篇：通过JNI调用分析Java

猜你在找的Java相关文章

ArrayList源码分析

ArrayList简介：ArrayList 的底层是数组队列，相当于动态数组。与 Java 中的数组相比，它的...

作者：前端之家时间：2021-02-27

java多线程与并发（基础篇）

一、进程与线程进程：是代码在数据集合上的一次运行活动，是系统进行资源分配和调度的基本...

作者：前端之家时间：2021-02-27

LinkedList 的实现原理

本文为博客园作者所写： 一寸HUI，个人博客地址：https://www.cnblogs.com/zsql/...

作者：前端之家时间：2021-02-27

java之面向对象详解

#############java面向对象详解#############1、面向对象基本概念2、类与对象3、类和对象的...

作者：前端之家时间：2021-02-27

java之异常详解

一、什么是异常? 异常就是有异于常态，和正常情况不一样，有错误出错。在java中，阻止当前...

作者：前端之家时间：2021-02-27

Map的四种遍历

//Map的四种遍历方法 //Map不能直接遍历，只能通过遍历Key与Value间接遍历 public static...

作者：前端之家时间：2021-02-25

throw和throws的区别以及try,catch,finally在有return的情况下执行的顺序

一，抛出异常有三种形式，一是throw,一个throws，还有一种系统自动抛异常。下面它们之间的...

作者：前端之家时间：2021-02-25

Jdk14 都要出了，Jdk9 的新特性还不了解一下？

中最大的亮点是 Java 平台模块化的引入，以及模块化 JDK。但是还有很多其他新功能，这篇...

作者：前端之家时间：2021-02-25

还看不懂同事代码？快来补一波 Java 7 语法特性

Jdk 频繁更新，新特性了解吗？每次更新都注重提高生产效率，提高 JVM 性能，推行模块化等，...

作者：前端之家时间：2021-02-25

Java 12 新特性介绍，快来补一补

Java 12 早在 2019 年 3 月 19 日发布，这些新特性你知道吗

作者：前端之家时间：2021-02-25

编程分类

PHP Java Java SE Python C#C&C++Ruby VB asp.Net Go Perl netty Django Delphi Jsp .NET Core Spring Flask Springboot SpringMVC Lua Laravel Mybatis Asp Groovy ThinkPHP Yii swoole

最新文章