想知道终止长时间运行的正则表达式匹配的技术(
java matcher.find()方法).也许继承Matcher并在x次迭代后添加一些逻辑来终止?
基本上我是使用遗传算法生成正则表达式,所以我对它们没有很多控制权.然后我针对某些文本测试每个文本以查看它们是否与文本的某个目标区域匹配.
因为我有点随机生成这些正则表达式,我得到了一些疯狂的东西,它吃了大量的cpu和一些find()调用需要一段时间来终止.我宁愿在一段时间后杀死它们,但不确定最好的方法.
如果有人有想法,请告诉我.
解决方法
有一个解决方案
here可以解决您的问题. (那个问题与你的问题相同.)
从本质上讲,它是一个可以注意到线程中断的CharSequence.
该答案的代码:
/** * CharSequence that noticed thread interrupts -- as might be necessary * to recover from a loose regex on unexpected challenging input. * * @author gojomo */ public class InterruptibleCharSequence implements CharSequence { CharSequence inner; // public long counter = 0; public InterruptibleCharSequence(CharSequence inner) { super(); this.inner = inner; } public char charAt(int index) { if (Thread.interrupted()) { // clears flag if set throw new RuntimeException(new InterruptedException()); } // counter++; return inner.charAt(index); } public int length() { return inner.length(); } public CharSequence subSequence(int start,int end) { return new InterruptibleCharSequence(inner.subSequence(start,end)); } @Override public String toString() { return inner.toString(); } }
用这个包裹你的字符串,你可以打断线程.