频道导航

ruby – 在每行上针对多个(15)正则表达式解析文本正文的最佳方法是什么？

2019-12-11 Ruby 前端之家

前端之家收集整理的这篇文章主要介绍了ruby – 在每行上针对多个(15)正则表达式解析文本正文的最佳方法是什么？，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

我有一个我必须扫描的文本正文,每行包含至少2个,有时包含4个部分的信息.问题是每行可以是15-20个不同动作中的1个.

在ruby中,当前代码看起来有点像这样：

text.split("\n").each do |line|  #around 20 times..

..............

      expressions['actions'].each do |pat,reg| #around 20 times

.................

这显然是“问题”.
通过将所有正则表达式合并为一个,我确实设法让它更快(在C中以50％的保证金)但这仍然不是我需要的速度 – 我需要快速解析数千个这些文件！

现在我将它们与正则表达式匹配 – 但这是无法忍受的缓慢.我从ruby开始跳到C,希望我能得到一个速度提升而且它不会发生.

我随便读了关于PEG和基于语法的解析但看起来有点难以实现.这是我应该走的方向还是有不同的路线？

基本上我正在解析扑克手牌历史,手牌历史的每一行通常都包含我需要收集的2-3位信息：
玩家是谁,行动需要多少钱或什么卡等等..

需要解析的示例文本：

buriedtens posts $5
The button is in seat #4
*** HOLE CARDS ***
Dealt to Mayhem 31337 [8s Ad]
Sherwin7 folds
OneMiKeee folds
syhg99 calls $5
buriedtens raises to $10

收集此信息后,每个操作都会转换为xml节点.

现在我的ruby实现比我的更快,但这是可能的.只是因为我没有用c代码写了超过4 – 5年

更新：
我不想在这里发布所有代码,但到目前为止我的手/秒看起来如下：

588 hands/second -- boost::spirit in c++
60 hands/second -- 1 very long and complicated regex in c++ (all the regexen put together)
33 hands/second -- normal regex style in ruby

我正在测试antlr,看看我们是否可以继续进行,但截至目前我对精神的结果非常满意.

相关问题：Efficiently querying one string against multiple regexes.

解决方法

我会建议

> Boost Spirit或
> Antlr如果语法复杂;
> Xpressive如果它更简单一点,
> Tokenizer和手工编码如果它是微不足道的.

祝好运

上一篇：ruby-on-rails – 如何在rails中定下一篇：ruby-on-rails – 创建日历/计划程

猜你在找的Ruby相关文章

Ruby increment(=)为nil：NilClass引发错误未定义方法”

以下代码导致我的问题： class Foo def initialize(n=0) @n = n end attr_acce...

作者：前端之家时间：2020-08-01

ruby-on-rails – 为什么这个Rspec测试返回“已经发送电子邮件”

这是我的spec文件,当为上下文添加测试“而不是可单独更新用户余额”时,我得到以下错误. re...

作者：前端之家时间：2020-08-01

ruby-on-rails – 仅针对特定邮件程序的Rails邮件拦截器

我有一个拦截器：DevelopmentMailInterceptor和一个启动拦截器的inititializer setup_mail...

作者：前端之家时间：2020-08-01

ruby-on-rails – 如何将YAML文件递归展平为JSON对象,其中键是以点分隔的字符串？

例如,如果我有YAML文件 en: questions: new: 'New Question' other: ...

作者：前端之家时间：2020-08-01

ruby – RSpec – 如果我避免使用let,let和before,如何实现相同的功能？

我听说在RSpec中避免它,let,let !,指定,之前和主题是最佳做法. 关于让,让！之前,如果不使用...

作者：前端之家时间：2020-08-01

ruby-on-rails – .save上的Rails NoMethodError

我运行了代码@transaction = Transaction.new然后我给了它一些值： <Transaction id: n...

作者：前端之家时间：2020-08-01

ruby-on-rails – 为什么我会得到“未定义的方法`编码’”？

为什么我会得到“未定义的方法`编码’”？我怎样才能解决这个问题？错误信息 NoMethodEr...

作者：前端之家时间：2020-08-01

ruby-on-rails – ActionMailer错误的参数个数错误

我有一个rails应用程序,允许您请求邀请注册.根据要求,我保存您的电子邮件并向您发送一封电...

作者：前端之家时间：2020-08-01

ruby-on-rails – 将Active Record集转换为哈希数组

我看到了这个… How to convert activerecord results into a array of hashes 并且想要创...

作者：前端之家时间：2020-08-01

ruby – 如何将数组值与散列数组合？

我有一系列哈希： [{:foo => 1, :bar => 2}, {:foo => 2, :bar => 4} ...] 和...

作者：前端之家时间：2020-08-01

编程分类

PHP Java Java SE Python C#C&C++Ruby VB asp.Net Go Perl netty Django Delphi Jsp .NET Core Spring Flask Springboot SpringMVC Lua Laravel Mybatis Asp Groovy ThinkPHP Yii swoole

最新文章