频道导航

正则表达式 – R中的计数模式匹配

2020-07-11 正则表达式前端之家

前端之家收集整理的这篇文章主要介绍了正则表达式 – R中的计数模式匹配，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

如何有效地计算在另一个字符串中出现的一个字符串的实例数？

以下是我迄今为止的代码.它成功识别是否在另一个字符串中出现了一个字符串的任何实例.但是,我不知道如何将它从TRUE / FALSE关系扩展到计数关系.

x <- ("Hello my name is Christopher. Some people call me Chris")
y <- ("Chris is an interesting person to be around")
z <- ("Because he plays sports and likes statistics")

lll <- tolower(list(x,y,z))
dict <- tolower(c("Chris","Hell"))

mmm <- matrix(nrow=length(lll),ncol=length(dict),NA)

for (i in 1:length(lll)) {
for (j in 1:length(dict)) {
    mmm[i,j] <- sum(grepl(dict[j],lll[i]))
}
}
mmm

它产生：

[,1] [,2]
 [1,]    1    1
 [2,]    1    0
 [3,]    0    0

由于小写字符串“chris”在lll [1]中出现两次,我希望mmm [1,1]为2而不是1.

真实的例子是更高的维度……所以如果代码可以被矢量化而不是使用我的强力循环,那就太喜欢了.

两个快速提示：

>避免双重for循环,你不需要它;)
>使用stringr包

library(stringr)

dict <- setNames(nm=dict)  # simply for neatness
lapply(dict,str_count,string=lll)
# $chris
# [1] 2 1 0
#
# $hell
# [1] 1 0 0

或者作为矩阵：

#  sapply(dict,string=lll)
#      chris hell
# [1,]     2    1
# [2,]     1    0
# [3,]     0    0

上一篇：正则表达式 – 是否有一个Perl兼容下一篇：正则表达式 – 如何在重写中匹配ww

猜你在找的正则表达式相关文章

常用正则表达式-手机号、身份证、邮箱

一、校验数字的表达式 1 数字：^[0-9]*$ 2 n位的数字：^d{n}$ 3 至少n位的数字：^d{n,}$ 4...

作者：前端之家时间：2021-01-10

JS正则表达式详解

正则表达式非常有用，查找、匹配、处理字符串、替换和转换字符串，输入输出等。下面整理一...

作者：前端之家时间：2020-12-29

组内正则培训记录

0. 注：不同语言中的正则表达式实现都会有一些不同。下文中的代码示例除特别说明的外，都...

作者：前端之家时间：2020-12-20

高级正则表达式技术（Python版）

正则表达式是从信息中搜索特定的模式的一把瑞士军刀。它们是一个巨大的工具库，其中的...

作者：前端之家时间：2020-07-22

史上最全最常用的正则表达式

一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,...

作者：前端之家时间：2020-07-22

正则表达式工具

作者：前端之家时间：2020-07-22

正则表达式初步

作者：前端之家时间：2020-07-22

分享5个可视化的正则表达式编辑工具

　　正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编...

作者：前端之家时间：2020-07-22

分享5个可视化的正则表达式编辑工具

正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器...

作者：前端之家时间：2020-07-22

[知识积累]--正则表达式记忆表

在工作中常常遇到正则表达式问题，有时候又会忘记这则的语法。下面就分享一份正则表达式记...

作者：前端之家时间：2020-07-22

编程分类

算法设计模式多媒体技术正则表达式 Elasticsearch Flink Hadoop IDE

最新文章