频道导航

正则表达式 – 在R中组合字符向量中的行

2020-08-20 正则表达式前端之家

前端之家收集整理的这篇文章主要介绍了正则表达式 – 在R中组合字符向量中的行，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

R中有一个约50,000行的字符向量(内容).但是,从文本文件读入的某些行在不同的行上,不应该是.具体来说,线条看起来像这样：

[1] hello,[2] world
[3] ""
[4] how
[5] are 
[6] you
[7] ""

我想组合这些线条,以便我有一些看起来像这样的东西：

[1] hello,world
[2] how are you

我试过写一个for循环：

for(i in 1:length(content)){
    if(content[i+1] != ""){
        content[i+1] <- c(content[i],content[i+1])
    }
}

但是当我运行循环时,我收到一个错误：缺少需要TRUE / FALSE的值.

任何人都可以建议一个更好的方法来做到这一点,甚至可能甚至不使用循环？

谢谢！

编辑：
我实际上试图将其应用于每个都有数千行的文档语料库.关于如何将这些解决方案转换为可应用于每个文档内容的功能的任何想法？

解决方法

我认为有更优雅的解决方案,但这可能对您有用：

chars <- c("hello,","world","","how","are","you","")
###identify groups that belong together (id increases each time a "" is found)
ids <- cumsum(chars=="")

#split vector (an filter out "" by using the select vector)
select <- chars!=""
splitted <- split(chars[select],ids[select])

#paste the groups together
res <- sapply(splitted,paste,collapse=" ")

#remove names(if necessary,probably not)
res <- unname(res) #thanks @Roland

> res
[1] "hello,world" "how are you"

上一篇：正则表达式 – 使用GNU sed重用插入下一篇：正则表达式 – 在正则表达式中使用

猜你在找的正则表达式相关文章

常用正则表达式-手机号、身份证、邮箱

一、校验数字的表达式 1 数字：^[0-9]*$ 2 n位的数字：^d{n}$ 3 至少n位的数字：^d{n,}$ 4...

作者：前端之家时间：2021-01-10

JS正则表达式详解

正则表达式非常有用，查找、匹配、处理字符串、替换和转换字符串，输入输出等。下面整理一...

作者：前端之家时间：2020-12-29

组内正则培训记录

0. 注：不同语言中的正则表达式实现都会有一些不同。下文中的代码示例除特别说明的外，都...

作者：前端之家时间：2020-12-20

高级正则表达式技术（Python版）

正则表达式是从信息中搜索特定的模式的一把瑞士军刀。它们是一个巨大的工具库，其中的...

作者：前端之家时间：2020-07-22

史上最全最常用的正则表达式

一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,...

作者：前端之家时间：2020-07-22

正则表达式工具

作者：前端之家时间：2020-07-22

正则表达式初步

作者：前端之家时间：2020-07-22

分享5个可视化的正则表达式编辑工具

　　正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编...

作者：前端之家时间：2020-07-22

分享5个可视化的正则表达式编辑工具

正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器...

作者：前端之家时间：2020-07-22

[知识积累]--正则表达式记忆表

在工作中常常遇到正则表达式问题，有时候又会忘记这则的语法。下面就分享一份正则表达式记...

作者：前端之家时间：2020-07-22

编程分类

算法设计模式多媒体技术正则表达式 Elasticsearch Flink Hadoop IDE

最新文章