频道导航

在R中使用行聚合创建新数据

2020-09-27 设计模式前端之家

前端之家收集整理的这篇文章主要介绍了在R中使用行聚合创建新数据，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

我有的数据框包含两个列：ID和类型(字符).见下文：

set.seed(123)
ID <- seq(1,25)
type <- sample(letters[1:26],25,replace=TRUE)

df <- data.frame(ID,type)

我需要创建一个只包含一列的新数据框.第一次观察将是第一次
列类型中的三个字母,第二个观察是第二个三个字母,很快就开始了.

新数据看起来像

ndf <- data.frame(ntype=c("huk","wyb","nxo","lyl","roc","xgb","iyx","sqz","r"))

解决方法

我们使用gl创建一个分组变量,然后使用tapply将元素粘贴在一起

n <- 3 
ndf <- data.frame(ntype = with(df,unname(tapply(type,as.integer(gl(nrow(df),n,nrow(df))),FUN =paste,collapse=""))),stringsAsFactors= FALSE)
ndf$ntype
#[1] "huk" "wyb" "nxo" "lyl" "roc" "xgb" "iyx" "sqz" "r"

或者另一种选择是将整个列粘贴在一起然后拆分

strsplit(paste(df$type,collapse=""),"(?<=.{3})",perl = TRUE)[[1]]
#[1] "huk" "wyb" "nxo" "lyl" "roc" "xgb" "iyx" "sqz" "r"

或者另一个选项是带有粘贴的子串

substring(paste(df$type,seq(1,nrow(df),by = 3),c(seq(3,nrow(df)))
#[1] "huk" "wyb" "nxo" "lyl" "roc" "xgb" "iyx" "sqz" "r"

注意：以上所有都是基本R解决方案

上一篇：域驱动设计 – 聚合根数据复制和De 下一篇：Symfony2中的依赖注入最佳实践

猜你在找的设计模式相关文章

适配器模式-让不兼容的接口得以适配

适配器模式将一个类的接口转换成客户期望的另一个接口，使得原本接口不兼容的类可以相互合...

作者：前端之家时间：2021-02-24

策略模式-定义一个算法族

策略模式定义了一系列算法族，并封装在类中，它们之间可以互相替换，此模式让算法的变化独...

作者：前端之家时间：2021-02-24

设计模式之高质量代码

设计模式讲的是如何编写可扩展、可维护、可读的高质量代码，它是针对软件开发中经常遇到的...

作者：前端之家时间：2021-02-24

模板方法模式-封装一套算法流程

模板方法模式在一个方法中定义一个算法的骨架，而将一些步骤延迟到子类中，使得子类可以在...

作者：前端之家时间：2021-02-24

迭代器模式-统一集合的遍历方式

迭代器模式提供了一种方法，用于遍历集合对象中的元素，而又不暴露其内部的细节。

作者：前端之家时间：2021-02-24

单例模式的五种实现方式及优缺点

单例模式（Singleton Design Pattern）保证一个类只能有一个实例，并提供一个全局访问点。

作者：前端之家时间：2021-02-24

组合模式-统一的处理个别对象与组合对象

组合模式可以将对象组合成树形结构来表示“整体-部分”的层次结构，使得客户可以用一致的方...

作者：前端之家时间：2021-02-24

装饰者模式-动态的包装原有对象的行为

装饰者模式能够更灵活的，动态的给对象添加其它功能，而不需要修改任何现有的底层代码。

作者：前端之家时间：2021-02-24

观察者模式-将消息通知给观察者

观察者模式（Observer Design Pattern）定义了对象之间的一对多依赖，当对象状态改变的时候...

作者：前端之家时间：2021-02-24

代理模式-访问对象的代理而非其本身

代理模式为对象提供一个代理，来控制对该对象的访问。代理模式在不改变原始类代码的情况下...

作者：前端之家时间：2021-02-24

编程分类

算法设计模式多媒体技术正则表达式 Elasticsearch Flink Hadoop IDE

最新文章