频道导航

使用data.table聚合子总计和总计

2019-12-01 设计模式前端之家

前端之家收集整理的这篇文章主要介绍了使用data.table聚合子总计和总计，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

我在R中有一个data.table：

library(data.table)
set.seed(1)
DT = data.table(
  group=sample(letters[1:2],100,replace=TRUE),year=sample(2010:2012,v=runif(100))

按照小组和年份将此数据汇总到汇总表中简单而优雅：

table <- DT[,mean(v),by='group,year']

然而,将这些数据聚合到一个汇总表中,包括小计和总计,这是一个困难的一点,而且不那么优雅：

library(plyr)
yearTot <- DT[,list(mean(v),year='Total'),by='group']
groupTot <- DT[,group='Total'),by='year']
Tot <- DT[,year='Total',group='Total')]
table <- rbind.fill(table,yearTot,groupTot,Tot)
table$group[table$group==1] <- 'Total'
table$year[table$year==1] <- 'Total'

这产生：

table[order(table$group,table$year),]

有没有一个简单的方法来指定小计和总计与data.table,如对于plyr的marginins = TRUE命令？我更喜欢在我的数据集上使用data.table over plyr,因为它是一个非常大的数据集,我已经在data.table格式.

我不知道一个简单的方法.这是实施的第一个刺.我不知道plyr中的margin = TRUE,这是什么？

crossby = function(DT,j,by) {
    j = substitute(j)
    ans = rbind(
        DT[,eval(j),by],DT[,list("Total",eval(j)),by=by[1]],cbind("Total",by=by[2]]),"Total",eval(j)]),use.names=FALSE
        # 'use.names' argument added in data.table v1.8.0
    )
    setkeyv(ans,by)
    ans
}

crossby(DT,c("group","year"))

      group  year        V1
 [1,]     a  2010 0.2926945
 [2,]     a  2011 0.4176346
 [3,]     a  2012 0.4227796
 [4,]     a Total 0.3901875
 [5,]     b  2010 0.5231845
 [6,]     b  2011 0.4997119
 [7,]     b  2012 0.4306871
 [8,]     b Total 0.4835788
 [9,] Total  2010 0.4278093
[10,] Total  2011 0.4463616
[11,] Total  2012 0.4271160
[12,] Total Total 0.4350153

上一篇：域驱动设计 – Real-World DDD：构下一篇：依赖注入 – 基于约定的依赖注入与

猜你在找的设计模式相关文章

适配器模式-让不兼容的接口得以适配

适配器模式将一个类的接口转换成客户期望的另一个接口，使得原本接口不兼容的类可以相互合...

作者：前端之家时间：2021-02-24

策略模式-定义一个算法族

策略模式定义了一系列算法族，并封装在类中，它们之间可以互相替换，此模式让算法的变化独...

作者：前端之家时间：2021-02-24

设计模式之高质量代码

设计模式讲的是如何编写可扩展、可维护、可读的高质量代码，它是针对软件开发中经常遇到的...

作者：前端之家时间：2021-02-24

模板方法模式-封装一套算法流程

模板方法模式在一个方法中定义一个算法的骨架，而将一些步骤延迟到子类中，使得子类可以在...

作者：前端之家时间：2021-02-24

迭代器模式-统一集合的遍历方式

迭代器模式提供了一种方法，用于遍历集合对象中的元素，而又不暴露其内部的细节。

作者：前端之家时间：2021-02-24

单例模式的五种实现方式及优缺点

单例模式（Singleton Design Pattern）保证一个类只能有一个实例，并提供一个全局访问点。

作者：前端之家时间：2021-02-24

组合模式-统一的处理个别对象与组合对象

组合模式可以将对象组合成树形结构来表示“整体-部分”的层次结构，使得客户可以用一致的方...

作者：前端之家时间：2021-02-24

装饰者模式-动态的包装原有对象的行为

装饰者模式能够更灵活的，动态的给对象添加其它功能，而不需要修改任何现有的底层代码。

作者：前端之家时间：2021-02-24

观察者模式-将消息通知给观察者

观察者模式（Observer Design Pattern）定义了对象之间的一对多依赖，当对象状态改变的时候...

作者：前端之家时间：2021-02-24

代理模式-访问对象的代理而非其本身

代理模式为对象提供一个代理，来控制对该对象的访问。代理模式在不改变原始类代码的情况下...

作者：前端之家时间：2021-02-24

编程分类

算法设计模式多媒体技术正则表达式 Elasticsearch Flink Hadoop IDE

最新文章