我有一个数据框,其中包含几个在不同时间点测量的变量(例如,test1_tp1,test1_tp2,test1_tp3,test2_tp1,test2_tp2,…).
我现在尝试使用dplyr向数据框添加新列,该数据框计算这些列的选择上的行方式(例如,test1的所有时间点的平均值).
>即使使用用于计算显式命名列的平均值的语法,我也很困难.我没有成功的尝试是:
数据%>%…%>%mutate(test1_mean = mean(test1_tp1,na.rm = TRUE)
>我还想使用正则表达式/通配符来选择列名,就像这样
data%>%…%>%mutate(test1_mean = mean(matches(“test1 _.*”),na.rm = TRUE)
您可以在select中使用starts_with来查找以某个字符串开头的所有列.
原文链接:https://www.f2er.com/regex/357037.htmldata %>% mutate(test1 = select(.,starts_with("test1_")) %>% rowMeans(na.rm = TRUE))