问题 如何使用ddply将列添加到数据框?


我有一个如下所示的数据框:

site   date  var   dil
   1    A    7.4   2 
   2    A    6.5   2
   1    A    7.3   3
   2    A    7.3   3
   1    B    7.1   1
   2    B    7.7   2
   1    B    7.7   3
   2    B    7.4   3

我需要添加一个名为的列 wt 到此数据框,其中包含计算加权平均值所需的加权因子。必须为每个组合导出该加权因子 site 和 date

我正在使用的方法是首先构建一个计算weigthing因子的函数:

> weight <- function(dil){
                    dil/sum(dil)
                     }

然后为每个组合应用函数 site 和 date

> df$wt <- ddply(df,.(date,site),.fun=weight)

但我收到此错误消息:

Error in FUN(X[[1L]], ...) : 
  only defined on a data frame with all numeric variables

7682
2017-09-27 17:20


起源

尝试 df = ddply(df, .(date, site), transform, wt = weight(dil)) - Ramnath
谢谢Ramnath,这非常有效 - matteo


答案:


你快到了。修改您的代码以使用 transform 功能。这允许您向内部的data.frame添加列 ddply

weight <- function(x) x/sum(x)

ddply(df, .(date,site), transform, weight=weight(dil))

  site date var dil weight
1    1    A 7.4   2   0.40
2    1    A 7.3   3   0.60
3    2    A 6.5   2   0.40
4    2    A 7.3   3   0.60
5    1    B 7.1   1   0.25
6    1    B 7.7   3   0.75
7    2    B 7.7   2   0.40
8    2    B 7.4   3   0.60

15
2017-09-28 05:54



要使用ddply,您需要安装plyr软件包 - sshevlyagin