给定随机数生成额外行的高效 data.table 方法

我有一个大的data.table,我想生成一个随机数(使用两列)并执行计算。然后我想执行这一步 1000 次。我正在寻找一种无需循环即可有效执行此操作的方法。

示例数据:

> dt <- data.table(Group=c(rep("A",3),rep("B",3)), 
                   Year=rep(2020:2022,2), 
                   N=c(300,350,400,123,175,156),
                   Count=c(25,30,35,3,6,8), 
                   Pop=c(1234,1543,1754,2500,2600,2400))
> dt
   Group Year   N Count  Pop
1:     A 2020 300    25 1234
2:     A 2021 350    30 1543
3:     A 2022 400    35 1754
4:     B 2020 123     3 2500
5:     B 2021 175     6 2600
6:     B 2022 156     8 2400
> dt[, rate := rpois(.N, lambda=Count)/Pop*100000]
> dt[, value := N*(rate/100000)]
> dt
   Group Year   N Count  Pop      rate     value
1:     A 2020 300    25 1234 1944.8947 5.8346840
2:     A 2021 350    30 1543 2009.0732 7.0317563
3:     A 2022 400    35 1754 1938.4265 7.7537058
4:     B 2020 123     3 2500  120.0000 0.1476000
5:     B 2021 175     6 2600  115.3846 0.2019231
6:     B 2022 156     8 2400  416.6667 0.6500000

我希望能够执行此计算value1,000 次,并保留所有实例(使用 1-1,000 的指示符列指示哪个运行)而不使用循环。有什么建议?

回答

也许你可以replicate像下面这样尝试

n <- 1000
dt[, paste0(c("rate", "value"), rep(1:n, each = 2)) := replicate(n, list(u <- rpois(.N, lambda = Count) / Pop * 100000, N * (u / 100000)))]

以上是给定随机数生成额外行的高效 data.table 方法的全部内容。
THE END
分享
二维码
< <上一篇
下一篇>>