组连续工作日日期(不包括周末和节假日)

我有关于不同人 ( ID)、他们工作的日期 ( Date) 以及他们每个日期工作了多少小时 ( Hours) 的数据。

周一至周五被视为工作日。对于每个ID,我想对连续工作日进行分组。在决定工作日是否连续时,应省略周末和节假日。

一些例子:

如果一个人在周一、周二和周三工作,然后跳过周四,并在周五再次工作,那么周一至周三被视为一组,周五被视为另一组。

如果一个人每周周四和周五工作,下周周一和周二工作,那么这四天应该在同一组中。因此,当检查若在周末的日子里被省略工作日内是连续的。

如果一周的周一 - 周五和下周的周一 - 周五,那么我会将这两个星期算作连续的工作日。

我还想考虑美国常见的假期(例如新年),这样 12/31/2020 至 1/4/2021 仍将算作连续工作日。

创建分组变量后,我想对每个组的工作时间求和。

示例数据:

df1 = structure(list(ID = c(1, 1, 1, 1, 2, 2, 3, 3, 
3, 3), Date = structure(c(18781, 18782, 18785, 18750, 18687, 
18688, 18626, 18627, 18631, 18634), class = "Date"), Hours = c(8, 
8, 8, 16, 8, 8, 8, 8, 8, 8)), row.names = c(NA, -10L), class = "data.frame")


  ID       Date Hours
1  1 2021-06-03     8
2  1 2021-06-04     8
3  1 2021-06-07     8
4  1 2021-05-03    16
5  2 2021-03-01     8
6  2 2021-03-02     8
7  3 2020-12-30     8
8  3 2020-12-31     8
9  3 2021-01-04     8
10 3 2021-01-07     8

我想象我的输出看起来像这样:

 ID      Date1      Date2 Hours
1 1 2021-06-03 2021-06-07    24
# the weekend, June 5-6, is omitted
# when the group of consecutive working days is created
 
2 1 2021-05-03 2021-05-03    16
3 2 2021-03-01 2021-03-02    16

4 3 2020-12-30 2021-01-04    24
# the public holiday (Jan 1) and the weekend (Jan 2-3) are omitted
   
5 3 2021-01-07 2021-01-07     8

我的首要任务是至少弄清楚连续工作周,假期部分将是额外的奖励。

以上是组连续工作日日期(不包括周末和节假日)的全部内容。
THE END
分享
二维码
< <上一篇
下一篇>>