在熊猫的坐标行中只保留最大间隔

html5 • 2022年9月13日 pm2:37 • 问答

我有一个数据框，例如：

   Groups Name start end  sum
1      G1    A   451 954 1405
2      G1    B   451 951 1402
3      G1    C   451 969 1420
4      G1    D   463 870 1333
5      G1    E   463 888 1351
6      G1    X   230 450  680
7      G1    Z   229 450  681
8      G2    F   119 841  960
9      G2    G   118 842  960
10     G3    H   460 790 1250
11     G3    I   123 300 177
12     G4    J   343 878 1221
13     G4    K   343 878 1221
14     G4    L   320 862 1182

我希望每个组只保留一个区间代表（一个区间意味着df.start和df.end行之间的重叠），我解释一下：

例如，在G1 中有2 个间隔组：

间隔 1（带有min = 451和max = 969）：

Name start end sum
A    451   954 1405
B    451   951 1402
C    451   969 1420
D    463   870 1333
E    463   888 1351

然后我取最大的df.sum（这里1420）

和

间隔 2 （带min = 229和max = 450）

Name start end  sum
X    230   450  680
Z    229   450  681

然后我取最大的df.sum（这里681）

如果我对整个数据框这样做，我会得到：

   Groups Name start end  sum
3      G1    C   451 969 1420
7      G1    Z   229 450  681
9      G2    G   118 842  960
10     G3    H   460 790 1250
11     G3    I   123 300 177
12     G4    J   343 878 1221

Does someone have an idea?
Here are the data in dictionary format :

{'Groups Name start end  sum': {0: 'G1    A   451 954 1405', 1: 'G1    B   451 951 1402', 2: 'G1    C   451 969 1420', 3: 'G1    D   463 870 1333', 4: 'G1    E   463 888 1351', 5: 'G1    X   230 450  680', 6: 'G1    Z   229 450  681', 7: 'G2    F   119 841  960', 8: 'G2    G   118 842  960', 9: 'G3    H   460 790 1250', 10: 'G3    I   123 300 177', 11: 'G4    J   343 878 1221', 12: 'G4    K   343 878 1221', 13: 'G4    L   320 862 1182'}}

以上是在熊猫的坐标行中只保留最大间隔的全部内容。

THE END

二维码

使用气流模块的PythonVirtualenvOperator无法使用AttributeError执行：模块“airflow”没有属性“utils”

< <上一篇

为什么我的CompletableFuture代码在Java8中运行而不在Java11中运行？

下一篇>>

搜索内容

在熊猫的坐标行中只保留最大间隔

目录

目录

推荐文章

最新文章