使用Pandas计算元组最长递增子序列的矢量化或有效方法
使用pandas/python,我想计算每组元组的最长递增子序列DTE,但有效地使用13M行。现在,使用 apply/iteration 大约需要 10 个小时。
这大概是我的问题:
| DTE | 罢工 | 出价 | 问 |
|---|---|---|---|
| 1 | 100 | 10 | 11 |
| 1 | 200 | 16 | 17 |
| 1 | 300 | 17 | 18 |
| 1 | 400 | 11 | 12 |
| 1 | 500 | 12 | 13 |
| 1 | 600 | 13 | 14 |
| 2 | 100 | 10 | 30 |
| 2 | 200 | 15 | 20 |
| 2 | 300 | 16 | 21 |
使用pandas/python,我想计算每组元组的最长递增子序列DTE,但有效地使用13M行。现在,使用 apply/iteration 大约需要 10 个小时。
这大概是我的问题:
| DTE | 罢工 | 出价 | 问 |
|---|---|---|---|
| 1 | 100 | 10 | 11 |
| 1 | 200 | 16 | 17 |
| 1 | 300 | 17 | 18 |
| 1 | 400 | 11 | 12 |
| 1 | 500 | 12 | 13 |
| 1 | 600 | 13 | 14 |
| 2 | 100 | 10 | 30 |
| 2 | 200 | 15 | 20 |
| 2 | 300 | 16 | 21 |