数据帧熊猫的每个单元格的逗号分隔
如果有任何带逗号的单元格(如果条件),我想将它们分开并选择最后一个,例如:
原始表如下所示:
| 指数 | x1 | x2 |
|---|---|---|
| 0 | 香蕉 | 橘子 |
| 1 | 葡萄、柑橘 | 苹果 |
| 2 | 橘子,橘子 | 瓜、梨 |
回答
您可以使用访问器访问它.str:
>>> df
x1 x2
index
0 banana orange
1 grapes, Citrus apples
2 tangerine, tangerine melons, pears
>>> df.apply(lambda col: col.str.split(', ').str[-1], axis=1)
x1 x2
index
0 banana orange
1 Citrus apples
2 tangerine pears
或者,分步骤:
>>> df['x1'] = df['x1'].str.split(', ').str[-1]
>>> df['x2'] = df['x2'].str.split(', ').str[-1]