我有一个熊猫数据框如下:
I have a pandas dataframe as follows:
A B C
1 2 x
1 2 y
3 4 z
3 5 x
我希望只剩下 1 行在特定列中共享相同值的行.在上面的示例中,我的意思是列 A 和 B.换句话说,如果列 A 和 B 的值在数据框中多次出现,则应该只保留一行(哪一行无关紧要).
I want that only 1 row remains of rows that share the same values in specific columns. In the example above I mean columns A and B. In other words, if the values of columns A and B occur more than once in the dataframe, only one row should remain (which one does not matter).
FWIW:所谓重复行的最大数量(即列A和B相同)为2.
FWIW: the maximum number of so called duplicate rows (that is, where column A and B are the same) is 2.
结果应该是这样的:
A B C
1 2 x
3 4 z
3 5 x
或
A B C
1 2 y
3 4 z
3 5 x
使用 drop_duplicates 和参数 subset,为了只保留最后重复的行添加 keep='last':p>
Use drop_duplicates with parameter subset, for keeping only last duplicated rows add keep='last':
df1 = df.drop_duplicates(subset=['A','B'])
#same as
#df1 = df.drop_duplicates(subset=['A','B'], keep='first')
print (df1)
A B C
0 1 2 x
2 3 4 z
3 3 5 x
<小时>
df2 = df.drop_duplicates(subset=['A','B'], keep='last')
print (df2)
A B C
1 1 2 y
2 3 4 z
3 3 5 x
这篇关于从 Pandas 数据框中删除只有某些列具有相同值的重复行的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持html5模板网!
如何在python中的感兴趣区域周围绘制一个矩形How to draw a rectangle around a region of interest in python(如何在python中的感兴趣区域周围绘制一个矩形)
如何使用 OpenCV 检测和跟踪人员?How can I detect and track people using OpenCV?(如何使用 OpenCV 检测和跟踪人员?)
如何在图像的多个矩形边界框中应用阈值?How to apply threshold within multiple rectangular bounding boxes in an image?(如何在图像的多个矩形边界框中应用阈值?)
如何下载 Coco Dataset 的特定部分?How can I download a specific part of Coco Dataset?(如何下载 Coco Dataset 的特定部分?)
根据文本方向检测图像方向角度Detect image orientation angle based on text direction(根据文本方向检测图像方向角度)
使用 Opencv 检测图像中矩形的中心和角度Detect centre and angle of rectangles in an image using Opencv(使用 Opencv 检测图像中矩形的中心和角度)