Pandasにおける複数条件での重複削除
/
Pandasにおける複数条件での重複削除を実施します.
# データフレームの作成
データフレームの作成します.
import pandas as pd
import numpy as np
df = pd.DataFrame([['A','a',110], ['C','c',130], ['C','c',130], ['D', 'a',140],['A','a',110]],
columns=['col01', 'col02', 'col03'])
df.head()
col01 | col02 | col03 |
---|---|---|
A | a | 110 |
C | c | 130 |
C | c | 130 |
D | a | 140 |
A | a | 110 |
# 重複削除
# 全カラム対象
display(df.drop_duplicates())
# col02のみ対象
display(df.drop_duplicates(subset=['col02']))
# col02とcol03を対象
display(df.drop_duplicates(subset=['col02', 'col03']))
全カラム対象
col01 | col02 | col03 |
---|---|---|
A | a | 110 |
C | c | 130 |
D | a | 140 |
col02のみ対象
col01 | col02 | col03 |
---|---|---|
A | a | 110 |
C | c | 130 |
col02とcol03を対象
col01 | col02 | col03 |
---|---|---|
A | a | 110 |
C | c | 130 |
D | a | 140 |
# まとめ
Pandasにおける複数条件での重複削除を実施しました.
# 参考サイト
Pandasのデータフレームの重複する行を削除する方法|drop_duplicates (opens new window)