簡単!pythonでcsvファイルの重複する行を消す

 

Excelでも重複行を削除することはできます。でも、pythonで出来たらカッコイイ!と思っていました。

import pandas as pd

df = pd.read_csv('ファイル名', encoding="utf-8")

dfd = df.drop_duplicates(["日付","開催","天気","R","レース名","頭数","枠番"])

dfd.to_csv('上とは別のファイル名')

5行目の””の中はcsvファイルに合わせてください。今回は競馬のデータを例にしました。

はい。めちゃくちゃ簡単です。出来てもカッコよくはないですね…