一、现象
做建模的时候,有时候需要对数据进行去重,之前用SQL实现distinct,但长时间不使用Pandas处理去重数据,突然就犯了难,就得上百度搜搜,所以遇见问题的时候,做个笔记,方便自己日后温故。
二、解决方案
import pandas as pd
df = pd.read_csv('data.csv')
# df.shape
df = df.drop_duplicates(subset = ['user_id'])
# df.shape
解决方案:带疑问,多交流,勤动手,频思考