使用pandas怎么去重复行-创新互联
使用pandas怎么去重复行?相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。
创新互联拥有十余年成都网站建设工作经验,为各大企业提供网站建设、做网站服务,对于网页设计、PC网站建设(电脑版网站建设)、重庆APP开发公司、wap网站建设(手机版网站建设)、程序开发、网站优化(SEO优化)、微网站、域名注册等,凭借多年来在互联网的打拼,我们在互联网网站建设行业积累了很多网站制作、网站设计、网络营销经验,集策划、开发、设计、营销、管理等网站化运作于一体,具备承接各种规模类型的网站建设项目的能力。数据帧作为一个例子:
import pandas as pd data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]})
pandas判断dataframe是否含有重复行数据用:df.duplicated()
第一次出现的数据为False.重复的数据行就被记录为True。
去掉重复行数据使用data.drop_duplicates().
可以看到索引乱了,我们使用data.reset_index(),里面的参数drop=True,表明要舍掉原来的索引,不然的话原来的索引会保留下来。
分类汇总主要使用groupby(表明汇总的条件列)以及agg(要汇总的字段/列以及汇总的方式:求和还是大最小值或者计数)。完整代码如下图
# -*- coding: utf-8 -*- """ Created on Fri Jul 20 09:08:10 2018 @author: FanXiaoLei """ import pandas as pd data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]}) if data.duplicated: dataA=data.drop_duplicates().reset_index(drop=True) print(dataA) dataB=dataA.groupby(by='产品').agg({'数量':sum}) print('数据汇总结果:') print(dataB)
结果展示如下图:
看完上述内容,你们掌握使用pandas怎么去重复行的方法了吗?如果还想学到更多技能或想了解更多相关内容,欢迎关注创新互联行业资讯频道,感谢各位的阅读!
网页题目:使用pandas怎么去重复行-创新互联
本文来源:http://scpingwu.com/article/djpjhj.html