国内最专业的IT技术学习网

UI设计

当前位置:主页 > UI设计 >

Python数据分析-看了这篇文章,数据清洗你也就完

发布时间:2019/09/11标签:   数据    点击量:

原标题:Python数据分析-看了这篇文章,数据清洗你也就完
全部做数据剖析的条件就是:你得无数据,并且曾经经由荡涤,收拾成须要的格局。不论你从那里猎取了数据,你都须要当真认真观看你的数据,对分歧规的数据停止清算,固然不是说必定要有这个步调,然而这是一个好习气,由于保不齐前面剖析的时间发觉之后果为没有对数据停止收拾,而招致统计的数占有成绩,明天小编就把平常用的数据荡涤的技能停止一个梳理,外面能够许多你都懂,那就当复习了吧!文章纲要: 怎样更无效的导入你的数据 片面的观看数据 设置索引 设置标签 处置缺失值 删除反复项 数据范例转换 挑选数据 数据排序 处置文本 兼并&婚配导入数据:pd.read_excel("aa.xlsx")pd.read_csv("aa.xlsx")pd.read_clipboard怎样无效的导入数据:1、限制导入的行,假如数据很大,早期只是为了检查数据,能够先导入一小局部:pd.read_csv("aaa.csv",nrows=1000)pd.read_excel("aa.xlsx",nrows=1000)2、假如你晓得须要那些列,并且晓得标署名,能够只导入须要的数据:pd.read_csv("aaa.csv",usecols=["A","B"])pd.read_excel("aa.xlsx",usecols=["A","B"])3、对于列标签,假如没有,或许须要从新设定:pd.read_excel("aa.xlsx",header=None)#不须要本来的索引,会默许调配索引:0,1,2pd.read_excel("aa.xlsx",header=1)#设置第二行动列标签pd.read_excel("aa.xlsx",header=[1,2])#多级索引pd.read_csv("aaa.csv",header=None)pd.read_csv("aaa.csv",header=1)pd.read_csv("aaa.csv",header=[1,2])4、设置索引列,假如你能够供给一个更有益于数据剖析的索引列,不然调配默许的0,1,2:pd.read_csv("aaa.csv",index_col=1)pd.read_excel("aa.xlsx",index_col=2)5、设置数值范例,这一步很主要,波及到前期数据盘算,也能够前期设置:pd.read_csv("aaa.csv",converters={'排名':str,'场次':float})data=pd.read_excel(io,sheet_name='converters',converters={'排名':str,'场次':float})片面的检查数据:检查前几行:data.head()python数据分析-看了这篇文章,数据清洗你也就完全掌握了检查末端几行:

python数据分析-看了这篇文章,数据清洗你也就完全掌握了
检查数据维度:data.shape(16281,7)检查DataFrame的数据范例df.dtypes检查DataFrame的索引df.index检查DataFrame的列索引df.columns检查DataFrame的值df.values

版权信息Copyright ? 银河官网 版权所有??? ICP备案编号:鲁ICP备09013610号