版本:v0.25.0 免费版 大小:15.80 MB
类别:编程软件 系统:WinXP, Win7, Win8, Win10
立即下载Pandas模块是python中很重要的一个存在,它可以将同一索引下的数据进行合并,帮助大家更好的进行数据分析!最初是用于金融行业数据分析,后来得以在各个行业中广泛运行。
Pandas是python的一个数据分析包,最初由AQR Capital Management于2008年4月开发,并于2009年底开源出来,目前由专注于Python数据包开发的PyData开发team继续开发和维护,属于PyData项目的一部分。Pandas最初被作为金融数据分析工具而开发出来,因此,pandas为时间序列分析提供了很好的支持。 Pandas的名称来自于面板数据(panel data)和python数据分析(data analysis)。panel data是经济学中关于多维数据集的一个术语,在Pandas中也提供了panel的数据类型。
我这里简单介绍一下Python中,pandas模块定义的两种常用的数据结构,Series和DaraFrame。Series和Python中的Dict类似,但是是结构化的,而DataFrame和数据库中的表类似。
1.pandas基本数据结构-pandas.Series&pandas.DataFrame
第二种定义DataFrame的方法不能手动设置index,只能自动生成序列。
date_range('20180201',periods=8)定义时间序列,可以用freq来设置频率:s=pd.date_range('20180101',periods=8,freq='h')
支持的频率有s、min、h、d、w、m、y,默认为d
2.pandas查看数据
3.pandas常规操作
包括许多API更改、新特性、增强和性能改进,以及大量bug修复。
亮点包括:
删除Python 2支持
使用重新标记的Groupby聚合
更好的多指标报告
更好的截断repr的系列和数据aframe
查看全部