Python数据分析教程
-
-
Python数据分析 – GroupBy机制
GroupBy机制 Hadley Wickham是许多流行R语言软件包的作者,他创造了用于描述组操作的术语拆分-应用-联合(split-apply-combine)。在操作的第一步,数据包含在…… -
Python数据分析 – 数据聚合
数据聚合 聚合是指所有根据数组产生标量值的数据转换过程。之前的例子已经使用了一些聚合操作,包括mean、count、min和sum等。 下表展示了优化的groupby方法。…… -
-
-
Python数据分析 – 日期和时间数据的类型及工具
日期和时间数据的类型及工具 Python标准库包含了日期和时间数据的类型,也包括日历相关的功能。datetime、time和calendar模块是开始处理时间数据的主要内容。d…… -
Python数据分析 – 日期范围、频率和移位
日期范围、频率和移位 pandas的通用时间序列是不规则的,即时间序列的频率不是固定的。经常有需要处理固定频率的场景,例如每日的、每月的或每15分钟,这意味…… -
Python数据分析 – 时间序列基础
时间序列基础 pandas中的基础时间序列种类是由时间戳索引的Series,在pandas外部则通常表示为Python字符串或datetime对象: 在这种情况下,这些datetime对象…… -
-
Python数据分析 – 时间区间和区间算术
时间区间和区间算术 时间区间表示的是时间范围,比如一些天、一些月、一些季度或者是一些年。 在这个例子中,Period对象表示的是从2007年1月1日到2007年12月3…… -
-
-
Python数据分析 – 高阶pandas
高阶pandas 之前的章节关注于介绍不同类型的数据规则工作流以及NumPy、pandas和其他类库的特征。随着时间的推移,pandas已经开发了用于助力用户的深度特征。本…… -
Python数据分析 – 分类数据
分类数据 本节会介绍pandas的Categorical类型。将展示在使用pandas进行某些操作时如何获得更好的性能和内存使用。还会介绍一些在统计和机器学习应用中使用分类…… -
Python数据分析 – Python建模库介绍
Python建模库介绍 专注于提供一个用Python做数据分析的编程基础。因为数据分析师和科学家经常在数据规整和准备上花费大量的时间,本文的结构反映了精通这些技…… -
Python数据分析 – 方法链技术
方法链技术 在向数据集应用一系列变换时,可能会发现自己创建了许多临时变量,而这些变量在分析中从未使用过。例如,考虑以下例子:df = load_data() 尽管在…… -
Python数据分析 – 高阶GroupBy应用
高阶GroupBy应用 在前面深入讨论了在Series和DataFrame使用groupby方法,但仍然有一些额外的方法可能会用到。 1、分组转换和“展开”GroupBy 前面,在分组操作中…… -
Python数据分析 – pandas与建模代码的结合
pandas与建模代码的结合 使用pandas用于数据载入和数据清洗,之后切换到模型库去建立模型是一个常见的模型开发工作流。在机器学习中,特征工程是模型开发的重…… -
Python数据分析 – statsmodels介绍
statsmodels介绍 statsmodels是一个Python库,用于拟合多种统计模型,执行统计测试以及数据探索和可视化。statsmodels包含更多的“经典”频率学派统计方法,而贝…… -
Python数据分析 – 使用sklearn转换器处理数据
使用sklearn转换器处理数据 sklearn 提供了 model_selection 模型选择模块、preprocessing 数据预处理模块与decompisition特征分解模块。通过这3个模块能够实…… -
-
-
-
Python数据分析 – 高阶ufunc用法
高阶ufunc用法 虽然许多NumPy用户只会使用通用函数提供的按元素操作,但还有一些额外的功能偶尔可以帮助编写更简洁的代码而无须循环。 1、ufunc实例方法 NumPy…… -