《数据可视化》—— 基于Python的应用

第4章 数据的探索性分析

4.1 数据的描述分析

4.1.1 计数据汇总分析

(1)频数:绝对数
(2)频率:相对数

4.1.2 计量数据汇总分析

(1)均数(算术平均数)
(2)中位数
(3)极差

(4)方差

(5)标准差

(6)四分位数间距(IQR)

(7)偏度

(8)峰度

4.1.3 汇总性统计量

自编计算基本统计量函数

4.2 数据的直观分析

4.2.1 常用的绘图函数

4.2.1.1 计数数据统计图

4.2.1.2 计量数据统计图

4.2.1.3 图形参数的设置

标题、标签、标尺及颜色

线型和符号

绘图函数附加图形

文字函数:text(x, y, labels,...),在(x, y)处添加用 labels 指定的文字

图例:绘制图形后,可使用 legend 函数给图形加图例

误差线图

误差条图

4.2.1.4 多图的排列与绘制

一行绘制两个图形
一列绘制两个图形
根据页面大小绘制两个图形
一页绘制四个图形

4.2.2 基于 pandas 的绘图

4.2.2.1 计量数据统计图

4.2.2.2 计数数据统计图

4.3 数据的分组分析

4.3.1 一维频数表与图

4.3.1.1 计数数据频数分布

4.3.1.2 计量数据频数分布

(1)身高频数表与条图
(2)支出频数表
(3)自定义计量频率分析函数

4.3.2 二维集聚表与图

4.3.2.1 计数数据的列联表

(1)二维列联表
(2)复式条图

4.3.2.2 计量数据的集聚表

(1)分组 groupby 函数

4.3.3 多维透视表与图

4.3.3.1 计数数据透视表与图

4.3.3.2 计量数据透视表与图

4.3.3.3 复合数据透视表与图