Python数据分析基础教程——数据可视化(第2版)
王斌会 王术 电子工业出版社 2021.1
1.2.2.1 Python的特色
1.2.2.2 Python的特点
1.2.2.3 Python的库
1.2.3.1 Python基础编程环境
本书采用基于Anaconda的Jupyter平台进行数据分析。
1.2.3.2 Anaconda计算发行包
#在Jupyter中安装包夜很容易,执行下面的命令
#!pip install plotnine
jupyter lab --notebook-dir=D:\DaPy2
jupyter notebook --notebook-dir=D:\DaPy2
# 无格式输出
1 * 8 + 1
12 * 8 + 2
123 * 8 + 3
1234 * 8 + 4
12345 * 8 + 5
123456 * 8 + 6
1234567 * 8 + 7
12345678 * 8 + 8
123456789 * 8 + 9
987654321
# 有格式输出
print(' 1 * 8 + 1 =', 1 * 8 + 1)
print(' 12 * 8 + 2 =', 12 * 8 + 2)
print(' 123 * 8 + 3 =', 123 * 8 + 3)
print(' 1234 * 8 + 4 =', 1234 * 8 + 4)
print(' 12345 * 8 + 5 =', 12345 * 8 + 5)
print(' 123456 * 8 + 6 =', 123456 * 8 + 6)
print(' 1234567 * 8 + 7 =', 1234567 * 8 + 7)
print(' 12345678 * 8 + 8 =', 12345678 * 8 + 8)
print('123456789 * 8 + 9 =', 123456789 * 8 + 9)
1 * 8 + 1 = 9 12 * 8 + 2 = 98 123 * 8 + 3 = 987 1234 * 8 + 4 = 9876 12345 * 8 + 5 = 98765 123456 * 8 + 6 = 987654 1234567 * 8 + 7 = 9876543 12345678 * 8 + 8 = 98765432 123456789 * 8 + 9 = 987654321
# 乘法口诀
for i in range(1,10): #range(1,10)=[1,2,3,4,5,6,7,8,9]
for j in range(1,i+1):
print("%d×%d=%d"%(j,i,j*i),end=' ')
print("")
1×1=1 1×2=2 2×2=4 1×3=3 2×3=6 3×3=9 1×4=4 2×4=8 3×4=12 4×4=16 1×5=5 2×5=10 3×5=15 4×5=20 5×5=25 1×6=6 2×6=12 3×6=18 4×6=24 5×6=30 6×6=36 1×7=7 2×7=14 3×7=21 4×7=28 5×7=35 6×7=42 7×7=49 1×8=8 2×8=16 3×8=24 4×8=32 5×8=40 6×8=48 7×8=56 8×8=64 1×9=9 2×9=18 3×9=27 4×9=36 5×9=45 6×9=54 7×9=63 8×9=72 9×9=81
x=[1,3,5,7,9];x
y=[2,4,6,8,10];y #y=2x
[2, 4, 6, 8, 10]
import matplotlib.pyplot as plt #加载基本绘图包
plt.plot(x,y); #线图
plt.plot(x,y,'o-'); #点线图
from numpy import * #加载数值运算包
t=linspace(0,2*pi)
x=2*sin(t);y=3*cos(t)
import matplotlib.pyplot as plt #加载基本绘图包
plt.plot(x,y,c='red'); plt.axvline(x=0); plt.axhline(y=0);
plt.text(0.2,1,r'$\frac{x^2}{2^2}+\frac{y^2}{3^2}=1$',fontsize=15);
国外(较慢):www.jupyter.org
国内(注册):https://www.heywhale.com/mw/project/5f619f7aae300e004602aa3d?token=3aff97571dcb6299
#获得当前目录
%pwd
'E:\\6.py\\Course\\DaPy\\DaPy2-Code'
#改变工作目录
%cd "D:\\DaPy"
%pwd
[WinError 2] 系统找不到指定的文件。: 'D:\\\\DaPy' E:\6.py\Course\DaPy\DaPy2-Code
'E:\\6.py\\Course\\DaPy\\DaPy2-Code'
!pip install plotnine #安装 plotnine 包
ERROR: Invalid requirement: '#安装'
import math #基础数学包
import numpy #数值分析包
import pandas #数据操作包
import matplotlib #基本绘图包
import numpy as np
import pandas as pd
import matplotlib as plt
from math import sqrt, log, pi
from IPython.core.interactiveshell import InteractiveShell as IS
IS.ast_node_interactivity = "all" #多行命令一次输出
#查看数据对象
#%who
#生成数据对象
x=10.12 #创建对象 x
#%who
#删除数据对象
del x #删除对象 x
#%who
(1)数值型
n=10 #整数
n #无格式输出,相当于 print(n)
10
print("n=",n) #有格式输出
x=10.234 #实数
x
print(x)
print("x=%10.5f"%x)
n= 10
10.234
10.234 x= 10.23400
(2)逻辑型
a=True;a
b=False;b
True
False
10>3
10<3
True
False
(3)字符型
s = 'I love Python';
s
s[7]
s[2:6]
s+' '+s
s*2
'I love Python'
'P'
'love'
'I love Python I love Python'
'I love PythonI love Python'
(1)List(列表)
list1 =[] # 空列表
list1
[]
list1 = ['Python', 786 , 2.23, 'R', 70.2]
list1 # 输出完整列表
['Python', 786, 2.23, 'R', 70.2]
list1[0] # 输出列表的第一个元素
'Python'
list1[1:3] # 输出第二个至第三个元素
[786, 2.23]
list1[2:] # 输出从第三个开始至列表末尾的所有元素
list1 * 2 # 输出列表两次
list1 + list1[2:4] # 打印组合的列表
[2.23, 'R', 70.2]
['Python', 786, 2.23, 'R', 70.2, 'Python', 786, 2.23, 'R', 70.2]
['Python', 786, 2.23, 'R', 70.2, 2.23, 'R']
X=[1,3,6,4,9];X
[1, 3, 6, 4, 9]
sex=['女','男','男','女','男']
sex
['女', '男', '男', '女', '男']
weight=[67,66,83,68,70];
weight
[67, 66, 83, 68, 70]
(2)Dictionary(字典)
{} #空字典
{}
dict1={'name':'john','code':6734,'dept':'sales'};dict1 #定义字典
{'name': 'john', 'code': 6734, 'dept': 'sales'}
dict1['code'] # 输出键为'code' 的值
6734
dict1.keys() # 输出所有键
dict_keys(['name', 'code', 'dept'])
dict1.values() # 输出所有值
dict_values(['john', 6734, 'sales'])
dict2={'sex': sex,'weight':weight}; dict2 #根据列表构成字典
{'sex': ['女', '男', '男', '女', '男'], 'weight': [67, 66, 83, 68, 70]}