Python数据可视化分析:共享单车使用量数据深度解析(第2部分)
目录
3️⃣ 4.3 利用条形图、折线图探究单车使用量和季节的关系
📍 折线图
4️⃣ 4.4 利用条形图、折线图探究单车使用量和月份的关系
5️⃣ 4.5 利用条形图、箱线图探究单车使用量和星期的关系
6️⃣ 4.6 利用箱线图探究单车使用量和天气的关系
📈 5、拟合回归线
1️⃣ 5.1 利用条形图、折线图探究单车使用量和温度、湿度和风速的关系
📍 ggplot画图步骤及方法
◾ df = ggplot(data, aes(x, y))
◾ 画图形
◾ 添加线条有多种类型的方法
◾ 文本设置
🔷 单车使用量与温度的关系
🔷 单车使用量与湿度的关系
🔷 单车使用量与风速的关系
🌳 6、利用决策树预测单车的使用量
1️⃣ 将数据分为训练集和测试集
2️⃣ 导入库和建立模型
📍 用于创建决策树回归模型的类DecisionTreeRegressor(criterion,splitter,max_depth,min_samples_split,min_samples_leaf,min_weight_fraction_leaf,max_features,random_state,max_leaf_nodes,min_impurity_decreas,ccp_alpha)
3️⃣ 决策树可视化
📍 将决策树可视化
4️⃣ 查看特征重要性并绘制条形图
3️⃣ 4.3 利用条形图、折线图探究单车使用量和季节的关系
📍 折线图
plt.plot(x, y, format_string, **kwargs, color, linestyle, linewidth, marker, markersize, markeredgecolor, markerfacecolor)
字段 | 数据类型 | 含义 |
x, y |
数组 or list |
x 和 y 是表示数据点坐标的序列。x 是x轴上的坐标值,y 是对应的y轴上的坐标值 |
format_string |
str |
可选的字符串,用于指定线条的样式、颜色和标记。例如,’r-‘ 表示红色实线,’go’ 表示绿色圆圈标记 |
color |
str or 颜色代码 |
参数用于指定线条的颜色。可以是颜色的名称(如’red’),十六进制颜色代码(如’#FF0000’),RGB元组(如(1.0, 0.0, 0.0))等 |
linestyle |
str |
指定线条的样式。例如,’-‘ 表示实线,’–‘ 表示虚线,’-.’ 表示点划线,’:’ 表示点状线,’ ‘(空格)表示没有线条 |
linewidth |
float or int |
用于指定线条的宽度 |
marker |
str |
指定数据点的标记样式。例如,’o’ 表示圆圈,’.’ 表示点,’,’ 表示像素点,’s’ 表示正方形等 |
markersize |
float or int |
指定标记的大小 |
markeredgecolor |
str or 颜色代码 |
指定标记边缘的颜色 |
markerfacecolor |
str or 颜色代码 |
指定标记填充的颜色 |
# 1.绘图
### 分组聚合
season_Aggregated = pd.DataFrame(data.groupby(['年份','季节']).sum())['使用量'].reset_index()
# 将data的数据,根据'年份'、'季节'进行分组'进行分组,并统计总数,然后根据'使用量'进行重新编排索引
# 2.绘制条形图
plt.figure(figsize=(14, 8))
plt.subplot(1, 2, 1)
plt.bar(season_Aggregated['季节'][:4]-0.2, # 数据
season_Aggregated['使用量'][:4], # 数据
width=0.4, # 表示柱状图的宽度
color='green', label='2011') # 设置柱子颜色和标签
plt.bar(season_Aggregated['季节'][4:]+0.2, # 数据
season_Aggregated['使用量'][4:], # 数据
width=0.4, # 表示柱状图的宽度
color='yellow', label='2012') # 设置柱子颜色和标签
plt.title('使用量与季节关系条形图', fontsize=15) # 设置图形的标题以及文字的打下
plt.xlabel('季节', fontsize=15) # 设置x轴标签以及字体大小
plt.ylabel('使用量', fontsize=15) # 设置y轴标签以及字体大小
plt.xticks([1, 2, 3, 4], ['春季', '夏季', '秋季', '冬季']) # 设置x轴刻度以及对应刻度的标签
plt.legend(loc='best') # 设置图例位置
# 3.绘制折线图
plt.subplot(1, 2, 2)
plt.plot(season_Aggregated['季节'][:4],
season_Aggregated['使用量'][:4],
color='green', # 设置颜色
lw=3, # 设置折线的宽度
marker='o', # 设中的点的标记图形
label='2011')
plt.plot(season_Aggregated['季节'][4:],
season_Aggregated['使用量'][4:],
color='yellow', # 设置颜色
lw=3, # 设置折线的宽度
marker='o', # 设中的点的标记图形
label='2012')
plt.title('使用量与季节折线图', fontsize=15)
plt.xlabel('季节', fontsize=15)
plt.ylabel('使用量', fontsize=15)
plt.xticks([1, 2, 3, 4], ['春季', '夏季', '秋季', '冬季'])
plt.legend(loc='best')
plt.grid(True) # 在图形内部显示网格线
4️⃣ 4.4 利用条形图、折线图探究单车使用量和月份的关系
# 1.绘图
### 分组聚合
month_Aggregated = pd.DataFrame(data.groupby(['年份','月份']).sum())['使用量'].reset_index()
# 将data的数据,根据'年份'、'月份'进行分组'进行分组,并统计总数,然后根据'使用量'进行重新编排索引
# 2.绘制条形图
plt.figure(figsize=(14, 10))
plt.subplot(2, 1, 1)
plt.bar(month_Aggregated['月份'][:12]-0.2,
month_Aggregated['使用量'][:12],
width=0.4, # 表示柱状图的宽度
color='blue', label='2011')
plt.bar(month_Aggregated['月份'][12:]+0.2,
month_Aggregated['使用量'][12:],
width=0.4, # 表示柱状图的宽度
color='gold', label='2012')
plt.title('使用量与月份关系条形图', fontsize=15)
plt.xlabel('月份', fontsize=15)
plt.ylabel('使用量', fontsize=15)
plt.xticks(np.arange(1, 13)) # 横坐标为1-12
plt.legend(loc=&#
作者:Cherry晴