Python数据可视化分析:共享单车使用量数据深度解析(第2部分)

目录

3️⃣ 4.3 利用条形图、折线图探究单车使用量和季节的关系

📍 折线图 

 4️⃣ 4.4 利用条形图、折线图探究单车使用量和月份的关系

 5️⃣ 4.5 利用条形图、箱线图探究单车使用量和星期的关系

6️⃣ 4.6 利用箱线图探究单车使用量和天气的关系

📈 5、拟合回归线

1️⃣ 5.1 利用条形图、折线图探究单车使用量和温度、湿度和风速的关系

📍 ggplot画图步骤及方法

◾ df = ggplot(data, aes(x, y))

◾ 画图形

◾ 添加线条有多种类型的方法

◾ 文本设置

🔷 单车使用量与温度的关系

🔷 单车使用量与湿度的关系

🔷 单车使用量与风速的关系 

🌳 6、利用决策树预测单车的使用量

1️⃣ 将数据分为训练集和测试集

2️⃣ 导入库和建立模型

 📍  用于创建决策树回归模型的类DecisionTreeRegressor(criterion,splitter,max_depth,min_samples_split,min_samples_leaf,min_weight_fraction_leaf,max_features,random_state,max_leaf_nodes,min_impurity_decreas,ccp_alpha)

3️⃣ 决策树可视化

 📍 将决策树可视化

4️⃣ 查看特征重要性并绘制条形图


3️⃣ 4.3 利用条形图、折线图探究单车使用量和季节的关系

📍 折线图 

plt.plot(x, y, format_string, **kwargs, color, linestyle, linewidth, marker, markersize, markeredgecolor, markerfacecolor)

字段 数据类型 含义

x, y

数组 or list

x 和 y 是表示数据点坐标的序列。x 是x轴上的坐标值,y 是对应的y轴上的坐标值

format_string

str

可选的字符串,用于指定线条的样式、颜色和标记。例如,’r-‘ 表示红色实线,’go’ 表示绿色圆圈标记

color

str or 

颜色代码

参数用于指定线条的颜色。可以是颜色的名称(如’red’),十六进制颜色代码(如’#FF0000’),RGB元组(如(1.0, 0.0, 0.0))等

linestyle

str

指定线条的样式。例如,’-‘ 表示实线,’–‘ 表示虚线,’-.’ 表示点划线,’:’ 表示点状线,’ ‘(空格)表示没有线条

linewidth

float or int

用于指定线条的宽度

marker

str 

指定数据点的标记样式。例如,’o’ 表示圆圈,’.’ 表示点,’,’ 表示像素点,’s’ 表示正方形等

markersize

float or int

指定标记的大小

markeredgecolor

str or 

颜色代码

指定标记边缘的颜色

markerfacecolor

str or 

颜色代码

指定标记填充的颜色

# 1.绘图
### 分组聚合
season_Aggregated = pd.DataFrame(data.groupby(['年份','季节']).sum())['使用量'].reset_index()   
# 将data的数据,根据'年份'、'季节'进行分组'进行分组,并统计总数,然后根据'使用量'进行重新编排索引

# 2.绘制条形图
plt.figure(figsize=(14, 8))
plt.subplot(1, 2, 1)

plt.bar(season_Aggregated['季节'][:4]-0.2,    # 数据
        season_Aggregated['使用量'][:4],      # 数据
        width=0.4,                           # 表示柱状图的宽度
        color='green', label='2011')        # 设置柱子颜色和标签

plt.bar(season_Aggregated['季节'][4:]+0.2,       # 数据
        season_Aggregated['使用量'][4:],         # 数据
        width=0.4,                               # 表示柱状图的宽度
        color='yellow', label='2012')            # 设置柱子颜色和标签

plt.title('使用量与季节关系条形图', fontsize=15)    # 设置图形的标题以及文字的打下
plt.xlabel('季节', fontsize=15)               # 设置x轴标签以及字体大小
plt.ylabel('使用量', fontsize=15)             # 设置y轴标签以及字体大小
plt.xticks([1, 2, 3, 4], ['春季', '夏季', '秋季', '冬季']) # 设置x轴刻度以及对应刻度的标签
plt.legend(loc='best')     # 设置图例位置

# 3.绘制折线图
plt.subplot(1, 2, 2)
plt.plot(season_Aggregated['季节'][:4],
         season_Aggregated['使用量'][:4],
         color='green',                      # 设置颜色
         lw=3,                                # 设置折线的宽度
         marker='o',                         # 设中的点的标记图形
         label='2011')
plt.plot(season_Aggregated['季节'][4:],
         season_Aggregated['使用量'][4:],
         color='yellow',                          # 设置颜色
         lw=3,                                   # 设置折线的宽度
         marker='o',                            # 设中的点的标记图形
         label='2012')

plt.title('使用量与季节折线图', fontsize=15)
plt.xlabel('季节', fontsize=15)
plt.ylabel('使用量', fontsize=15)
plt.xticks([1, 2, 3, 4], ['春季', '夏季', '秋季', '冬季'])
plt.legend(loc='best')
plt.grid(True)                                             # 在图形内部显示网格线

 4️⃣ 4.4 利用条形图、折线图探究单车使用量和月份的关系

# 1.绘图
### 分组聚合
month_Aggregated = pd.DataFrame(data.groupby(['年份','月份']).sum())['使用量'].reset_index()
# 将data的数据,根据'年份'、'月份'进行分组'进行分组,并统计总数,然后根据'使用量'进行重新编排索引

# 2.绘制条形图
plt.figure(figsize=(14, 10))
plt.subplot(2, 1, 1)
plt.bar(month_Aggregated['月份'][:12]-0.2,
        month_Aggregated['使用量'][:12],
        width=0.4,                             # 表示柱状图的宽度
        color='blue', label='2011')

plt.bar(month_Aggregated['月份'][12:]+0.2,
        month_Aggregated['使用量'][12:],
        width=0.4,                             # 表示柱状图的宽度
        color='gold', label='2012')

plt.title('使用量与月份关系条形图', fontsize=15)
plt.xlabel('月份', fontsize=15)
plt.ylabel('使用量', fontsize=15)
plt.xticks(np.arange(1, 13))                   # 横坐标为1-12
plt.legend(loc=&#

作者:Cherry晴

物联沃分享整理
物联沃-IOTWORD物联网 » Python数据可视化分析:共享单车使用量数据深度解析(第2部分)

发表回复