娱乐圈排行榜动态条形图绘制
一、先看下绘制好的动态条形图
图1 娱乐圈男明星排行榜动态条形图
数据来源:123粉丝网
图1是用第500期(截止2019年7月6日)到538期(截止2020年3月28日)的数据绘制的动态条形图。我是爬虫爬下来的数据,如果不想爬虫可直接到公众号中回复"娱乐圈排行榜条形图",即可获取数据。
二、绘制动态条形图代码分步解析
1 导入库并加载数据
import matplotlib.pyplot as plt
import matplotlib
import numpy as np
import pandas as pd
from pandas import concat
import os
os.chdir(r"F:微信公众号Python21.娱乐圈排行榜2.绘制动图条形图") # 修改当前程序操作的路径
star_man = pd.read_csv("star_man.csv") #读取数据
star_man = star_man.iloc[1:,:] #去除第一行无用数据
代码解析:
import: 加载绘图库、数据处理库、文件路径管理库;
os.chdir: 设置python的工作路径,可以替换成你的路径;
star_man: 读取男明星排行榜数据;
2 按前10名出现的次数给男演员分配颜色
#找到各期前10名的男演员名字
period = sorted(list(star_man.period_num.drop_duplicates().values)) #找出所有期数
all_data = [] #构造存放所有数据的空列表
for i in period:
data = star_man[star_man.period_num==i] #取出某一期的数据
data1 = data.iloc[0:9,:] #取改期数据的前10名信息
all_data.append(data1) #把取出的信息存放到列表中
all_data_1 = concat(all_data) #把列表中存放的数据框连接成一个数据框
#统计出现次数
all_data_1.name.value_counts()
代码解析:
period: 找出所有期数去重,并按从小到大排序;
all_data: 构造存放所有数据的空列表;
for: 构造循环取出每期前10名的信息;
all_data_1: 用concat函数把列表中存放的数据框连接成一个数据框(列表中不仅能存单个元素还可以存数据框);
value_counts(): 统计男演员在前10名中出现的次数;
注:颜色分配是绘制动态条形图的关键,本文按照在前10名中出现次数分配颜色,出现次数越多,给的颜色越深,标注颜色并无其它含义。
得到结果:
3 绘制单个条形图
# 图形设置
plt.rcParams['figure.figsize'] = (12, 50) # 图像显示大小
plt.rcParams['font.sans-serif'] = ['SimHei'] # 防止中文标签乱码,还有通过导入字体文件的方法
plt.rcParams['axes.unicode_minus'] = False
plt.rcParams['lines.linewidth'] = 0.8 # 设置曲线线条宽度
#绘制单个人的图形
person_num = 10 #绘制person_num个人的条形图
data = star_man[star_man.period_num==538] #取某一期(538)的数据
data1 = data.iloc[0:person_num,:].sort_values(by = 'popularity_value', ascending = True) #取person_num个人的数据绘制条形图
name_color = pd.read_csv("name_color1.csv",encoding = 'gbk') #控制每个人绘图的颜色
colors_0 = pd.merge(data1, name_color, how = 'left', on = 'name') #控制当前这一期的颜色
colors_1 = list(colors_0.color.values) #取出对应的颜色
plt.barh(data1.name, data1.popularity_value, height=0.5, color=colors_1, alpha=1) #从下往上画
plt.xlim(min(data1.popularity_value),max(data1.popularity_value)*1.05) #设置x轴的范围
plt.xlabel("人气值") #给x轴加说明
title = '第'+str(int(data1.period_num[1]))+'期娱乐圈男星排行榜' #构造图片标题
plt.title(title, fontsize=18) #给条形图添加标题
plt.annotate(str(int(data1.end_time[1])), xy=(max(data1.popularity_value)*0.88, 1), xytext=(max(data1.popularity_value)*0.9, 1),color="r",weight="bold",
arrowprops=dict(arrowstyle='-',connectionstyle='arc3',color='red'),bbox=dict(boxstyle='round,pad=0.5', fc='yellow', ec='k',lw=1 ,alpha=0.4),
fontsize=15) #添加数据截止统计日期
for x, y in enumerate(data1.popularity_value): #添加名字
plt.text(y + 10, x - 0.1 , '%s' % colors_0.name[x],fontweight='heavy')
plt.show()
代码解析:
plt.rcParams: 设置图形的参数;
person_num: 确定每期绘制的人数;
data: 取出538期排行榜的数据;
data1: 取出前person_num个人的信息,并按人气值排序;
name_color: 读取根据前10名出现次数分配的颜色;
colors_0: 根据分配的颜色,给出当前期绘制颜色;
plt.barh: 绘制横向条形图;
plt.xlim: 设置x轴的范围;
plt.annotate:添加图形右下角截止统计日期,其中str是添加的文字内容,xy是箭头的位置,xytext是文字的位置,bbox是添加边框;
for x, y:添加人名;
得到结果:
图2 娱乐圈男明星第538期排行榜条形图
数据来源:123粉丝网
三、绘制动态条形图整合代码
import matplotlib.pyplot as plt
import matplotlib
import numpy as np
import pandas as pd
from pandas import concat
import os
os.chdir(r"F:微信公众号Python21.娱乐圈排行榜2.绘制动图条形图") # 修改当前程序操作的路径
star_man = pd.read_csv("star_man.csv")
star_man = star_man.iloc[1:,:]
period = sorted(list(star_man.period_num.drop_duplicates().values))
#找到各期前15名的男演员名字
all_data = []
for i in period:
data = star_man[star_man.period_num==i]
data1 = data.iloc[0:14,:]
all_data.append(data1)
all_data_1 = concat(all_data)
# 图形设置
plt.rcParams['figure.figsize'] = (12, 50) # 图像显示大小
plt.rcParams['font.sans-serif'] = ['SimHei'] # 防止中文标签乱码,还有通过导入字体文件的方法
plt.rcParams['axes.unicode_minus'] = False
plt.rcParams['lines.linewidth'] = 0.8 # 设置曲线线条宽度
for i in period:
person_num = 10 #绘制person_num+1个人的图像
data = star_man[star_man.period_num==i] #取某一期的数据
data1 = data.iloc[0:person_num,:].sort_values(by = 'popularity_value', ascending = True) #取person_num+1个人的数据绘制条形图
name_color = pd.read_csv("name_color1.csv",encoding = 'gbk') #控制每个人绘图的颜色
colors_0 = pd.merge(data1, name_color, how = 'left', on = 'name') #控制当前这一期的颜色
colors_1 = list(colors_0.color.values) #取出对应的颜色
plt.clf() # 清除之前画的图
plt.barh(data1.name, data1.popularity_value, height=0.5, color=colors_1, alpha=1) #从下往上画
plt.xlim(min(data1.popularity_value),max(data1.popularity_value)*1.05)
plt.xlabel("人气值")
title = '第'+str(int(max(data1.period_num)))+'期娱乐圈男星排行榜'
plt.title(title, fontsize=18)
plt.annotate(str(int(max(data1.end_time))), xy=(max(data1.popularity_value)*0.88, 1), xytext=(max(data1.popularity_value)*0.9, 1),color="r",weight="bold",
arrowprops=dict(arrowstyle='-',connectionstyle='arc3',color='red'),bbox=dict(boxstyle='round,pad=0.5', fc='yellow', ec='k',lw=1 ,alpha=0.4),
fontsize=15)
for x, y in enumerate(data1.popularity_value): #添加名字
plt.text(y + 10, x - 0.1 , '%s' % colors_0.name[x],fontweight='heavy')
plt.pause(0.4) # 设置暂停时间,太快图表无法正常显示
plt.ioff() # 关闭画图的窗口,即关闭交互模式
plt.show() # 显示图片,防止闪退
代码解析:
plt.clf():清除之前画的图,避免在一张图上画两个图;
plt.pause:每隔0.4秒展示一张图。
注:该代码只是在绘制单个条形图代码的基础上,用循环把所有图每隔一个很短的时间展示出来,给人一种动图的效果。
本文是本人使用matplotlib库进行绘图得到的结果,如有问题请指正。若想获取文中所有可直接执行的代码和数据,可在公众号中回复"娱乐圈排行榜条形图",即可免费获取。如对代码有疑问,可以到公众号中私信我。
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- Java assert关键字
- Java 线程的六种状态
- Mysql 必知必会(一)
- Spring boot 整合dynamic实现多数据源
- Integer 值判断相等
- JDK 8 新特性 之 Strams简单使用
- BindingException: Parameter 'XXX' not found. Available parameters are [collection, list]
- Android StartService()源码分析(一)
- JDK 8 新特性 之 default关键字
- 设计模式 之 单例模式
- SpringBoot 配置多数据源
- git pull 报错:The following untracked working tree files would be overwritten by merge
- Docker 使用Dockerfile构建Docker(三)
- Docker-compose 安装与基本使用(四)
- Docker-compose 常用命令及网络设置(五)