R语言分析 老九门 到底谁是主角
时间:2022-05-04
本文章向大家介绍R语言分析 老九门 到底谁是主角,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
作者:张聪
https://ask.hellobi.com/blog/Zason/4444
最近看了老九门,两大男主角都是颜值担当,我的朋友中有喜欢佛爷(陈伟霆),有的喜欢二爷(张艺兴)。从我的朋友中发现更多人倾向于张艺兴扮演的二爷,他们认为二爷(张艺兴)是男1号。
但是从出场次数和演员表排名佛爷(陈伟霆)都在二爷(张艺兴)之前。我一直认为佛爷(陈伟霆)是主演,也让我对这二位谁是主角产生的好奇。
于是决定用R语言进行文本统计一下,证明谁是男1,谁是男2。
目前关于R文本挖掘的方法已经有很多了,这里再简单介绍一下。进而论述结果。代码如下:
#####首先,加载所需要的工具包
######注意rJava需要jdk环境
library(rJava)
library(Rwordseg)
library("RColorBrewer")
library("wordcloud")
##########接下来要自定义加载词,因为二月红并不是传统意义的词语,如果不单独加载会被分成二月,红。两个词。
##########加载方法有很多,本人选择最简单的加载单个词语方法insertWords,deleteWords为删除该词
####insertWords("二月红")
###deleteWords("二月红")
#接下来就是正常的统计词频
myfile<-read.csv(file.choose(),header=FALSE)
myfile.res <- myfile[myfile!=" "]
myfile.words <- unlist(lapply(X = myfile.res,FUN = segmentCN))
myfile.words <- gsub(pattern="http:[a-zA-Z\/\.0-9]+","",myfile.words)
myfile.words <- gsub("n","",myfile.words)
myfile.words <- gsub(" ","",myfile.words)
myfile.words<-subset(myfile.words,nchar(as.character(myfile.words))>1)
myfile.freq <- table(unlist(myfile.words))
myfile.freq <- rev(sort(myfile.freq))
myfile.freq <- data.frame(word=names(myfile.freq), freq=myfile.freq);
myfile.freq2=subset(myfile.freq, myfile.freq$freq>=2)
#####从统计结果,可以看出佛爷出现的次数的确大于二月红
##将统计结果在画出词云展现一下,目前词云的形状可视化多种多样,本人用最简单的方式进行展现
#画图
mycolors <- brewer.pal(8,"Dark2")
windowsFonts(myFont=windowsFont("华文彩云"))
wordcloud(myfile.freq$word,myfile.freq$freq,min.freq=3,random.order=FALSE,random.color=FALSE,colors=mycolors,family="myFont")
从可视化展现看出佛爷字体大小大于二月红。
因此,从原著来讲,佛爷为男1,二月红为男2。
- 传统数据库也能实现区块链存储
- Golang语言社区--Go语言基础第三节常量
- 干货 | 进化策略入门:最优化问题的另一种视角
- 【Golang语言社区】Golang语言面试题
- PHP面向对象核心(一)——序列化与魔术方法
- PHP面向对象核心(二)——继承、多态、接口
- PHP面向对象核心(三)——反射、异常处理
- 理解jquery的$.extend & $.fn.extend用法
- PHP数据结构(一)——顺序结构线性表
- PHP数据结构(二)——链式结构线性表
- 微信小程序防止重复点击,该如何处理?
- CSS常用实例,web前端开发者不知道这些就太low了
- PHP数据结构(三)——运用栈实现括号匹配
- python抓取头条文章
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- 带你用 Python 实现自动化群控(入门篇)
- 实战篇 | 基于freeRTOS的多任务事件传输demo(附代码)
- 在kali linux中你应该知道的信息收集姿势(一)
- 【拓展】谈谈字符编码:Unicode编码与emoji表情编码
- TCP/IP 应用层协议解释
- Cisco Packet Tracer服务器模拟搭建
- Python3调用Google翻译
- 打造最强移动测试平台
- 微信小游戏背后的技术优化
- iox:一款功能强大的端口转发&内网代理工具
- Python3爬取steam优惠
- Cisco实验-将路由器连接到LAN操作步骤
- Vmware安装MacOS
- 机器学习中处理缺失值的7种方法
- Python3栅栏密码解密