词云图wordcloud学习笔记

时间:2022-07-22
本文章向大家介绍词云图wordcloud学习笔记,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

词云图,也叫文字云,是对文本中出现频率较高的“关键词”予以视觉化的展现,词云图过滤掉大量的低频低质的文本信息,使得浏览者只要一眼扫过文本就可领略文本的主旨。

github:https://github.com/amueller/word_cloud

官方地址:https://amueller.github.io/word_cloud/

wordcloud 是一个python实现的高效词频可视化工具,除了可以使用各种mask和颜色提供个性化的掩膜,还可以通过api便捷的挑战获得个性化的词云输出。 安装

pip install wordcloud

wordcloud 包含三个主要api

  • WordCloud([font_path, width, height, …]) 最重要的函数生成和描绘词云.
  • ImageColorGenerator(image[, default_color]) 通过输入rgb图像获得色彩信息.
  • random_color_func([word, font_size, …]) 随机渲染颜色.

wordcloud库把词云当作一个WordCloud对象

  • wordcloud.WordCloud()代表一个文本对应的词云
  • 可以根据文本中词语出现的频率等参数绘制词云
  • 绘制词云的形状、尺寸和颜色都可以设定

wordcloud库常规方法

w = wordcloud.WordCloud()
  • 以WordCloud对象为基础
  • 配置参数、加载文本、输出文件