一周 Github Trending 热门项目,最全中华古诗词数据库 | Github 项目推荐
时间:2022-05-04
本文章向大家介绍一周 Github Trending 热门项目,最全中华古诗词数据库 | Github 项目推荐,主要内容包括数据分析、数据分发形式、古诗 JSON 结构、作者 JSON 结构、案例展示、基本概念、基础应用、原理机制和需要注意的事项等,并结合实例形式分析了其使用技巧,希望通过本文能帮助到大家理解应用这部分内容。
Chinese-poetry 是本周 Github Trending 热门项目,截至 2 月 7 日,该项目已经获得了 2.5k 个「star」以及 199 个「fork」。
该诗词数据库包含5.5万首唐诗、26万首宋诗和 2.1 万首宋词. 唐宋两朝近 1.4 万古诗人, 和两宋时期 1.5K 词人,数据均来源于互联网。
数据库作者 Jackey Gao 认为,古诗是中华民族乃至全世界的瑰宝,我们应该传承下去,虽然有古典文集,但大多数人并没有拥有这些书籍。从某种意义上来说,这些庞大的文集离我们是有一定距离的,而电子版方便拷贝,所以此开源数据库诞生了。你可以用此数据做任何有益的事情,作者也可以帮助你。
古诗采集没有记录过程,因为古诗数据庞大,目标网站有限制,采集过程经常中断超过一个星期。2017年新加入全宋词,全宋词爬取过程及数据分析:https://jackeygao.io/words/crawl-ci.html。
Github 主页:https://github.com/chinese-poetry/chinese-poetry 数据库官方页面:http://shici.store/ 作者个人网站:https://jackeygao.io/
数据分析
一些简单的高频分析
唐诗高频词 |
唐诗作者作品榜 |
---|---|
宋诗高频词 |
宋诗作者作品榜 |
宋词高频词 |
宋词作者作品榜 |
两宋喜欢的词牌名 |
---|
数据分发形式
古诗数据分发采用繁体字的分组 JSON 文件,保留繁体能更大程度地保存原数据。宋词数据分发采用 sqlite 数据库,使用简体字(无原因,采集源就是简体,如需繁体请自行转换)。
其他类型结构数据
- KomaBeyond / chinese-poetry-mysql 适用于 mysql 数据库的格式数据
- (链接:https://github.com/KomaBeyond/chinese-poetry-mysql)
古诗 JSON 结构
[
{
"strains": [
"平平平仄仄,平仄仄平平。",
"仄仄平平仄,平平仄仄平。",
"平平平仄仄,平仄仄平平。",
"平仄仄平仄,平平仄仄平。"
],
"author": "太宗皇帝",
"paragraphs": [
"秦川雄帝宅,函谷壯皇居。",
"綺殿千尋起,離宮百雉餘。",
"連甍遙接漢,飛觀迥凌虛。",
"雲日隱層闕,風煙出綺疎。"
],
"title": "帝京篇十首 一"
},
... 每单个JSON文件1000条唐诗记录.
]
作者 JSON 结构
[
{
"name": "太宗皇帝",
"desc": "帝姓李氏,諱世民,神堯次子,聰明英武。貞觀之治,庶幾成康,功德兼隆。由漢以來,未之有也。而銳情經術,初建秦邸,即開文學館,召名儒十八人爲學士。既即位,殿左置弘文館,悉引內學士,番宿更休。聽朝之間,則與討論典籍,雜以文詠。或日昃夜艾,未嘗少怠。詩筆草隸,卓越前古。至於天文秀發,沈麗高朗,有唐三百年風雅之盛,帝實有以啓之焉。在位二十四年,諡曰文。集四十卷。館閣書目,詩一卷,六十九首。今編詩一卷。"
},
...]
案例展示
- animalize / QuanTangshi 离线全唐诗 Android
- (链接:https://github.com/animalize/QuanTangshi)
- justdark / pytorch-poetry-gen a char-RNN based on pytorch
- (链接:https://github.com/justdark/pytorch-poetry-gen)
- Clover27 / ancient-Chinese-poem-generator Ancient-Chinese-Poem-Generator
- (链接:https://github.com/Clover27/ancient-Chinese-poem-generator)
- chinese-poetry / poetry-calendar 诗词周历
- (链接:http://shici.store/poetry-calendar/)
- java基础:所有参数皆是按值参数
- 使用Hystrix提高系统可用性
- Spring Security笔记:解决CsrfFilter与Rest服务Post方式的矛盾
- GitHub新开放项目FoolNLTK:一个便捷的中文处理工具包
- hessian学习
- 制作WordPress侧边栏“博客统计”小工具并集成在主题中的方法
- Struts2、Spring MVC4 框架下的ajax统一异常处理
- 前11月网游收入1341亿元同比增超两成 你贡献了多少?
- struts2: config-browser-plugin 与 convention-plugin 学习
- 千万级规模高性能、高并发的网络架构经验分享
- UE4新手之编程指南
- redis 学习笔记(5)-Spring与Jedis的集成
- Linq to SQL 查询Tips
- SQLite 预写式日志
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- 大点干!早点散----------Redis从入门到精通!!!
- Python入门摘要
- 这些 ECMAScript 模块知识,都是我需要知道的
- 微信小程序【事件绑定】入门一篇就搞定
- 一个后端狗的 Vue 笔记【入门级】
- 这才是现代C++单例模式简单又安全的实现
- Linux 学习笔记(1) 查看文件内容
- Python从入门到熟练(3):第一个程序
- 数学系的概率论和我们的不太一样。。。
- 如何实现一个优雅的Python的Json序列化库
- 还在从零开始搭建项目?手撸了款快速开发脚手架!
- Node.js 中的 require 是如何工作的?
- Ajax请求携带Cookie
- 关于kubernetes垃圾回收那点事
- 强化学习笔记11:工程师看强化学习