From ca0fb7e0017a81fcea0a7ce59148aae6a3a9c79a Mon Sep 17 00:00:00 2001 From: JG Date: Wed, 14 Aug 2019 20:47:06 +0800 Subject: [PATCH] doc: update README.md --- README.md | 144 ++++++++++++++++++++++++++++++++++++------------------ 1 file changed, 96 insertions(+), 48 deletions(-) diff --git a/README.md b/README.md index 7863363..d3da19b 100644 --- a/README.md +++ b/README.md @@ -1,54 +1,116 @@ -# chinese-poetry: 最全中文诗歌古典文集数据库. +

+ + chinese-poetry + +

-[![Build Status](https://travis-ci.org/chinese-poetry/chinese-poetry.svg?branch=master)](https://travis-ci.org/chinese-poetry/chinese-poetry) -[![License](http://img.shields.io/badge/license-mit-blue.svg?style=flat-square)](https://github.com/jackeyGao/chinese-poetry/blob/master/LICENSE) -[![](https://img.shields.io/github/contributors/chinese-poetry/chinese-poetry.svg)](https://github.com/chinese-poetry/chinese-poetry/graphs/contributors) +

chinese-poetry: 最全中文诗歌古典文集数据库

-[中文诗歌主页](https://shici.store)是一个基于浏览器的诗词网站, 包含唐诗三百首、宋词三百首等文集. +

+ + Build Status + + + License + + + Contributors + + + Patreon + +

-最全的中华古典文集数据库, 包含5.5万首唐诗、26万首宋诗和2.1万首宋词. 唐宋两朝近1.4万古诗人, 和两宋时期1.5K词人. 数据来源于互联网. +最全的中华古典文集数据库, 包含 5.5 万首唐诗、26 万首宋诗和 2.1 万首宋词.和其他古典文集。 诗人包括唐宋两朝近 1.4 万古诗人, 和两宋时期 1.5 千古词人. 数据来源于互联网. -**为什么要做这个仓库?** 古诗是中华民族乃至全世界的瑰宝, 我们应该传承下去, 虽然有古典文集, 但大多数人并没有拥有这些书籍. 从某种意义上来说, 这些庞大的文集离我们是有一定距离的。而电子版方便拷贝, 所以此开源数据库诞生了. 你可以用此数据做任何有益的事情, 甚至我也可以帮助你. +**为什么要做这个仓库?** 古诗是中华民族乃至全世界的瑰宝, 我们应该传承下去, 虽然有古典文集, 但大多数人并没有拥有这些书籍. 从某种意义上来说, 这些庞大的文集离我们是有一定距离的。而电子版方便拷贝, 所以此开源数据库诞生了. 此数据库通过 JSON 格式分发,可以让你很方便的开始你的项目。 -古诗采集没有记录过程, 因为古诗数据庞大,目标网站有限制, 采集过程经常中断超过了一个星期.2017年新加入全宋词, [全宋词爬取过程及数据分析](https://ijg.io/r/words/crawl-ci.html). +古诗采集没有记录过程, 因为古诗数据庞大,目标网站有限制, 采集过程经常中断超过了一个星期. 2017 年新加入全宋词, [全宋词爬取过程及数据分析](https://jackeygao.github.io/r/words/crawl-ci.html). -## 数据分析 +## 高频词分析图 -一些简单的高频分析 +
+ 宋词受欢迎的词牌名 -|唐诗高频词|唐诗作者作品榜| -| :---: | :---: | -| ![唐诗高频词](https://raw.githubusercontent.com/jackeygao/chinese-poetry/master/images/tang_text_topK.png "唐诗高频词")| ![唐诗作者作品榜](https://raw.githubusercontent.com/jackeygao/chinese-poetry/master/images/tang_author_topK.png "唐诗作者作品榜")| -|宋诗高频词|宋诗作者作品榜| -| ![宋诗高频词](https://raw.githubusercontent.com/jackeygao/chinese-poetry/master/images/song_text_topK.png "宋诗高频词" )| ![宋诗作者作品榜](https://raw.githubusercontent.com/jackeygao/chinese-poetry/master/images/song_author_topK.png "宋诗作者作品榜")| -|宋词高频词|宋词作者作品榜| -| ![宋词高频词](https://raw.githubusercontent.com/jackeygao/chinese-poetry/master/images/ci_words_topK.png "宋词高频词") |![宋词作者作品榜](https://raw.githubusercontent.com/jackeygao/chinese-poetry/master/images/ci_author_topK.png "宋词作者作品榜") | +
+两宋喜欢的词牌名 +
+
-|两宋喜欢的词牌名| -| :---: | -|![两宋喜欢的词牌名](https://raw.githubusercontent.com/jackeygao/chinese-poetry/master/images/ci_rhythmic_topK.png)| +
+ 宋词高频词 + 宋词高频词 +
-## 数据集合 +
+ 宋词作者作品榜 + 宋词作者作品榜 +
-- 全唐诗 [json](https://github.com/chinese-poetry/chinese-poetry/tree/master/json) -- 全宋诗 [json](https://github.com/chinese-poetry/chinese-poetry/tree/master/json) -- 全宋词 [ci](https://github.com/chinese-poetry/chinese-poetry/tree/master/ci) -- 五代·花间集 [wudai](https://github.com/chinese-poetry/chinese-poetry/tree/master/wudai/%E8%8A%B1%E9%97%B4%E9%9B%86) -- 五代·南唐二主词 [wudai](https://github.com/chinese-poetry/chinese-poetry/tree/master/wudai/%E5%8D%97%E5%94%90%E4%BA%8C%E4%B8%BB%E8%AF%8D) -- 论语 [lunyu](https://github.com/chinese-poetry/chinese-poetry/tree/master/lunyu) -- 诗经 [shijing](https://github.com/chinese-poetry/chinese-poetry/tree/master/shijing) -- 幽梦影 [youmengying](https://github.com/chinese-poetry/chinese-poetry/tree/master/youmengying) -- 四书五经 [sishuwujing](https://github.com/chinese-poetry/chinese-poetry/tree/master/sishuwujing) +
+ 唐诗高频词 + 唐诗高频词 +
+ +
+ 唐诗作者作品榜 + 唐诗作者作品榜 +
+ +
+ 宋诗高频词 + 宋诗高频词 +
+ +
+ 宋诗作者作品榜 + 宋诗作者作品榜 +
+ +## 数据集 + +- 全唐诗 [json](./json) +- 全宋诗 [json](./json) +- 全宋词 [ci](./ci) +- 五代·花间集 [wudai/huajianji](./wudai/huajianji) +- 五代·南唐二主词 [wudai/nantan](./wudai/nantang) +- 论语 [lunyu](./lunyu) +- 诗经 [shijing](./shijing) +- 幽梦影 [youmengying](./youmengying) +- 四书五经 [sishuwujing](./sishuwujing) - 蒙學 [mengxue](./mengxue) -**待补充** -- 清代诗词 -- 元曲 +## 贡献 + +本项目目的是借助技术来生成格式化(JSON)数据,让开发者更方便快速的构建诗词类应用程序。身单力薄,欢迎更多人来维护, 你可以通过以下方法来参与贡献: + +- 直接提交 PR 或者通过 issue 讨论来优化完善此数据库, 理论上古诗歌体非宗教类都欢迎加入,部分有争议性的数据需要社区投票讨论决定是否加入。关于诗句的纠错在创建 PR 时请标明出处。更多规范请[参考贡献规范文档](https://github.com/chinese-poetry/chinese-poetry/wiki/%E5%8F%82%E4%B8%8E%E8%B4%A1%E7%8C%AE%E8%A7%84%E8%8C%83)。 + +- 如果你没有办法直接参与完善的过程,你也可以通过 「[Patreon 周期性赞助](https://www.patreon.com/jackeygao)」的形式来持续帮助并激励我去优化完善此数据库。如果您不喜欢周期性赞助, 你也可以通过「[支付宝](https://github.com/jackeyGao/JackeyGao.github.io/blob/master/static/images/alipay.png)」或者「[微信赞赏码](https://github.com/jackeyGao/JackeyGao.github.io/blob/master/static/images/wechat.png)」进行一次性赞助(备注留下邮箱)。 + +- 如有建议或吐槽,欢迎联系我的邮箱 gaojunqi@outlook.com . + +无论通过哪种形式贡献最终都会使之变得更好! + +### 赞助商 + +> 无 + +### 贡献者 + +

+Contributors +

## 案例展示 +
+ 案例展示 + + +- [中文诗歌主页](https://shici.store)是一个基于浏览器的诗词网站, 包含唐诗三百首、宋词三百首等文集. - [animalize](https://github.com/animalize) **/** [QuanTangshi](https://github.com/animalize/QuanTangshi) *离线全唐诗 Android* - [justdark](https://github.com/justdark) **/** [pytorch-poetry-gen](https://github.com/justdark/pytorch-poetry-gen) *a char-RNN based on pytorch* - [Clover27](https://github.com/Clover27) **/** [ancient-Chinese-poem-generator](https://github.com/Clover27/ancient-Chinese-poem-generator) *Ancient-Chinese-Poem-Generator* @@ -56,21 +118,7 @@ - [chenyuntc](https://github.com/chenyuntc) **/** [pytorch-book](https://github.com/chenyuntc/pytorch-book/blob/master/chapter9-神经网络写诗(CharRNN)/) *简体唐诗生成(char-RNN), 可生成藏头诗,自定义诗歌意境,前缀等* - [okcy1016](https://github.com/okcy1016) **/** [poetry-desktop](https://github.com/okcy1016/poetry-desktop/) *诗词桌面* - [huangjianke](https://github.com/huangjianke) **/** [weapp-poem](https://github.com/huangjianke/weapp-poem/) *诗词墨客 小程序版* - - -## 贡献&讨论 - -

-Contributors -

- - -提交PR或者通过issue讨论来优化完善此数据库, 请[参考贡献规范文档](https://github.com/chinese-poetry/chinese-poetry/wiki/%E5%8F%82%E4%B8%8E%E8%B4%A1%E7%8C%AE%E8%A7%84%E8%8C%83)。 你也可以联系我的邮箱 gaojunqi@outlook.com - -或者联系我的微信号 - - - +
## License