Merge pull request #4 from chinese-poetry/master

update
This commit is contained in:
smilevent
2019-12-28 23:51:24 +08:00
committed by GitHub
7 changed files with 12710 additions and 34 deletions

View File

@@ -24,12 +24,11 @@
</a>
</p>
最全的中华古典文集数据库, 包含 5.5 万首唐诗、26 万首宋诗2.1 万首宋词.和其他古典文集。 诗人包括唐宋两朝近 1.4 万古诗人, 和两宋时期 1.5 千古词人. 数据来源于互联网.
最全的中华古典文集数据库包含 5.5 万首唐诗、26 万首宋诗2.1 万首宋词和其他古典文集。诗人包括唐宋两朝近 1.4 万古诗人和两宋时期 1.5 千古词人数据来源于互联网
**为什么要做这个仓库?** 古诗是中华民族乃至全世界的瑰宝, 我们应该传承下去, 虽然有古典文集, 但大多数人并没有拥有这些书籍. 从某种意义上来说, 这些庞大的文集离我们是有一定距离的。而电子版方便拷贝, 所以此开源数据库诞生了. 此数据库通过 JSON 格式分发,可以让你很方便的开始你的项目。
古诗采集没有记录过程, 因为古诗数据庞大,目标网站有限制, 采集过程经常中断超过了一个星期. 2017 年新加入全宋词, [全宋词爬取过程及数据分析](https://jackeygao.github.io/r/words/crawl-ci.html).
**为什么要做这个仓库?** 古诗是中华民族乃至全世界的瑰宝我们应该传承下去虽然有古典文集但大多数人并没有拥有这些书籍从某种意义上来说这些庞大的文集离我们是有一定距离的。而电子版方便拷贝所以此开源数据库诞生了此数据库通过 JSON 格式分发,可以让你很方便的开始你的项目。
古诗采集没有记录过程因为古诗数据庞大目标网站有限制采集过程经常中断超过了一个星期。2017 年新加入全宋词,[全宋词爬取过程及数据分析](https://jackeygao.github.io/r/words/crawl-ci.html)。
## 高频词分析图
@@ -87,19 +86,19 @@
## 贡献
本项目目的是借助技术来生成格式化(JSON)数据,让开发者更方便快速的构建诗词类应用程序。身单力薄,欢迎更多人来维护, 你可以通过以下方法来参与贡献:
本项目目的是借助技术来生成格式化(JSON)数据,让开发者更方便快速的构建诗词类应用程序。身单力薄,欢迎更多人来维护,你可以通过以下方法来参与贡献
- 直接提交 PR 或者通过 issue 讨论来优化完善此数据库, 理论上古诗歌体非宗教类都欢迎加入,部分有争议性的数据需要社区投票讨论决定是否加入。关于诗句的纠错在创建 PR 时请标明出处。更多规范请[参考贡献规范文档](https://github.com/chinese-poetry/chinese-poetry/wiki/%E5%8F%82%E4%B8%8E%E8%B4%A1%E7%8C%AE%E8%A7%84%E8%8C%83)。
- 直接提交 PR 或者通过 issue 讨论来优化完善此数据库理论上古诗歌体非宗教类都欢迎加入,部分有争议性的数据需要社区投票讨论决定是否加入。关于诗句的纠错在创建 PR 时请标明出处。更多规范请[参考贡献规范文档](https://github.com/chinese-poetry/chinese-poetry/wiki/%E5%8F%82%E4%B8%8E%E8%B4%A1%E7%8C%AE%E8%A7%84%E8%8C%83)。
- 如果你没有办法直接参与完善的过程,你也可以通过 「[Patreon 周期性赞助](https://www.patreon.com/jackeygao)」的形式来持续帮助并激励我去优化完善此数据库。如果您不喜欢周期性赞助, 你也可以通过「[支付宝](https://github.com/jackeyGao/JackeyGao.github.io/blob/master/static/images/alipay.png)」或者「[微信赞赏码](https://github.com/jackeyGao/JackeyGao.github.io/blob/master/static/images/wechat.png)」进行一次性赞助(备注留下邮箱)。
- 如果你没有办法直接参与完善的过程,你也可以通过 「[Patreon 周期性赞助](https://www.patreon.com/jackeygao)」的形式来持续帮助并激励我去优化完善此数据库。如果您不喜欢周期性赞助,你也可以通过「[支付宝](https://github.com/jackeyGao/JackeyGao.github.io/blob/master/static/images/alipay.png)」或者「[微信赞赏码](https://github.com/jackeyGao/JackeyGao.github.io/blob/master/static/images/wechat.png)」进行一次性赞助(备注留下邮箱)。
- 如有建议或吐槽,欢迎联系我的邮箱 gaojunqi@outlook.com .
- 如有建议或吐槽,欢迎联系我的邮箱 gaojunqi@outlook.com
无论通过哪种形式贡献最终都会使之变得更好!
无论通过哪种形式贡献最终都会使之变得更好!
### 赞助
### 赞助
>
**xber1986**
### 贡献者
@@ -112,17 +111,17 @@
<details>
<summary>案例展示</summary>
- [中文诗歌主页](https://shici.store)是一个基于浏览器的诗词网站, 包含唐诗三百首、宋词三百首等文集.
- [中文诗歌主页](https://shici.store)是一个基于浏览器的诗词网站,包含唐诗三百首、宋词三百首等文集。
- [animalize](https://github.com/animalize) **/** [QuanTangshi](https://github.com/animalize/QuanTangshi) *离线全唐诗 Android*
- [justdark](https://github.com/justdark) **/** [pytorch-poetry-gen](https://github.com/justdark/pytorch-poetry-gen) *a char-RNN based on pytorch*
- [Clover27](https://github.com/Clover27) **/** [ancient-Chinese-poem-generator](https://github.com/Clover27/ancient-Chinese-poem-generator) *Ancient-Chinese-Poem-Generator*
- [chinese-poetry](https://github.com/chinese-poetry) **/** [poetry-calendar](http://shici.store/poetry-calendar/) *诗词周历*
- [chenyuntc](https://github.com/chenyuntc) **/** [pytorch-book](https://github.com/chenyuntc/pytorch-book/blob/master/chapter9-神经网络写诗(CharRNN)/) *简体唐诗生成(char-RNN), 可生成藏头诗,自定义诗歌意境,前缀等*
- [chenyuntc](https://github.com/chenyuntc) **/** [pytorch-book](https://github.com/chenyuntc/pytorch-book/blob/master/chapter9-神经网络写诗(CharRNN)/) *简体唐诗生成(char-RNN)可生成藏头诗自定义诗歌意境前缀等*
- [okcy1016](https://github.com/okcy1016) **/** [poetry-desktop](https://github.com/okcy1016/poetry-desktop/) *诗词桌面*
- [huangjianke](https://github.com/huangjianke) **/** [weapp-poem](https://github.com/huangjianke/weapp-poem/) *诗词墨客 小程序版*
</details>
## License
[MIT](https://github.com/chinese-poetry/chinese-poetry/blob/master/LICENSE) 许可证.
[MIT](https://github.com/chinese-poetry/chinese-poetry/blob/master/LICENSE) 许可证

View File

@@ -14,11 +14,11 @@
- [x] 《弟子規》
- [x] 《幼學瓊林》
- [x] 《朱子家訓》
- [ ] 《千家詩》
- [ ] 《古文觀止》
- [ ] 《唐詩三百首》
- [x] 《千家詩》
- [x] 《古文觀止》
- [x] 《唐詩三百首》
- [x] 《聲律啟蒙》
- [ ] 《文字蒙求》
- [x] 《文字蒙求》
- [x] 《增廣賢文》
以上所列皆屬兒童啟蒙讀物。每個私塾所授各不相同,但“三百千”卻是幾乎所有的私塾開蒙的必讀物。
@@ -245,15 +245,132 @@
## 千家詩
TODO
《千家詩》是南宋謝枋得和明代王相所編的兒童啓蒙書。
南宋謝枋得選七言律詩輯爲《重定千家詩》,明代王相又輯爲《五言千家詩》,收五言絕句和五言律詩各四十來首,以孟浩然的“春眠不覺曉”起始。《千家詩》所收集的多數是唐宋詩人的名篇,明清兩朝的《千家詩》選詩已按七言絕句、五言律詩、七言律詩、五言古詩、七言古詩等編排。
康熙四十五年1706年曹寅刊行《楝亭十二種》收《分門纂類唐宋時賢千家詩選》十二卷題爲“後村先生編集”即劉克莊分時令、節候、氣候、晝夜、百花、竹木、天文、地理、宮室、器用、音樂、禽獸、昆蟲、人品等14類。阮元亦肯定爲劉克莊編[1]。清朝時又有《國朝千家詩》、《續千家詩》,專收清人作品,民國時有《醒世千家詩》。
### 數據格式
[qianjiashi.json](./qianjiashi.json)
```json
{
"title": "千家詩",
"author": "南宋謝枋得/明代王相",
"content": [
{
"type": "五言絕句",
"content": [
{
"chapter": "春眠",
"author": "(唐)孟浩然",
"paragraphs": [
"春眠不覺曉,處處聞啼鳥。",
"夜來風雨聲,花落知多少。"
]
},
]
},
{
"type": "五言律詩",
"content": [
{
"chapter": "攜妓納涼晚際遇雨",
"author": "(唐)杜甫",
"paragraphs": [
{
"subchapter": "其一",
"paragraphs": [
"落日放船好,輕風生浪遲。",
"竹深留客處,荷淨納涼時。",
"公子調冰水,佳人雪藕絲。",
"片雲頭上黑,應是雨催詩。"
]
},
]
}
]
}
]
}
```
## 古文觀止
TODO
《古文觀止》是清人吳楚材、吳調侯於康熙三十三年1694年選定的古代散文選本。二吳均是浙江紹興人長期設館授徒該書是清朝康熙年間選編的一部供學塾使用的文學讀本此書是爲學生編的教材。
《古文觀止》收自東周至明代的文章222篇全書12卷以收散文爲主兼取駢文。題名“觀止”是指該書所選的都是名篇佳作是人們所能讀到的盡善盡美的至文了。
《古文觀止》由清代吳興祚審定並作序序言中稱“以此正蒙養而裨後學”當時爲讀書人的啓蒙讀物。康熙三十四年1695年正式鐫版印刷。
### 數據格式
[guwenguanzhi.json](./guwenguanzhi.json)
```json
{
"title": "古文觀止",
"abstract": [
"《古文觀止》是清人吳楚材、吳調侯於康熙三十三年1694年選定的古代散文選本。...",
],
"content": [
{
"title": "卷一・周文",
"content": [
{
"chapter": "鄭伯克段於鄢",
"source": "《左傳》",
"author": "先秦:左丘明 ",
"paragraphs": [
"初,鄭武公娶於申,曰武姜,生莊公及共叔段。..."
]
},
]
},
]
}
```
## 唐詩三百首
TODO
《唐詩三百首》是一部流傳很廣的唐詩選集。唐朝618年~907年二百八十九年間是中國詩歌發展的黃金時代雲蒸霞蔚名家輩出唐詩數量多達五萬餘首。
### 數據格式
[tangshisanbaishou.json](./tangshisanbaishou.json)
```json
{
"title": "唐詩三百首",
"content": [
{
"type": "五言絕句",
"content": [
{
"chapter": "行宮",
"subchapter": null,
"author": "唐代:元稹 ",
"paragraphs": [
"寥落古行宮,宮花寂寞紅。",
"白頭宮女在,閒坐說玄宗。"
]
},
{
"chapter": "山中送別",
"subchapter": "送別 / 山中送別",
"author": "唐代:王維 ",
"paragraphs": [
"山中相送罷,日暮掩柴扉。",
"春草明年綠,王孫歸不歸?(明年 一作:年年)"
]
},
]
}
]
}
```
## 聲律啟蒙
@@ -297,7 +414,43 @@ TODO
## 文字蒙求
TODO
《文字蒙求》包括天地類之純形;人類之純形;動物之純形;植物之純形;衣服器械屋宇之純形;一字象兩物形者;由象形字省之仍是象形者;避它字而變其形者;物多此形因兼其用以象之者;其形不能顯白因加同類字以定之;以會意定象形而別加一形者等內容。
### 數據格式
[wenzimengqiu.json](./wenzimengqiu.json)
``` json
{
"title": "文字蒙求",
"author": "王筠1784-1854字貫山號菉友。清山東安丘人道光元年1821舉人曾任陝西鄉寧知縣。他的著作有《說文釋例》《說文解字句讀》《文字蒙求》等。",
"abstract": "《文字蒙求》包括天地類之純形;人類之純形;動物之純形;植物之純形;衣服器械屋宇之純形;一字象兩物形者;由象形字省之仍是象形者;避它字而變其形者;物多此形因兼其用以象之者;其形不能顯白因加同類字以定之;以會意定象形而別加一形者等內容。",
"preface": [
"雪堂謂筠曰人之不識字也病於不能分苟能分一字...",
"..."
],
"content": [
{
"title": "卷一",
"paragraphs": [
"以下二卷刻字率以類聚",
"象形",
"易曰。百官以冶。萬民以察。知文字爲記事而作。...",
"..."
]
},
{
"title": "卷二",
"paragraphs": [
"指事",
"有形者物也。無形者事也。物有形。故可象。事無形。...",
"..."
]
},
"..."
]
}
```
## 增廣賢文

2640
mengxue/guwenguanzhi.json Normal file

File diff suppressed because it is too large Load Diff

2038
mengxue/qianjiashi.json Normal file

File diff suppressed because it is too large Load Diff

File diff suppressed because it is too large Load Diff

4167
mengxue/wenzimengqiu.json Normal file

File diff suppressed because it is too large Load Diff

View File

@@ -3387,8 +3387,8 @@
},
{
"title": "那",
"chapter": "颂",
"section": "之什",
"chapter": "颂",
"section": "之什",
"content": [
"猗与那与!置我鞉鼓。奏鼓简简,衎我烈祖。汤孙奏假,绥我思成。",
"鞉鼓渊渊,嘒嘒管声。既和且平,依我磬声。于赫汤孙!穆穆厥声。",
@@ -3398,8 +3398,8 @@
},
{
"title": "烈祖",
"chapter": "颂",
"section": "之什",
"chapter": "颂",
"section": "之什",
"content": [
"嗟嗟烈祖!有秩斯祜。申锡无疆,及尔斯所。既载清酤,赉我思成。",
"亦有和羹,既戒既平。鬷假无言,时靡有争。绥我眉寿,黄耇无疆。",
@@ -3409,8 +3409,8 @@
},
{
"title": "玄鸟",
"chapter": "颂",
"section": "之什",
"chapter": "颂",
"section": "之什",
"content": [
"天命玄鸟,降而生商,宅殷土芒芒。古帝命武汤,正域彼四方。",
"方命厥后,奄有九有。商之先后,受命不殆,在武丁孙子。武丁孙子,武王靡不胜。",
@@ -3420,8 +3420,8 @@
},
{
"title": "长发",
"chapter": "颂",
"section": "之什",
"chapter": "颂",
"section": "之什",
"content": [
"浚哲维商,长发其祥。洪水芒芒,禹敷下土方。外大国是疆,幅陨既长。有娀方将,帝立子生商。",
"玄王桓拨,受小国是达,受大国是达。率履不越,遂视既发。相士烈烈。海外有截。",
@@ -3434,8 +3434,8 @@
},
{
"title": "殷武",
"chapter": "颂",
"section": "之什",
"chapter": "颂",
"section": "之什",
"content": [
"挞彼殷武,奋伐荆楚。深入其阻,裒荆之旅。有截其所,汤孙之绪。",
"维女荆楚,居国南乡。昔有成汤,自彼氐羌,莫敢不来享,莫敢不来王。曰商是常。",
@@ -3445,4 +3445,4 @@
"陟彼景山,松伯丸丸。是断是迁,方斫是虔。松桷有梴,旅楹有闲,寝成孔安。"
]
}
]
]