近期,上最诗词数据GitHub 上最全中华古诗词数据库再次登上热榜,全中又火了一把。华古火根据介绍,库又chinese-poetry 最全中华古诗词数据库集合了唐宋两朝近一万四千古诗人,上最诗词数据 接近 5.5 万首唐诗加 26 万宋诗. 两宋时期 1564 位词人,全中21050 首词。华古火该项目已经获得了 22.6k 个「star」以及 4.2k 个「fork」。库又
GitHub 项目:https://github.com/chinese-poetry/chinese-poetry
最全的上最诗词数据中华古典文集数据库,包含 5.5 万首唐诗、全中26 万首宋诗、华古火2.1 万首宋词和其他古典文集。库又诗人包括唐宋两朝近 1.4 万古诗人,上最诗词数据和两宋时期 1.5 千古词人。亿华云计算全中数据来源于互联网。华古火
为什么要做这个仓库? 项目作者表示,古诗是中华民族乃至全世界的瑰宝,我们应该传承下去,虽然有古典文集,但大多数人并没有拥有这些书籍。从某种意义上来说,这些庞大的文集离我们是有一定距离的。而电子版方便拷贝,云南idc服务商所以此开源数据库诞生了。此数据库通过 JSON 格式分发,可以让你很方便的开始你的项目。
古诗采集没有记录过程,因为古诗数据庞大,目标网站有限制,采集过程经常中断超过了一个星期。2017 年新加入全宋词,全宋词爬取过程及数据分析。
高频词分析图
宋词受欢迎的词牌名
宋词高频词
宋词作者作品榜
唐诗高频词
唐诗作者作品榜
宋诗高频词
宋诗作者作品榜
数据集
全唐诗 json 全宋诗 json 全宋词 ci 五代·花间集 wudai/huajianji 五代·南唐二主词 wudai/nantan 论语 lunyu 诗经 shijing 幽梦影 youmengying 四书五经 sishuwujing 蒙學 mengxue