史上最大规模1.4亿中文知识图谱开源下载
2016 年 8 月 3 日
知识就是力量,知识图谱是人工智能新时代的产物,简单地说知识图谱就是通过关联关系将知识组成网状的结构,然后我们的人工智能可以通过这个图谱来认识其代表的这一个现实事件,这个事件可以是现实,也可以是虚构的。
本次ownthink开源了史上最大规模的中文知识图谱,数据是以
-
实体、属性、值
-
实体、关系、实体
混合的形式组织,采用csv数据格式,ownthink_v2.csv下载链接见文末。
ownthink_v2.csv文件8.57G,直接读取肯定会很慢很卡。
先读取前5条数据看看样子
下面的代码是可迭代读取方式
分块读取
到现在我也不知道有多少行,实在是太大了。
如果想获取某个实体的属性和值,可以使用pd.read_csv的chunksize分批读取,这里我每批次读取5条数据,总共就显示50行就结束程序
Run
数据下载方式:
关注思知机器人回复【数据下载】获取下载链接
百度网盘 https://pan.baidu.com/s/1LZjs9Dsta0yD9NH-1y0sAw 提取码: 3hpp 解压密码是:https://www.ownthink.com/
阿里云下载 https ://nebula-graph.oss-accelerate.aliyuncs.com/ownthink/kg_v2.tar.gz