知识图谱

2020-12-11

        知识图谱技术是人工智能技术的重要组成部分,其建立的具有语义处理能力与开放互联能力的知识库,可在智能搜索、智能问答、个性化推荐等智能信息服务中产生应用价值。知识图谱于2012年5月17日被Google正式提出, 其初衷是为了提高搜索引擎的能力,增强用户的搜索质量以及搜索体验。目前,随着智能信息服务应 用的不断发展,知识图谱已被广泛应用于智能搜索、 智能问答、个性化推荐等领域。

知识图谱是一种基于图的数据结构,由节点(point)和边(Edge)组成,每个节点表示一个“实体”,每条边为实体与实体之间的“关系”,知识图谱本质上是语义网络。实体指的可以是现实世界中的事物,比如人、地名、公司、电话、动物等;关系则用来表达不同实体之间的某种联系。

     由上图,可以看到实体有地名和人;大理属于云南、小明住在大理、小明和小秦是朋友,这些都是实体与实体之间的关系。

 Neo4j

       Neo4j是一个本地图形数据库,它是从头开始构建的,不仅可以利用数据,而且可以利用数据关系。Neo4j连接存储的数据,以前所未有的速度实现前所未有的查询。

       与传统的数据库按行,列和表排列数据的传统数据库不同,Neo4j具有灵活的结构,该结构由数据记录之间的存储关系定义。使用Neo4j,每个数据记录或节点都存储指向与其连接的所有节点的直接指针。由于Neo4j是围绕此简单而强大的优化设计的,因此它执行复杂连接的查询要比其他数据库快几个数量级,而且深度更大。

       使用Neo4j,可以存储数据之间的连接-无需在查询时进行计算。Cypher是一种强大的,图形优化的查询语言,可以理解并利用这些存储的连接。当试图在数据中查找模式或洞察力时,Cypher查询通常比大量的SQL JOIN更简单,更容易编写。