知识图谱(二)——知识推理

知识图谱(二)——知识推理知识推理是知识图谱中很重要的一部分,主要用于推理暗含的知识(丰富知识图谱),检查知识库的不一致(知识清洗)知识推理分类演绎推理从一般到特殊的过程.从一般性的前提出发,通过推导,得到具体描述或个别结论(三段论),结论已经蕴含一般性知识中,只是通过演绎推理揭示出来,不能得到新知识.归纳推理从特殊到一般的推理过程.从一类事物的大量特殊事例出发,去推出该类事物的一般性结论(数学归纳法)…

大家好,又见面了,我是你们的朋友全栈君。

知识推理是知识图谱中很重要的一部分,主要用于推理暗含的知识(丰富知识图谱),检查知识库的不一致(知识清洗)

知识推理分类

演绎推理

从一般到特殊的过程.从一般性的前提出发,通过推导,得到具体描述或个别结论(三段论),结论已经蕴含一般性知识中,只是通过演绎推理揭示出来,不能得到新知识.

归纳推理

从特殊到一般的推理过程.从一类事物的大量特殊事例出发,去推出该类事物的一般性结论(数学归纳法),推出的结论没有包含在已有内容中,增加了新知识.

确定性推理&不确定推理

数值推理&符号推理

基于表示学习的推理

归纳推理

归纳逻辑程序设计(Inductive Logic Programming, ILP)使用一阶谓词逻辑来进行知识表示,通过修改和扩充逻辑表达式来完成对数据的归纳

这里写图片描述

FOIL(First Order Inductive Learner)算法

利用序贯覆盖实现规则学习

Algorithm
1. 从空规则开始,将目标谓词作为规则头
2. 逐一将其他谓词加入规则提进行考察,按预定标准评估规则的优劣并选取最优规则
3. 将该规则覆盖的训练样例去除,以剩下的训练样例组成训练集重复上述过程

评估准则

FOIL_GAIN=m^+(log2m^+m^++m^log2m+m++m) F O I L _ G A I N = m ^ + ∗ ( log 2 ⁡ m ^ + m ^ + + m ^ − − log 2 ⁡ m + m + + m − )

其中, m^+/m^ m ^ + / m ^ − 为增加候选文字后新规则覆盖的正反例数目, m+/m m + / m − 表示原规则所覆盖的曾凡丽数目.(类似于决策树的信息增益)

上述的归纳逻辑程序设计(ILP)具有以下缺点:需要目标谓词的正例和反例,同时暗含封闭世界假设(即所有未声明是正例的样本都是反例)

AMIE算法

不完备知识库的关联规则挖掘(Association Rule Mining under Incomplete Evidence,AMIE)支持从不完备知识库中,挖掘闭式规则

AMIE依次学习预测每种关系的规则。对于每种关系,从规则体为空的规则开始,通过三种操作扩展规则体部分,保留支持度大于阈值的候选(闭式)规则。

  • 添加悬挂边:悬挂边是指边的一端是一个未出现过的变量,而另一端(变量或常量)是在规则中出现过的
  • 添加实例边:实例边与悬挂边类似,边的一端也是在规则中出现过的变量或常量,但另一端是未出现过的常量,也就是知识库中的实体
  • 添加闭合边 :闭合边则是连接两个已经存在于规则中的元素(变量或常量)的边。

这里写图片描述

评估准则
– 支持度:同时符合规则体和规则头的实例数目

supp(B⃗ r(x,y)):=#(x,y):z1,...,zm:B⃗ r(x,y) s u p p ( B → ⇒ r ( x , y ) ) := # ( x , y ) : ∃ z 1 , . . . , z m : B → ∧ r ( x , y )



– 置信度:支持度除以仅符合规则体的实例数目


conf(B⃗ r(x,y)):=supp(B⃗ r(x,y))#(x,y):z1,...,zm:B⃗  c o n f ( B → ⇒ r ( x , y ) ) := s u p p ( B → ⇒ r ( x , y ) ) # ( x , y ) : ∃ z 1 , . . . , z m : B →



– PCA置信度


pcaconf(B⃗ r(x,y)):=supp(B⃗ r(x,y))#(x,y):z1,...,zm:B⃗ r(x,y) p c a c o n f ( B → ⇒ r ( x , y ) ) := s u p p ( B → ⇒ r ( x , y ) ) # ( x , y ) : ∃ z 1 , . . . , z m : B → ∧ r ( x , y ‘ )

路径排序算法

路径排序算法(Path Ranking Algorithm),PRA),以两个实体间的路径作为特征,来判断它们之间可能存在的关系

Algorithm
1. 特征抽取(生成并选择路径特征集合)
方法:随机游走,广度优先搜索,深度优先搜索
2. 特征计算(计算每个训练样例的特征值)
方法:随机游走概率,布尔值(出现/不出现),出现频次/概率
3. 分类器训练(根据训练样例,为每个目标关系训练一个分类器)
方法:单任务学习(为每个关系单独训练二分类器);多任务学习(不同关系联合学习)

演绎推理

原始方法:直接通过一阶谓词逻辑进行推理

马尔科夫逻辑网

将概率图模型与一阶谓词逻辑结合,核心思想是为规则绑定权重(规则概率化),软化一阶谓词逻辑的硬约束.

形式化定义

这里写图片描述

马尔科夫逻辑网的优势:

  • 当规则及其权重已知时:推断知识图谱中任意未知事实成立的概率(马尔可夫随机场的推断问题)证据变量为知识图谱中的已知事实,问题变量为未知事实
  • 当规则已知但其权重未知时:自动学习每条规则的权重(马尔可夫随机场的参数学习)
  • 当规则及其权重均未知时:自动学习规则及其权重(马尔可夫随机场的结构学习),属于上述归纳推理的范畴

概率软逻辑

马尔科夫逻辑网的进一步延伸,最大优点是允许原子事实(节点)的真值可以在连续的[0,1]区间取任意值(事实概率化),而不是像马尔科夫逻辑网取{0,1}离散值.

数值推理

基于表示学习

《知识图谱(一)——知识表示》,通过将符号表示映射到向量空间进行数值表示,能够减少维数灾难问题,同时能够捕捉实体和关系之间的隐式关联,重点是可以直接计算且计算速度快.(Trans E,Trans R,Trans H)

基于张量分解

通过张量分解,将知识图谱表示成张量的形式,主要应用于链接预测(判断两个实体之间是否存在某种特定关系)实体分类(判断实体所属语义类别)实体解析(指代消解)

这里写图片描述

TRESCAL模型(解决输入张量高度稀疏所带来的过拟合问题)

面临挑战

  • 大规模知识图谱中知识推理的可扩展性
  • 大数据流处理中的推理效率(Flink、Spark 并行化流处理)
  • 时空推理
  • 自动或半自动的规则推理实现

资料来源:
[1]. 《第13章 知识图谱与知识推理》王泉
[2]. 《第10章 知识推理》王泉
[3]. 《知识图谱中推理技 术进展及应用》漆桂林

知识共享许可协议
本作品采用知识共享署名-非商业性使用-相同方式共享 3.0 中国大陆许可协议进行许可。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/137865.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • 矩阵范数与矩阵的模

    矩阵范数与矩阵的模我的机器学习教程「美团」算法工程师带你入门机器学习已经开始更新了,欢迎大家订阅~任何关于算法、编程、AI行业知识或博客内容的问题,可以随时扫码关注公众号「图灵的猫」,加入”学习小组“,沙雕博主在线答疑~此外,公众号内还有更多AI、算法、编程和大数据知识分享,以及免费的SSR节点和学习资料。其他平台(知乎/B站)也是同名「图灵的猫」,不要迷路哦~矩…

  • 深入理解机器学习中的:目标函数,损失函数和代价函数「建议收藏」

    深入理解机器学习中的:目标函数,损失函数和代价函数「建议收藏」参考知乎回答整理:https://www.zhihu.com/question/52398145主要参考:https://www.zhihu.com/question/52398145/answer/209358209基本概念:损失函数:计算的是一个样本的误差代价函数:是整个训练集上所有样本误差的平均目标函数:代价函数+正则化项实际应用:损失函数和代价函数是同一个东

  • java map转object_json对象转map集合

    java map转object_json对象转map集合第一种方法:fastJosnimportcom.alibaba.fastjson.JSON;importcom.alibaba.fastjson.JSONObject;Object转MapFindArchiveDtofindArchiveDto=newFindArchiveDto();findArchiveDto.setContractStatus(“降龙”);…

  • org.apache.jasper.JasperException: org.apache.jasper.JasperException: java.lang.ClassNotFoundExcepti[通俗易懂]

    org.apache.jasper.JasperException:org.apache.jasper.JasperException:java.lang.ClassNotFoundException:org.apache.jsp.jsp.main_jsp主要问题:原因:有多个界面有下面这句话<%@tagliburi="http://java.sun.com/jstl/core"

  • Oracle基础 各种语句的定义格式

    Oracle内建数据类型一、 字符数据1、 char(size)2、 varchar2(size) 最常用,最大长度4000字节3、 nvhar(size)、nvarchar(size)4、 varc

    2021年12月20日
  • 腾讯课堂下载回放视频课程记录_腾讯课堂回放下载

    腾讯课堂下载回放视频课程记录_腾讯课堂回放下载腾讯课堂下载回放视频对于爱学习的童鞋来说,能把腾讯课堂上的视频下载下来,随时随地听课,那该有多好啊!但是,腾讯课堂采取了多种加密措施,导致下载视频难上加难……要想下载视频,必须分为两部分进行,先获取视频的m3u8地址,然后用m3u8地址下载视频。第一步,获取视频m3u8地址:下面用两款热门浏览器:360安全浏览器和谷歌浏览器进行演示。①360浏览器:…

    2022年10月26日

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号