-
path ranking
algorithm
调研报告
1.
引言
近两年来,随着
Linking Open Data
等项目的全面展开,语义
Web
数据源的
数量激增,大量
RDF
数据被发布。互联网正
从仅包含网页和网页之间超链接的
文档万维网
(Documen
t
Web)
转变成包含大量描述各种实体和实体之间丰富关系
的数据万维网
(Data Web)
。
在这个背景下,
Google
、百度和搜狗等搜索引擎公司
p>
纷纷以此为基础构建知识图谱,如
Knowledge Graph
、知心和知立方等,用以改
进搜索质量,从而拉开了语义搜索的
序幕。
正如
Google
的辛格博士在介绍知识图谱时提到的:
“
The
world is not made of
strings , but is
made of things.
”
,
知识图谱旨在描述真实世界中存在的各种实体或
概念。其中,每个实体或概念用一个全局
唯一确定的
ID
来标识,称为它们的标
识符
(identifier)
。
每个
属性
-
值对
(attribute
p>
-
value pair
,
又称
A
VP)
用来刻画实体的
内
在特性,而关系
(relation)
用来连接两个实体,刻画它们之间的关联。知识图谱亦
可被看作是由一张巨大的图组成
,
图中的节点表示实体或概念,
而图中的边则由
属性或关系构成,我们需要构建并使用这张图。
大规
模知识图谱的构建与应用需要多种智能信息处理技术的支持,
其中主要
< br>包括:实体链指(
Entity
Linking
)、关系抽取(
Relation Extra
ction
)、知识表示
(
Knowl
edge Representation
)、知识推理(
Kn
owledge Reasoning
)等。
在知识推理方面,利用推理规则实现关系抽取的经典方法之一就是
Path
Ranking
Algorithm
算法,由
Lao & Cohen
与
2010
年提出。该方法将每种不同的
关系路径作为一维特征,通过在知识图谱
/Knowledge
p>
Base
中统计大量的关系路
径构建关系分
类的特征向量,
建立关系分类器进行关系抽取,
取得不错的抽取
效
果,
成为近年来的关系抽取的代表方法之一。
但目前这种基于关系的统计的方法,
只能在连通图上使用,
对于那些出现频率低的关系有严重的数据稀疏问题,
且代
价
高昂。针对这样的问题,现今也出现了许多针对该算法的改进研究。
-
-
-
-
-
-
-
-
-
上一篇:毛织基本知识3-缝挑
下一篇:实义动词