Bootstrap

常见开放域知迟图谱的知迟表示方法

    不同的知识图谱项目都会根据实际的需要选择不同的知识表示框架。这些框架有不同的描述术语、表达能力、数据格式等方面的考虑,但本质上有相似之处。这里以三个最典型的开放域知识图谱(Freebase、Vikidata、ConceptNet)为例,尝试比较不同的知识图谱项目选用的知识表示框架,并总结影响知识表示框架选择的主要因素。为便于比较分析,以RDF、OWL的描述术语和表达能力为主要比较对象。

Freebase

    Freebase的知识表示框架主要包含如下几个要素:对象-Object、事实-Facts、类型-Types和属性-Properties。“Object'"代表实体。每一个“Object”有唯一的ID,称为MID(Machine ID)。一个“Object"可以有一个或多个“Types”。“Properties”用来描述“Facts”。例如,“BarackObama”是一个Object,并拥有一个唯一的MlD:“m/02mjmr”。这个Object的一个type是“/government/us_president”,并有一个称为“/government/us_.president/presidency_.number'"的Property,其数值是“44”。Freebase使用复合值类型(Compound Value Types,CVT)处理多元关系。

    如下图所示,示例的CVT描述了关于Obama的任职期限的多元关“government_position_held”。这个多元关系包含多个子二元关系:“office_.holder’““office_position”“from"“to”等。一个CVT就是有唯一MID的Object,也可以有多个Types。为了以示区别,Freebase把所有非CVT的Object也称为“Topic’。

;