当前,人工智能技术的发展速度之快已经超出了所有人的想象,以至于总会有人不断将现有人工智能的表现与人类相比较。然而,在经过不同层面的对比之后,不难得出一个结论:尽管目前人工智能技术在一些特定任务上有比较好的表现,但在一些开放性的任务上往往不尽如人意。换言之,利用深度学习和大数据,目前的人工智能系统足够“聪明”,虽可以在计算密集型任务上超越人类,却远未达到“有学识”的程度,无法和人一样进行复杂的推理和联想等。而知识图谱被认为是让人工智能系统做到“有学识”的关键,它通过诸如 RDF、图形式等存储各种各样的结构化知识,成为人工智能的“大脑”。
然而知识图谱并不是单一技术,而是一整套数据加工、存储及应用流程。本章将会围绕知识图谱的整体技术体系进行阐述,具体分为四个主要部分:知识表示与知识建模、知识抽取与知识挖掘、知识存储与知识融合、知识检索与知识推理。通过阅读本章,读者能够建立对知识图谱技术栈的整体认知。
一、知识表示与知识建模
对现有知识进行表示和建模是构建知识图谱的基础和准备工作,也是完整构建有价值的知识图谱的前提。本节将对知识表示与知识建模的概念及常用方法进行详细介绍。
1、知识表示
通过将知识按照一定的方法进行表示和存储,才能让计算机系统更高效地处理和利用知识。实际上,知识表示是人工智能领域一个较为核心的问题。对于知识表示的准确定义目前仍旧没有一个