语义网

语义网是由万维网联盟的蒂姆·伯纳斯-李1998年提出的一个看法,它的中心是:通过给万维网上的文档蒂姆加可以被盘算机所了解的语义,从而使通通互联网成为一个通用的新闻交换前言。语义万维网通过运用标准、置标言语和相关的处理东西来扩展万维网的才能。

根源:维基百科
简介

本日阵势部的收集实质都是为人类阅读而计划的,而不是让盘算机顺序有原理地操作。盘算机可以熟练地解析网页举行构造和往常处理——读取一个头文献,此中有一个链接指向另一个网页——可是一般来说,盘算机没有牢靠的方法来处理语义:比如这是Hartman和Strauss Physio诊所的主页,这个链接指向Hartman博士的简历。盘算机并不睬解词语和看法,以及它们之间的逻辑联系。

语义网将为网页上有原理的实质定义构造,创立一个状况,使得从一个页面跳转到另一个页面的软件署理可以轻松地为用户施行繁杂的义务。进入诊所网页的如许的署理人不光晓得该网页上有“治疗,药物,身体,疗法”等要害词(目前我们运用将这些词编码的方法),而且了解Hartman博士礼拜一,礼拜三这家诊所义务和礼拜五,还晓得脚本承受以yyyy-mm-dd样式输入的日期范围并灰返回预定时间。

万维网的基本属性是它的广泛性,超文本链接的强大之处于“任何东西都可以链接到任何东西”。迄今为止,收集举措人们的文档的前言开展得十分疾速,但却不行主动处理的数据和新闻,语义网旨补偿这一点。语义网不是一个独自的收集,而是目今收集的扩展,这个扩展的方式中新闻具有明晰的寄义,使盘算机和职员可以更好地协作。将语义Web嵌入到现有Web构造中的义务早曾经开端。不久的未来,跟着板滞可以更好地处理和“了解”目前仅仅只是被显示出来的数据,这些开辟将引入主要的新功用。语义网供应了一个通用框架,容许数据运用顺序,企业和社区边境上共享和重复运用。

[描画根源:Berners-Lee, T.; Hendler, J.; Lassila, O. (2001). The Semantic Web. Scientific American. 284(5): 34-43.]

语义网栈(semantic web stack)如下,其描画了语义网的构造:

[图片根源:https://en.wikipedia.org/wiki/Semantic_Web]

XML为文档中的实质构造供应了基本语法,但没有将语义与此中包罗的实质的寄义联络起来。目前大大都状况下,XML不是语义Web技能的须要构成部分。

XML Schema是一种用于供应和限制XML文档中包罗的元素的构造和实质的言语。

RDF是外达数据模子的简单言语,它涉及对象(“Web资源”)及其联系。基于RDF的模子可以用种种语法外示,比如RDF / XML,N3,Turtle和RDFa。RDF是语义网的基本标准,RDF Schema则扩展了RDF,用于描画基于RDF的资源的属性和类的词汇外,以及用于此类属性和类的通用目标构造的语义。

OWL为描画属性和类添加了更众的词汇,更丰厚的属性类型,属性特征(比如对称性)和摆列类。

SPARQL是语义Web数据源的条约和盘诘言语。

RIF是W3C规矩交换样式。它是用于外达盘算机可以施行的Web规矩的XML言语。

[描画根源:维基百科URL:https://en.wikipedia.org/wiki/Semantic_Web]

开展历史

描画

如我们此前语义收集(semantic network)中先容的那样,语义网看法实行上是基于许众已有技能的,这些技能可以追溯到20世纪60年代末期的Allan M. Collins、M. Ross Quillian、Elizabeth F. Loftus等人对语义收集的研讨。语义网这个念法是由Tim Berners-Lee于1998年提出的,并于1999年给出了更精细的描画:”往常的商业机制和我们的往常生存将通过板滞之间的指导和协作操作,人们吹嘘的“智能署理”终将完成。”

  • Tim Berners-Lee,James Hendler和Ora Lassila2001年的Scientific American上发外的作品中描画了现有收集向语义网开展的企划道径。但2006年,Nigel Shadbolt,Tim Berners-Lee和Wendy Hall发外的论文中认为这个简单的念法基本上还没有完成。因为语义网的计划模子是“自顶向下”的,完成很艰难,学者们渐渐将核心转向数据本身。2006年,Tim Berners-Lee提出链接数据/联系数据(Linked Data)的看法,饱励大师将数据公然并遵照必定的准绳(2006年提出4条准绳,2009年精简为3条准绳)将其发布互联网中。Leipzig大学项目组的学者认为语义网的根底起首应当是实质丰厚的众元数据语料,如许的语料可以极大促进诸如常识推理、数据的不确定办理技能,以及开辟面向语义网的运营系统,并提出了DBpedia项目,是目前已知的第一个大范围绽放域链接数据。2012年维基媒体基金会推出Wikidata项目,这是一个大范围社区成员协作常识库,旨用一种全新的方法办理常识。中文社区,相似的项目有上海交通大学的zhishi.me、清华大学的XLore、复旦大学的CN-pedia。

主要事情

A

B

C

1

年份

事情

相关论文/Reference

2

1998

Tim Berners-Lee提出语义网的念法

Berners-Lee, T. (1998).Semantic Web Road map.

3

1999

Tim Berners-Lee给出了对语义网更精细的描画

Berners-Lee, T.; Fischetti, M. (1999). Weaving the Web. HarperSanFrancisco

4

2001

Tim Berners-LeeHendler和Lassila发外的作品中描画了现有收集向语义网开展的企划道径

Berners-Lee, T.; Hendler, J.; Lassila, O. (2001). The Semantic Web. Scientific American. 284(5): 34-43.

5

2006

Nigel Shadbolt,Tim Berners-Lee和Wendy Hall发外的论文中认为这个简单的念法基本上还没有完成

Shadbolt, N.; Berners-Lee T. and Hall, W. (2006). The Semantic Web Revisited.IEEE Intelligent Systems, 21(3): 96-101.

6

2006-2009

Tim Berners-Lee提出链接数据(Linked Data)的看法,饱励大师将数据公然并遵照必定的准绳(2006年提出4条准绳,2009年精简为3条准绳)将其发布互联网中

Berners-Lee, T. (2006). Linked data-designissues[J].//Berners-Lee, T.(2009). The next web[J].

7

2007

Leipzig大学项目组的学者提出了DBpedia项目

Auer, S, Bizer, C, Kobilarov, G, et al. (2007). Dbpedia: A nucleus for a web of open data. The semantic web. pp 722-735.

8

2012

维基媒体基金会推出Wikidata项目

Vrandei, D. (2012). Wikidata: a new platformfor collaborative data collection. Proceedings of the 21st International Conference on World Wide Web. pp 1063-1064.

开展剖析

瓶颈

语义网的少许挑衅包罗广泛性,模糊性,不确定性,差别等性和诈骗性。

广泛性(Vastness):万维网包罗数十亿页,现有技能尚未能消弭所有语义上重复的术语。

模糊性(Vagueness):即用户盘诘的模糊性,目前仍没有怎样供应更好的搜寻结果确实定性办理方案。

不确定性(Uncertainty):这些指准确看法,但却具有不确定的值。比如,患者可以会呈现一系列症状,这些症状对应于种种差别诊断,每种诊断确诊的概率又差别。

差别等性(Inconsistency):这些都是大型本体开辟进程中以及来自差别根源的本体组适时不可避免地会呈现的逻辑冲突。演绎推理面临差别等时会爆发灾难性的糜烂,因为“任何事故都是从冲突中发生的”。不可行的推理和谐和推理是可以用来处理差别等的两种技能。

诈骗(Deceit):新闻的制制家可以会包罗成心误导消费者的新闻。

[描画根源:维基百科URL:https://en.wikipedia.org/wiki/Semantic_Web]

未来开展偏向

目前的研讨热门阵势部仍然常识图谱、链接数据/联系数据的偏向。

Contributor: Yuanyuan Li

相关人物
詹姆斯·亨德勒
詹姆斯·亨德勒
美国伦斯勒理工学院的人工智能研讨员,也是语义网的创始人之一
Nigel Shadbolt
Nigel Shadbolt
目次
简介
相关人物