语义收集

语义收集常常用作常识外示的一种方式。它实是一种有向图;此中,极点代外的是看法,而边则外示的是这些看法之间的语义联系。

根源:维基百科
简介

语义收集是用于外示互连节点和弧段方式中常识的图形构造,即适用于常识外示的有向图。所有语义收集的配合之处于声明式图形外示,可用于外示常识并支撑用于推理常识的主动化系统。 有些版本十分不正式,但其他版本则是正式定义的逻辑系统。 以下是六种最常睹的语义收集:

  1. 定义收集(Definitional networks):其夸张子类型,或看法类型和新定义的子类型之间的联系。 生成的收集(也称为泛化或包罗目标构造)支撑将超类型定义的属性复制到其所有子类型的承袭规矩。
  2. 断言收集(Assertional networks):与定义收集差别,该收集假定其包罗的新闻好坏常实的,除非它明晰用模态运算符(modal operator)标记。目前有少许研讨提出将这种收集举措自然言语语义的看法结贡ィ型。
  3. 连累收集(Implicational networks ):其运用寄义举措连接节点的主要联系。它们可以用来外示信奉,因果联系或推论的方式。
  4. 可施行收集(Executable networks):包罗如标记转达(marker passing)等的少许机制,它们用于施行推理,转达新闻或搜寻方式和联系的义务。
  5. 进修收集(Learning networks ):通过从例子中获取常识来构修或扩展其外示,进修收集中,新常识可以通过添加和删除节点和弧或通过改正与节点和弧联系的权重来改动旧收集。
  6. 混淆收集(Hybrid networks):其联合了以前的两种或两种以上技能,可以是简单收集,也可以是独立但厉密互相感化的收集。

下图给出一个定义收集的精细例子,该收集将Truck和TrailerTruck看法定义为Vehicle的子类型。图中有九个看法节点和九个箭头,用于外示差别类型的链接。 白色椭圆外示类型的通用看法,这有区别于暗影椭圆,它是实例18的独自看法。整数(Integer)是内置类型。 下图可以定义Truck和TrailerTruck的看法,但Vehicle,Trailer,WtMeasure和VolMeasure必需

由其他KL-ONE图外定义。

双线箭头外示TrailerTruck到Truck以及Truck到Vehicle的子类型-超类型(subtype-supertype)链接。 中心有一个圆圈的箭头外示实质(role)。 Truck节点有四特实质,区分标记为UnloadedWt,MaxGrossWt,CargoCapacity和NumberOfWheels。 TrailerTruck节点有两特实质,一个标记为HasPart,另一个将Truck的NumberOfWheels取值限制为18。中心有一个圆圈的箭头的目标端的符号v / r外示对这些脚色的取值限制或类型限制。

用文字可以将上图总结为:

每辆Truck都是一辆Vehicle。

每辆TailerTruck都是一辆包罗如下实质的Truck:

其是Trailer的一部分,

有卸载重量(unloaded weight)目标,

有最大毛重(maximum gross weigh)目标,

有货品容量(cargo capacity)器量,

另有18个轮子。

[描画根源: Sowa, J. F. (1992). Semantic Networks. Encyclopedia of Artificial Intelligence, Wiley.]

开展历史

1956年,剑桥言语研讨组的Richard H. Richens起首为盘算机发清楚语义收集——值妥当心的是,盘算机科学除外的语义收集一词可以追溯到更早以前——举措自然言语板滞翻译的“interlingua”。因为其图构造,语义收集可以更好地外示自然言语的构造,从而更好地将自然言语的语义提取出来。

举措SYNTHEX项目标一部分,这一完成是二十世纪六十年代早期由 Robert F. Simmons 和 M. Ross Quillian 等人独立开辟的。Allan M. Collins 和 M. Ross Quillian 随后1969年应用这一看法试图将常识与时间新闻勾结起来。1975年Allan M. Collins和Elizabeth F. Loftus 基于M. Ross Quillian的语义记忆搜寻和语义准备表面提出了处理人类语义的扩散激活表面(spreading-activation theory)。

20世纪80年代后期,荷兰的两所大学Groningen和Twente配合开端了一个名为常识图谱(Knowledge Graphs)的项目,它是语义收集,但添加了束缚条件,即边沿(edge)被限制一组有限的可以联系中。随后的几十年中,语义收集和常识图谱之间的区别变得模糊了。2001年,Tim Berners-Lee等学者提出了语义收集的新的运用场景:语义网(semantic web),其偏重于数据差别运用中的共享和重用。 2012年,Google将他们的常识图外命名为常识图谱。

主要事情

年份事情相关论文/Reference
1963Robert F. Simmons,Sheldon Klein,Karen McConologue,M. Ross Quillian 等人独立为盘算机发清楚语义收集Robert F. Simmons (1963). Synthetic language behavior. Data Processing Management. 5 (12): 11–18.// Quillian, R. (1963). A notation for representing conceptual information: An application to semantics and mechanical English para- phrasing. System Development Corporation.
1969Allan M. Collins和M. Ross Quillian应用这一看法试图将常识与时间新闻勾结起来Collins, A. M.; Quillian, M. R. (1969). Retrieval time from semantic memory.Journal of verbal learning and verbal behavior. 8 (2): 240–247.
1975Allan M. Collins和Elizabeth F. Loftus基于M. Ross Quillian的语义记忆搜寻和语义准备表面提出了人类语义处理的扩散激活表面Collins, A. M.; Loftus, E. F. (1975). A spreading-activation theory of semantic processing. Psychological Review. 82: 407–428.
2001Tim Berners-Lee等学者提出了语义收集的新的运用场景:语义网(semantic web)Berners-Lee, T.; Hendler, J.;Lassila, O. (2001). The Semantic Web. Scientific American. 284(5):34-43.

开展剖析

瓶颈

语义收集主要保管以下缺陷:

  1. 语义收集高度定制化,需求用户本人定义节点和边的值,缺乏客观性;
  2. 难以交融众源数据;
  3. 无法区分看法节点和对象节点。

未来开展偏向

因为语义收集可以运用图构造更好地外示自然言语的构造,其常常用于板滞翻译、问答系统和自然言语了解。

Contributor:Yuanyuan Li

相关人物
伊丽莎白·洛塔斯
伊丽莎白·洛塔斯
美国认密友理学家和人类记忆专家。她对人类记忆的可塑性举行了广泛的研讨。2002年,她20世纪100名最有影响力的心思学研讨职员名单中排名第58位,也是该名单中排名最高的女性。
理查德·胡克·里钦斯
理查德·胡克·里钦斯
英国植物学家,也是盘算言语学的早期研讨者。虽然是一名专业植物学家,但Richens私人也对板滞翻译感兴味,并与Margaret Masterman及Michael Halliday协作,这个中心上展开了主要的早期义务,厥后又剑桥大学言语研讨机构义务。
Timothy John Berners-Lee
Timothy John Berners-Lee
Robert F. Simmons
Robert F. Simmons
爱伦·M·科林斯
爱伦·M·科林斯
美国认知科学家,美国西北大学蕉蔟与社会计谋学院的进修科学声誉传授。他的研讨对认密友理学、人工智能和蕉蔟范畴有广泛影响。
简介
相关人物