马里兰大学:怎样通过人机协作,让盘算机更好地答复题目?

日前,美国马里兰大学(University of Maryland、UMD)的研讨职员曾经发明怎样通过人机协作牢靠地挑衅盘算机言语,反又厮人类言语的繁杂性。他们开辟了包罗1200众个题目的数据集,虽然题目很简单,但仍困热优当今最强大的盘算机应答系统。进修掌握这些题目的系统将比目前保管的任何系统对言语有更好的了解。

图|人类与人工智能的看法(图片根源: nespix / Adobe Stock人工智能的终极目标之一是让板滞真正了解人类的言语,并从繁杂、纤细的字句中标明语意。当2011年IBM的Watson电脑击败出名的《伤害边沿》(电视智力竞赛节目)冠军肯·詹宁斯(Ken Jennings)时,仿佛就已抵达了这一目标。可是,任何实验过与虚拟帮忙Siri举行对话的人都晓得,要真正了解人类言语,盘算机另有很长的道要走。于是为了更好地舆解人类言语,盘算机系统必需教练挑衅这些题目,并完备地反应人类言语的繁杂性。

马里兰大学的研讨职员曾经发明怎样通过人机协作牢靠地创立这些题目,并开辟了一个包罗1200众个题目的数据集,虽然题目易于答复,但仍难倒了当今最好的盘算机应答系统。进修掌握这些题目的系统将比目前保管的任何系统能对言语有更好的了解。这项研讨已发外2019年出书的《盘算言语学协会学报》上。

该论文的资深作家、UMD盘算机科学副传授Jordan Boyd-Graber说:“大大都的盘算机问答系统并没有标明为什么它们会如许答复题目,但我们的义务帮帮我们了解盘算机实行了解的实质。另外,我们还开辟了一个数据集,用于测试盘算机,这些数据集将揭示盘算机言语系统是否真的阅读并能施行与人类相同的处理。”

目前大大都改良盘算机问答顺序的义务都是由义务职员或盘算机来生成题目。这些方法保管的苟菪题目是,当人们写题目时,并不晓得题目的哪些特定元素会混杂盘算机。而盘算机编写题目时,要么编写公式化的、填空式的题目,一朝堕落,就会发生毫偶尔义的结果。

为了开辟人类与盘算机配合义务创立题目的械澜法,Jordan Boyd-Graber及其团队创立了一个盘算机界面,当开辟职员输入一个题目时,该界面能显示盘算机“考虑”什么,然后开辟职员再编辑题目来应用盘算机的弱点。

新界面中,当人类输入题目时,盘算机的猜念会按序次显示屏幕上,并特出显示导致盘算机做出猜念的单词。

比如,假如输入“哪位作曲家的海顿中心变奏曲是受到卡尔·费迪南德·波尔的启示?”,而系统准确地答复了“约翰内斯·勃拉姆斯”,那么界面会特出显示“费迪南德·波尔『镶个词,外明是这个抖蒿指导它找到了谜底。应用这些新闻,人们可以再次编辑题目,让盘算机不改动题目寄义的状况下更难答复准确。这个例子中,把“卡尔·费迪南德·波尔”换成了对他义务的描画“维也纳音乐协会的档案办理员”,盘算机就无法准确答复。分明,专业的人类智力游戏玩家仍然可以轻松准确地答复从头编辑后的题目。

通过协作,人类和盘算机牢靠地开辟了1213个盘算机艰难,研讨职员一场竞赛中对体验丰厚的人类选手举行了测试,此中包罗从大学初级校队到《伤害边沿》的冠军,即使是最弱的团队也击败了最强的盘算机系统。

“近三四年来,人们已渐渐看法到盘算机问答系统十分软弱,且易被捉弄,但这是我们所知的第一篇真正运用板滞来帮帮人类打破模子的论文。”该论文的配协作家UMD盘算机科学研讨生石峰(音译)说。

研讨职员外示,这些题目不光可以举措盘算机专家更好地舆解自然言语处理糜烂的新数据集,还可以举措开辟改良的板滞进修算法的教练数据集。这些题目揭示了继续困扰盘算机的六种差别言语现象。

这六种现象分为两类。第一类是言语现象:释义(比如说“leap from a precipice”而不是“jump from a cliff”,但释义均为“从悬崖跳下来”);疏散当心力的言语或语意的被页鲸比如与政事无关的线索中援用政事人物)。第二类是推理本领:需求逻辑和盘算的线索,对题目中的元素举行三角剖分,或将众个方法组合一同变成结论。

Jordan Boyd-Graber 外示,“人类能举行更众地轮廓,并看到更深目标的联络。虽然人类没有盘算机的无量内存,但仍然有优势可以通过部分看到全体。把盘算机碰到的题目分类,有帮于了解我们需求办理的题目,如许才干真正让盘算机开端通过部分看到全体,并以人类的方法答复题目。”

Jordan Boyd-Graber增补道,要完成这一目标另有很长的道要走,这篇论文列出了未来几年的研讨议程,如许能让电脑更好地答复题目。他目前就职于马里兰大学高级盘算机研讨所(UMIACS)以及UMD的新闻研讨学院和言语科学中心,这项研讨供应的新东西,将帮帮盘算机科学家完成这一目标。

(参考:www.sciencedaily.com)

财产人机交互马里兰大学
相关数据
IBM机构

是美国一家跨国科技公司及咨询公司,总部位于纽约州阿蒙克市。IBM主要客户是政府和企业。IBM生产并出售盘算机硬件及软件,而且为系统架构和收集托管供应咨询效劳。截止2013年,IBM已举世具有12个研讨实行室和大宗的软件开辟基地。IBM虽然是一家商业公司,但材料、化学、物理等科学范畴却也有很高的成绩,应用这些学术研讨为根底,发明许众产物。比较出名的IBM发明的产物包罗硬盘、主动柜员机、通用产物代码、SQL、联系数据库办理系统、DRAM及沃森。

https://www.ibm.com/us-en/
相关技能
板滞进修技能

板滞进修是人工智能的一个分支,是一门众范畴交叉学科,涉及概率论、统计学、迫近论、凸剖析、盘算繁杂性表面等众门学科。板滞进修表面重假如计划和剖析少许让盘算机可以主动“进修”的算法。因为进修算法中涉及了大宗的统计学表面,板滞进修与推测统计学联络尤为亲密,也被称为统计进修表面。算法计划方面,板滞进修表面体恤可以完成的,卓有用果的进修算法。

人工智能技能

学术研讨范畴,人工智能一般指可以感知四周状况并接纳举动以完成最优的可以结果的智能体(intelligent agent)

逻辑技能

人工智能范畴用逻辑来了解智能推理题目;它可以供应用于剖析编扯蒿言的技能,也可用作剖析、外征常识或编程的东西。目昔人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

自然言语处理技能

自然言语处理(英语:natural language processing,缩写作 NLP)是人工智能和言语学范畴的分支学科。此范畴议论如那处理及运用自然言语;自然言语认知则是指让电脑“懂”人类的言语。自然言语生成系统把盘算机数据转化为自然言语。自然言语了解系统把自然言语转化为盘算机顺序更易于处理的方式。

问答系统技能

问答系统是未来自然言语处理的昭质之星。问答系统外部的方法上来看,其与目前主流资讯检索技能有两点差别:起首是盘诘方法为完备而白话化的问句,再来则是其回传的为高精准度网页结果或明晰的谜底字串。以Ask Jeeves为例,运用者不需求考虑该运用什么样的问法才干够取得抱负的谜底,只需求用白话化的方法直接提问如“请问谁是美国总统?”即可。而舷沉私庠擞谜呶示浜螅会十分分明地答复“奥巴马是美国总统”。面临这种系统,运用者不需求费心去一一检视搜寻引擎回传的网页,关于资讯检索的服从与资讯的普及都有很大帮帮。从系统内部来看,问答系统运用了大宗有别于古板资讯检索系统自然言语处理技能,如自然言语剖析(Natural Language Parsing)、题目分类(Question Classification)、专名辨识(Named Entity Recognition)等等。少数系统以致会运用繁杂的逻辑推理机制,来区隔出需求推理机制才干够区隔出来的谜底。系统所运用的材料上,除了古板资讯检索会运用到的材料外(如字典),问答系统还会运用本体论等语义材料,或者应用网页来添加材料的丰厚性。

言语学技能

每种人类言语都是常识和才能的复合体,言语的运用者可以互结交换,外达念法,假设,心情,愿望以及所有其他需求外达的事物。言语学是对这些常识系统各方面的研讨:怎样构修如许的常识系统,怎样获取,怎样新闻的制制和了解中运用它,它是怎样随时间改造的?言语学家于是体恤言语实质的少许特别题目。比如: 所有人类言语都有哪些配合属性?言语怎样差别,系统的差别程度怎样,我们能否差别中找到方式?孩子怎样短时间内取得云云完备的言语常识?言语随时间改造的方法有哪些,言语改造的范围性是什么?当我们发生和了解言语时,认知进程的实质是什么?言语学研讨的便是这些最实质的题目。

引荐作品
暂无评论
暂无评论~