道雪编译

挫折换脸技能滥用,谷歌发布大型数据集对立deepfake

deepfake 呈现以后激起了大宗争议,也带来了诸众伦理和社会题目。近来,Facebook、微软等巨头已开端入手挫折 deepfake 滥用,斥资 1000 众万美元举办 deepfake 检测挑衅赛。谷歌也不甘落伍,即日,这家科技巨头发布开源大型 deepfake 视频数据集,以支撑社区对 deepfake 检测的研讨。

深度进修催生出许众几年前难以念象的技能。当代生成模子(modern generative model)便是此中一例,它可以合成超传神的图像、语音、音乐以致视频。这些模子已被广泛运用于大宗用途,包罗直接基于文本生成类人语音、为医疗影像研讨生成教练数据等。

和其他改造性技能相同,生成模子也带来了新的挑衅,如「deepfake」。2017 年末,deepfake 首次亮相,之后呈现了许众开源 deepfake 生成方法,导致合成视频片断大宗呈现。尽管许众此类视频的制制初志是搞乐,但照旧有少许 deepfake 视频对私人和社会变成了卑劣影响。

谷歌厉正地思索了这些题目。客岁,谷歌发布了「AI 准绳」,容许探究 AI 最佳实行,以减轻 AI 滥用和 AI 损害。客岁 1 月,谷歌发布了一个合针言音数据集,用于支撑 ASVspoof 2019 挑衅赛,帮帮开辟高功用的假音频检测器。举措赛事的数据库,该数据集已被 150 众个研讨机构和工业界构造下载,目前该数据集依黩大众免费绽放。

即日,谷歌 AI 与 Jigsaw(原 Google Ideas)协作发布了大型视觉 deepfake 数据集,该数据集已被纳入慕尼黑工业大学和那不勒斯腓特烈二世大学创立的 FaceForensics 基准(由谷歌联合赞帮)。

FaceForensics 基准数据集地址:https://github.com/ondyari/FaceForensics/

谷歌此次发布的 deepfake 数据汇合的视频示例。其生成进程中,随机挑选一对艺人,深度神经收集对其施行换脸操作。

为了制制该数据集,谷歌过去一年中与众名有偿和无偿艺人协作拍摄了数百个视频。然后,谷歌运用公然可用的 deepfake 生成方法,基于这些视频创立出数千个 deepfake 视频。这些真假视频配合构成烈檬据集,谷歌创立此数据集的目标是支撑 deepfake 检测方面的研讨。举措 FaceForensics 基准的一部分,该数据集目前已开源,研讨社区可免费获取并用于开辟合成视频检测方法。

众种场景中对艺人举行拍摄。上图为实艺人,下图是对应的 deepfake 示例,二者的差别程度取决于创立 deepfake 所用的另一位艺人。

deepfake 技能开展疾速,谷歌外示将继续添加该数据汇合的数据,并该范畴中继续展开协作。谷歌坚决地支撑研讨社区减轻合成前言滥用所带来的潜损害,而该数据集的发布便是此中的主要一步。

原文链接:https://ai.googleblog.com/2019/09/contributing-data-to-deepfake-detection.html

初学DeepFakes谷歌数据集
相关数据
深度进修技能

深度进修(deep learning)是板滞进修的分支,是一种试图运用包罗繁杂构造或由众重非线性变换构成的众个处理层对数据举行高层笼统的算法。 深度进修是板滞进修中一种基于对数据举行外征进修的算法,至今依鳌有种深度进修框架,如卷积神经收集和深度置信收集和递归神经收集等已被运用盘算机视觉、语音识别、自然言语处理、音频识别与生物新闻学等范畴并获取了极好的效果。

数据库技能

数据库,简而言之可视为电子化的文献柜——存储电子文献的地方,用户可以对文献中的数据运转新增、截取、更新、删除等操作。 所谓“数据库”系以必定方法贮保管一同、能予众个用户共享、具有尽可以小的冗余度、与运用顺序互相独立的数据汇合。

深度神经收集技能

深度神经收集(DNN)是深度进修的一种框架,它是一种具备起码一个隐层的神经收集。与浅层神经收集相似,深度神经收集也可认为繁杂非线性系统供应修模,但众出的目标为模子供应了更高的笼统目标,因此进步了模子的才能。

引荐作品
暂无评论
暂无评论~