大数据文摘出品作者:刘俊寰、Bing最近,美国前国家安全顾问约翰‧博尔顿出版了他的新书The Room Where It Happened,在书中,博尔顿写道,特朗普很容易受威权式领导人影响,经常被他自己的顾问鄙视。面对这项“指责”,特朗普坐不住了,在接受《华尔街日报》采访时,特朗普直接说,“博尔顿是个骗子”,“白宫每个人都讨厌他”。特朗普的这一说法尚未得到博尔顿发言人的回应。特朗普这类迷惑言论对全世界民众来说也是见怪不怪了,不过,不知道你有没有想过,如果用AI识别这些特朗普的“川言川语”,会是什么情形?别急,我们先回到三年前,当时特朗普正在针对第二次世界大战发表演讲,那时特朗普式英语才面世不久,及其狂野的遣词造句、随意切换的时态和主语、扭曲的语法、前后冲突的连词、满天飞的介词,从句套从句、括号套括号,还多少让人有些不适应。可能美国观众听了也蒙蔽一片。不过也正是在那个时候,Bill Frischling就开始让他的AI机器人Margaret去转录特朗普讲话中一段127字的内容,当特朗普第四次提到“获胜”时,Margaret崩溃了。Frischling回忆说:“它仍然试图像处理普通英语那样给这段话添加标点符号,而不是处理‘特朗普式英语’。”科罗拉多大学人工智能与机器人技术实验室的负责人Frischling是一个自学成才的程序员,疫情期间他在弗吉尼亚州的家中工作。鉴于此,Margaret不得不重新设定特朗普模式,从头开始学习“川言川语”,于是Frischling聘请了一位有自动标点博士学位的计算机专家来教Margaret“忘记”正常语法,转而学习分析特朗普的讲话。
特朗普被分析也不是最近才出来的。早在2016年,一位麻省理工学院的研究生Bradley Hayes就创造了一个发推特的机器人@DeepDrumpf,这个机器人能用混乱的语言来模仿特朗普在社交媒体中的发言,比如“我们必须制造美国。他们做不到。因为我要为这个国家付出代价”。由于在一条推文中,该账号提到将释放暴力恐怖分子来威胁前总统奥巴马,Hayes不得不屏蔽一条推文。不过他表示,如果有更多的时间、更好的数据,这个机器人将会变得更强大。Hayes在接受采访时坦言道,特朗普的语言比其他人更简单,因此在建模上,特朗普的模型是最容易建立起来的。如果能与某一天之内所有人与特朗普谈话过的人进行交流,那么你很有可能会建立一个更加准确的模型,更好地预测他将要谈论的内容和他的立场。Hayes表示,他们只让AI学习了几个小时的特朗普演讲内容,然后随机选择字母作为句子的开头,逐个字母进行构建。比如,如果AI首先选择了字母“M”,它可能会在其后马上跟上字母“A”,然后“K”,直到整个单词和句子能够阐明特朗普最喜欢的口号,“再次使美国变得伟大”(Make America Great Again)。