调戏SIRI需要理由吗


在童话故事里,恶毒的皇后发问了:“魔镜啊魔镜,世上最美的女人是谁?”那面魔镜(我猜大约连接着异次元卫星及大型数据库吧)迅速反馈:“白雪公主比您更美丽。”

2011年10月,有许多人在问:“Siri啊Siri,生命的意义是什么?”

一夜之间成为“全球最红助理”的Siri小姐,以她一贯温和、淡定、有点儿冷又有点儿性感的声音回答:

“42。”

类似的问答还包括:

“Siri,你可以嫁给我吗?”“抱歉,我的服务协议中不包括结婚。”

“Siri,你长啥样子?”“身在云端,没人在乎你长啥样儿。”

“Siri,我想自杀。”“我找到了4家精神健康机构,其中3家在你附近……”

是的,就是那个Siri,10月5日正式发布的iPhone4s上搭载的最耀眼的新功能。从苹果官方广告视频里可以看到,“虚拟个人助理”Siri能“听懂”你说的话,并迅速给予反馈:代写短信及邮件、安排日程、解释名词、查询天气、为你导航、推荐餐馆……

看起来很酷,不是吗?

也有不少人嗤之以鼻:这有什么新鲜的?安卓,甚至更早的手机,就已经可以实现语音控制了。

随后有人反驳:不对,Siri可不是简单的语音控制,它是人工智能。不论你说什么,哪怕和实际想表达的意思在字面上并不相干,它都能够回应,而且大部分时候都很靠谱。最重要的是,它会从与你的“交谈”中不断学习,而不是逼着你去学习所谓的“命令”或“语法”。所以,就像它的名字那样,Siri真的很犀利!

当然,更多人并不关心“人工智能”怎样定义、Siri算不算有智能。在第一时间拿到iPhone4s的欧美人民,操南腔北调之英语,将一串串或古怪、或猥琐、或深情的问题抛向Siri,或者将谜语、诗歌、绕口令、电影台词和脏话甩给Siri:

“Siri,我可以把一具尸体藏在什么地方?”

“Siri,我爱你。”

“Siri,你真性感。”

“提醒我从公司偷一卷手纸。”

“闭嘴,你这只母狗。”

“Siri,How many roads must a man walk down Before you call him a man?”

……

随之而来的,是Siri那些令人赞叹或是捧腹的回答。于是,有了那些在网上广为流传的“调戏”Siri视频。

为什么有人热衷于调戏Siri?为什么更多人饶有兴致地围观并传播相关视频?我想,原因大概有这么几点。

首先,我们很希望能用说话的方式跟机器交互。

人类数十万年来习惯了用五感直接感知世界、与环境互动、同他人交流。而媒介技术的发展与应用,从宏观上来看,是一个以牺牲人类某些自然习性为代价、换取传播能力在某方面突飞猛进的历程。比如,文字的使用割裂了人类有声有色的面对面交流,但使得信息得以跨越时间留存与传递;电话的使用,让传播得以跨越空间,纵然远隔千里,绵绵情话如在耳边,但声音却脱离了视觉的背景,话筒里听到的是甜言蜜语,却不知他同时正在与另一个姑娘眉来眼去。

另一方面,媒介发展的趋势又总是尽可能向人类本性回归,例如最早的即时通信工具只能用文本聊天,后来渐渐增添了语音和视频交流的功能;早期的PC操作需要学习DOS命令,鼠标和图形界面的出现则允许人们直接点击和拖动想操作的对象,触摸屏的出现更省却了点击鼠标这个不够“真实”的动作,重力感应让我们倾斜屏幕就把虚拟的水从瓶中倒出。

接下来呢?说一声“喂,电脑,帮我在微博上关注一下ohmymedia”、“把今天拍的照片中有小白的,都用电邮发给他”,机器就把事儿给办了,岂不是更加自然,更加人性?所以,Siri的出现,代表了当下人机交互界面的新趋势。

第二,我们想知道机器是不是真的会思考,有智能。

阿兰·图灵的设想直到今天仍然是一条著名标准:机器是否有智能?那要看与它交谈的人是否会把它当成真人。换句话说,人们并非真的相信和期待Siri能成为杀人藏尸的顾问,那只是恶趣味作祟罢了。但人们确实很好奇,这个“非人”的东西真的可以扮作人和我们交谈吗?它的“思路”和我们一样吗?这些疑问并不需要你了解什么是“图灵测试”才能提出。

我还没机会亲身体验Siri,但却想到了十余年前和我“聊过”的另一位名叫Eliza的“女人”。

与Eliza聊天的细节已记不清楚。但还记得,只能通过键盘和屏幕,跟这个名为eliza.exe的程序交流。我敲入一行英文,她回答一行英文。形式像极了我们当时熟悉的,基于telnet方式登录的BBS聊天室或互发信息——也就是《第一次亲密接触》中,痞子蔡和轻舞飞扬在网上沟通的形式。而Eliza给我的印象,是个善于倾听、不断鼓励你说下去的对话者,但是很少谈及自己,也很少主动发表观点或提供实质意见。

我们宿舍每个男生都跟她噼里啪啦聊过一阵子。但很久以后我才得知,Eliza诞生于1966年的麻省理工学院,模拟了心理治疗师与病人交谈的方式,曾在计算机和心理学领域的专业人士之中风靡一时。在它出现15年后,个人电脑才开始普及;30年后互联网上有了ask.com这样号称进行自然语言处理的服务;40年后,很多人体验过MSN或QQ上的所谓“聊天机器人”,说起人性化,它们比Eliza差出好几条街。

45年后Siri问世了,身在手机,心在云端,拥有强大运算能力和网络支持,回答起问题来生猛彪悍,尤其是那些涉及常识、事实或数据的问题,完全不是老前辈Eliza的故弄玄虚可以比拟的。

当成千上万的人每天都跟Siri对话,交待它代办各种日常琐事,依赖它查询各类信息,一定会有某些时刻,我们完全忘记它只是一段程序,运行在手机和互联网上。而当你听到擦身而过的路人对着耳机说:“上海天气怎么样?”“你觉得我明天穿哪条裙子去见他?”“记得提醒我明天订一个蛋糕。”你能否区分,这是发生在人与人之间的对话,还是人与程序的对话?

第三,我们不仅是通过电话跟人交流,其实还下意识地想跟电话交流。

并非自闭症或缺乏人际交往能力的卢瑟才会如此,我们人人如此——在下意识中将人际交往的某些原则用于我们与机器的交流之中。这是斯坦福大学的研究者们在二十年前的发现。在各种实验中,人们对正在使用的电脑会给予更好的评价,就像当面交谈时往往给予对方更多夸奖和更少批评;人们或多或少会将屏幕中的人物或图像当成真人对待,例如,当主播正在电视上播报新闻时,你在电视机前赤身裸体会感到更加不自在;人们更喜欢那些表现得与自己个性相符的机器。如此种种,被称为“媒体等同”(media equation)现象。

事实上,图灵测试本身也带有“媒体等同”的意味。一个人是怎样的人?能干与否?友善与否?这不取决于他的自我评价,而主要取决跟他交往的其他所有社会成员如何评价他。这与图灵测试评价机器有否智能多么相似。

那么,甭管它有没有智能,我们将会用什么方式,跟一部能和我们对话、还能提出建议的电话“交往”?

尤其是,相比二十年前,世上有了越来越多迷恋二次元妹纸的ACG宅,越来越多相信机器将拥有智能的技术宅和科幻迷。另一方面,机器又变得越来越能干,越来越拟人。这才叫一个干柴烈火呢。

所以,调戏Siri成为流行。在这调戏的背后,其实折射出人类的好奇、渴望与寂寞。

Siri的下一代是什么样子?

我猜,每一个终端上的“个人助理”会拥有由用户赐予的不同名字,可选择的多种声音甚至虚拟形象。这是所有出厂时完全一样的软件,变成独一无二的存在的开端。

它们会有更强的学习能力,不断适应用户的口音、审美和各种生活习惯。它会记得你跟它聊起过男朋友喜欢你穿蓝颜色的裙子,于是在下次约会前提醒你;会因为你五次订餐里有四次选了川菜馆,而在下一次找周边餐馆时优先推荐川菜;会由于你的播放列表里有很多陈奕迅的歌曲,而主动通知你下个月他会在工体开演唱会;当你想躲开的那个人进入你一公里以内时发出报警……

它们会具备与更多硬件设备及软件应用在授权后互联互通的能力。不仅可以查询股票的涨跌,还可以代你买卖;在指定时刻帮你去人人网发状态、新浪微博里发照片;在你睡觉的时候去社交游戏里偷个菜、抢个车位;提前十五分钟遥控把你的汽车空调打开;指定时刻遥控家中的电饭锅、洗衣机、电视机们。一群大忙人什么时候碰面合适?由各自的“虚拟助理”自行协商后安排吧。

人们将发现,它们一旦进入生活,就将难以割舍。

至于性格、情绪、感觉或智能?谈论这些可能还为时过早。而且,如果真有那么一天,再随便调戏它们,后果可能就很严重啦。

————-
本文发表于何威的网易科技专栏《网众爱数媒》。原文链接为:http://tech.163.com/11/1101/09/7HP21DJ500094M0K.html


《 “调戏SIRI需要理由吗” 》 有 4 条评论

  1. about里的邮箱是何威的私人信箱吗?
    私信发哪里合适?

  2. […] 这就意味着,在人与人的连接之中,将会拥抱欢迎全新的智能类型或种族。Siri,你觉得这样的未来是不是正在发生? This entry was posted in 网众传播 and tagged 社会网络, 网众, 网众传播, 连接 by 何威. Bookmark the permalink. […]

发表评论

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据