随着人工智能的发展,不会调教AI的其他工种都有着被AI取代的风险,为了让宝宝们赢在起跑线,玩具熊、玩具狗、玩具人都推出了“人工智能”版本,成为拥有语音对话功能的高等机器生物。然而,且不说这些玩具究竟有多智能,看似傻乎乎的娃娃们,其实埋藏着深深的隐私完全问题。
近日,电子隐私信息中心、消费者联盟、电子民主中心等多个非营利性组织向美国联邦贸易管理委员会上诉,多款儿童语音玩具未经同意或提示,收集语音数据。通过蓝牙和用户手机app,将语音数据转成文字传输到谷歌或者Nuance的服务器上。由于法律规定未成年的隐私数据信息采集必须获得家长的同意,并且监护人需拥有检查和删除信息的权利,这些看似无害的语音采集,实为极其严重的侵权。
其实,隐私安全问题之所以可怕,就是因为网络时代的信息收集无所不在。在人们开始担心玩具在传输小主人的语音信息之前,段子手或者爸妈的朋友圈早就对网络公司们收集追踪用户活动状态多年的恶性诸多不满。而当听说那些逐渐成为家电潮流的真正的AI助手们,居然无时无刻不在监听的时候,对人工智能的恐惧感更是与日俱增。
对于AI语音助手来说,收集人的语音、分析对话、采集数据是它们得以正常工作的基础,但是不明真相的群众在没有足够的知情权之前,听说家里的AI助理其实可能无时无刻不在偷听,的确有种“小音响其实是黑客帝国派来的卧底”既视感。
Amazon Echo和Google Home是目前北美市场上最受欢迎的两款语音助理,每当主人喊出Alexa或者google的大名,它们就会随即记录下人类的语音,并将这些语音文件传输到远程的服务器中,通过AI“大脑”的处理,给出相应的回答。同时,人类的回答会自动储存在个人的账户下面。
对应被记录下来的语音,系统也会自动记录AI的回答,从一次次的对比中,逐渐掌握主人的习惯、不同的口音等。对于家庭语音助手来说,个人化的专属体验是她希望达成的未来,通过对一个账号的行为分析,更好地为一个家庭提供个性化的私人服务,使得记录个人的历史变得十分必要。
由于需要远程传输处理,语音助理必须在有Wifi的环境下才能工作,同时为了防止干扰语音阻碍语音助理的学习,只有在说出唤醒词,比如Alexa或者Google的名字时,才会处于信息传输被激活的状态。
为了能够让语音助理准确捕捉到唤醒词,在被唤醒前,它们依旧处于“监听”状态,只是此时语音助理听到的片段,都不会被传到处理器上记录下来,只是时时处于备战状态,等待唤醒词的激活。
其实,它的原理和一些照相机的连拍模式比较相似,相机会在完全按下快门连拍之前,先捕捉几张画面,以保证不会因为按下快门的手指动作迟缓而漏掉画面。对于语音助理来说,为了保证它随时处于不用按键就能够通过语音操作的便捷性,就必须在激活前一直处在你说我听的模式。
如果强行通过静音键关掉麦克风,那么语音助理基本上就处在“罢工状态”,只能每次要用的时候,关掉静音键,再重新捕捉关键词使用,很大程度上,就失去了便捷的语音启动的意义。语音助手也会每次在开启的时候提醒你,要打开静音键才能享受完全的服务。
虽然,科技公司们的确可以追溯用户的操作、储存记录,但是,对于特别在意隐私的人来说,这些账户大部分还是允许用户自行删除记录的。
比如,如果对Alexa说了太多不可描述的黑话,用户有可以直接在app的设置中找到这些被记录下来的语音历史。同样的谷歌账号也提供包括了谷歌搜索、YouTube视频记录、安卓App记录,Google Home的语音记录等一系列账号历史操作。不过虽然人肉删除了记录,但后台服务器上的资料是否也会被一并删除,就不得而知了。
每个程序都有bug,每种系统都有被黑的可能,但亚马逊和谷歌的防护还是很到位的,从家里的语音助理到数据中心的路径必然是加密的,即使家庭的网络遭到破解,Amazon Echo和Google Home直接被侵入的可能性也极低。整个语音助理最容易出问题的环节,其实是账号密码被破解,导致操作隐私被暴露。
但是,不是每一种AI都可以删掉黑历史的,以Siri为例,她在将所有的对话送回云端之后,一方面,不向用户提供查阅对话历史的功能,同时,系统会在六个月之后,将对话与账户之间的关系脱钩,只是将语音资料作为数据库的一份子。
苹果在6月的WWDC上发布了Differential Privacy(差分隐私)算法,加入虚拟数据,让人几乎无法辨别出数据的来源和个人信息。虽然,这种算法大规模使用的可行性还未可知,但是,隐私安全的保护,的确是市场人工智能面临的重要问题之一。
显然,并不是每一个从业者都认识到了这个问题,类似“智能”娃娃这样没有获得允许,就随意收集并出卖用户隐私的行为,让人怀疑这样的娃娃,类似的AI功能和产品,是不是还存在着更多的安全漏洞。