随着科技的发展,人工智能抢饭碗也抢得相当明显。这不,人工智能的触角已经伸到读唇术里来了。谷歌最近与英国牛津大学合作开发一套读唇软件,通过让DeepMind收看数千小时BBC的电视节目来开启这一技能点。可怕的是,DeepMind不仅学会了,还比读唇专家要做得好!
读唇术可以说是一种独特的技艺,学习起来非常困难,它对于语言语境和知识理解要求非常高,为了让DeepMind更好的学习唇语,为它准备了BBC一系列的电视节目,包括Newsnight、BBC Breakfast、Question Time 等,所有视频资料加起来约有 11.8 万句话。DeepMind经过了约5000小时的训练,就迅速掌握了读唇术的能力。
你或许会想AI也要进过几千小时的训练才能掌握这一技能,看来也不是很厉害嘛。但是你要知道在同样随机抽取的200个视频片段的测试中,AI读唇系统的准确率达到46.8%,而经过专业训练的人类读唇专家,准确率也仅为12.4%。DeepMind团队表示这套系统除了可以帮助听力损伤人群外,还能应用于其他方面,比如注释电影或者利用唇部动作与Siri这样的数字助理进行沟通等。
不过,当我看到这个消息后,我还是会想,AI读唇本领这么高,到时候会被用来干什么呢?说不定有一天会默默的监视着人类说话,都不用听声音,看看嘴型就知道你在说什么了。我的妈呀,想想就觉得好害怕。但是专家也表示,DeepMind的读唇软件并不会被用来做监听这件事,毕竟与其如此大动干戈,不如直接用麦克风监听来得更为简单有效。其实,我现在很想看看DeepMind来深度学习一下中文甚至是地方方言的读唇术,不知道会不会崩溃?!
要发表评论,您必须先登录。
Your company is very impressive .