对于在硬件中加入AI加速的宣传,这段时间以来大家应该都已经被手机厂商洗脑,NPU每秒多少多少万亿次的计算的数字一下就给人一种远超人脑的感觉,但这样的数字却往往不容易和手机日常实际使用体验水平挂钩。人们只是略有了解,知道跟生物识别,AR计算机视觉有点关系,然而除人脸识别之外,一下子还找不出第二个能脱口而出的应用案例。
英特尔大概觉得这样是不行的,它决定站出来阐述软件算法侧上,自己是如何让AI在边缘计算一端,尤其是自己的传统强项PC这块实现AI应用升格,为产业乃至社会带来更大的价值的。顺便,还能打破一下自己“梆硬”的刻板印象。于是,位于上海紫竹科技园区的英特尔亚太研发中心今天为好奇的目光准备了一份AI体验套餐。
过去AI一直都只是数据中心,大型服务器集群的专利,但是这种把计算置于云端的方案固然也有它的短处:依赖网络连接,传输延迟无法避免,数据存储云端的隐私担忧,当然还有云端计算、存储和传输数据消耗了多方面的成本。不过随着技术成熟,算法进化,在边缘的低功耗设备上部署AI也成为了可能。
英特尔自己给终端侧部署AI应用分了三个类别,一种是需要长时间运行,对功耗敏感的应用,如语音助手实时唤醒,语音降噪消噪,健康传感器监测等等;另一种是偶发性需要打开,对响应速度敏感的应用,像我们熟悉的人脸识别指纹识别,还有照片智能后处理,语法检查都属于这种;最后就是持续运行,需要密集算力的应用,比如视频增强,分辨率升格,人物背景抠图实时替换之类。
针对这些不同类别的应用需求,英特尔则能在全平台上提供完整覆盖,硬件方面它有自己的CPU,核显GPU,还有VPU、GNA加速器和FPGA等各种形式;软件也有开源的OpenVINO、Math Kernel Library等用于AI计算的开发接口,并且兼容主流人工智能应用API如TensorFlow,Caffe等,对终端侧AI应用的多样性需求能做出较好应对。
为了显示英特尔的这些AI软硬件整合工具在实际应用环境中颇有成效,今天在紫竹还有许多合作伙伴到场展示它们的成果。印象较令人深刻的有网易下属雷火游戏事业群,此前名声大噪的《逆水寒》,还有近期制作的《战意》,都在游戏里和英特尔合作,加入了针对多核心CPU、以及向量指令的优化,提升2.6倍的执行效率;而通常都被游戏玩家打入冷宫的核显,也获得了2.4倍的性能提升。虽然我没有看懂现场用华硕灵耀X2 Pro的C面副屏演奏古筝拨弦跟AI有什么直接关联,但是也觉得好高大上啊。
另一个名声很大的合作伙伴叫欢聚时代,如果觉得这个名字陌生不要紧,它旗下的YY语音,还有虎牙直播你很可能以前用过。欢聚时代给出的案例是语音通话降噪、虚拟视频导播,以及语音和视频内容的AI全盘审核。其中最厉害的是AI审核,一个视频或直播会经过许多个涉及敏感内容的检测算法模型,如果被判别为违规,AI就会把这个内容给自动封禁掉,从而大大减少人工审核的工作量,为净化网络环境作出积极贡献。
除这两家外,相芯科技基于计算机视觉的人物数字形象建模技术,更给我们一种熟悉的感觉,似乎在苹果的发布会上见过这个——但看上去精细度和准确性都略胜一筹,毕竟它是在计算能力更加优秀的硬件平台执行的,更不用说还使用了OpenVINO这种针对英特尔硬件做过优化的API呢。
此外,英特尔自己也准备了非常多AI的参考用例,比如说在图形这块上,最近比较热门的分辨率增强,让AI为低分辨率图像补充细节而得到更高清的画面;还有基于新Web开发技术实际应用如游戏画面串流(可理解为本地云游戏),会使用AI预判网络状况进行画面渲染补偿;以及在直播游戏时,通过AI分析编码的推流的视频画面,把自己的集锦画面实时录制下来(类似于NVIDIA ShadowPlay)等等,这些都在活动现场进行了展示。而借助最新的Ice Lake微架构,在英特尔硬件平台上实现这些应用的开销也前所未有的低。
为了让更多开发方加入到英特尔的AI赋能行动中来,英特尔也准备了大量用于不同规模开发工程的工具包,如Parallel Studio XE,用统一开发平台管理并行的代码版本,实现对各类设备的适配,同捆的英特尔编译器也能发挥出最新架构处理器的全部实力,吃到所有新指令集带来的福利。
而对于前端的开发人员,WebNN、WebRTC、WebGPU等API,以及最近成为新潮流的渐进式Web应用英特尔也都有相应的工具集予以支持。这里面各种小程序算是代表,英特尔则通过一本白皮书向世界展示了这种新式应用在中国发展得如火如荼,前面提到的一些演示项目,也在证明它们在Web 3.0时代能大有作为。
英特尔表示,这样的幕后支持其实从过去到现在它一直都在做,只不过相比自己的明星硬件产品,软件所作出的重要贡献没有刻意强调而已。随着AI算法在这个时代的地位日益拔高,不难理解为什么英特尔也要提高软件端努力的可视度,博取更多信任。毕竟双管齐下,”1+1>2″等道理,普通人都能懂。