内页通栏广告图
首页 > 官网 > 新闻中心 > 行业新闻
第一个把AI芯片带进手机的华为今天又要放大招了!

继8月9日在开发者大会上推出鸿蒙操作系统后,华为将于23日下午召开Ascend 910 AI处理器和MindSpore计算框架发布会。



看似高深的人工智能(AI)技术,其实已经“润物细无声”地深入大众生活,仅你手中一部华为Mate20手机,就可以实现人脸识别、物体识别、物体检测、图像分割、智能翻译等AI功能。这背后,依仗的是手机算力的大幅提升。其中小小一枚一分钱硬币大小的华为麒麟980手机芯片,就集成了69亿个晶体管,具备每秒钟完成万亿次级运算的能力。你可能想不到,如今自己手中任何普通智能手机的算力,甚至比美国航空航天局1969年登月计划中最先进计算机还高出几百上千万倍乃至更高。


数据、算力和算法,驱动着人工智能的第三次浪潮。其中,算力正是重要的基石。手机端的芯片算力几年间已经发展到如此惊人,用于云端的AI芯片需要处理自动驾驶等复杂场景的海量数据,又需要多强大的算力呢?OpenAI近期发布的研究显示,仅2012年以来,人们对于算力的需求增长六年就超过 30万倍,平均每年增长10倍,远远超过了摩尔定律的发展速度,因为深度学习神经网络需要对张量(可以简化理解为矩阵)进行大规模并行计算,颠覆了传统的浮点计算,对算力的需求正在出现指数级的爆炸式增长。例如原来1个时钟单元只能计算1次浮点计算,现在可以通过新的算子同时对N*N的矩阵计算,如果N=10,那就是同时计算了100次,计算次数较原来增长了100倍,新算子带来了对新芯片的强大算力诉求。


dd2be53e6a4fb6a8a2bb6ca4254f9f55.png


如果说2019年最受舆论关注的ICT和智能终端厂商是华为,那么其去年10月以来一直“犹抱琵琶半遮面”的业界算力最高AI处理器——Ascend(昇腾)910芯片,则是人工智能圈本年度最期待的AI芯片。


面对 AI 算力需求的爆发式增长,这几年华为在做些什么?


| 率先将专用NPU AI芯片引入手机


人工智能发展中,我国在数据方面具备优势,但在算法与算力方面仍待发展,尤其是芯片与硬件代表的算力方面。算法科学家、工程师和应用厂商面临着AI算力稀缺和昂贵问题,大大抬高了算法研究和创新门槛,阻碍着AI的全行业普及和应用。


正因如此,尽管AI芯片在金钱、时间和人力各方面的研发成本高昂,但在AI商业赛道上,各厂商都在打造各自的芯片体系,其中多为聚焦于某一应用或某一场景的互联网和芯片厂商,也不乏ICT大厂。国内厂商中,华为在AI芯片的布局堪称“经典”。


在AlphaGo一战成名之前,绝大多国人就已经完成了从功能手机到第一代智能手机的换代,不断增长的手机系统自带功能特性和第三方应用,刷新着用户的体验。无论是AI功能还是场景化AI服务,都需要手机完成复杂深度学习算法模型运算,计算密集复杂,计算需求巨大,实时性非常挑战;同时运行环境受限,功耗、内存、存储空间非常挑战,因此强大的算力是必须的。


如何将人工智能引入到手机终端,是彼时苹果、华为在内的手机厂商都在努力攻破的问题。


2017年9月的柏林电子消费展上,华为正式向发布全球首款移动端AI芯片麒麟970,一个月后发布了搭载麒麟970的旗舰手机Mate 10。麒麟970是全球首款内置了独立神经网络处理单元(即NPU)的人工智能芯片。华为第一个将NPU引入手机芯片,在此之后,苹果、三星等厂商纷纷跟进,到今天,AI手机已成为众多手机厂商的旗舰配置。麒麟970内置NPU性能大幅优于CPU、GPU和DSP这些通用计算单元。同时相比CPU获得了约50倍能效和25倍性能优势。这意味着,麒麟970芯片可以用更少的能耗更快地完成AI计算任务。 


137e0bfd73fe9a4b1b5a77a65c13c10a.png


在NPU的加持下,手机功能也会变得更加强大。例如使用语音功能时,AI会对当前语境和内容进行细致的分析,从而实现高准确率的识别体验,将语音识别的成功率提升到更高的级别。这样一来,以智能助手为主语音功能就得以替代传统的手工输入,扮演更重要的角色,或许以后大街上见不到边玩边走“低头族”,而是更多人对着手机“自言自语”了。


在用户十分关心的拍照方面,AI的出现同样为喜欢手机摄影的用户带来不少福利。麒麟970搭载双通道ISP图像信号处理器,在动态影像捕捉和低光拍照上有很大的提升。双摄镜头+双ISP软硬件优化、再配合人工智能的计算机视觉分析,便能自动分析画面内的物体,并选择当前最佳的拍照模式,甚至可以进行物体追踪对焦和预测用户拍照时机,提供前所未有的拍照体验。


麒麟970的推出,成为传统智能手机和未来AI手机的重要分水岭,AI手机的发展也从单纯的算法优化进入了硬件能力的真·人工智能比拼阶段。


2018年8月,同样是在柏林电子消费展上,华为又发布了全球首款7nm人工智能手机芯片——麒麟980。


1纳米等于1毫微米(即十亿分之一米),约为10个原子的长度。一根头发丝直径约为0.1毫米,而7nm相当于头发丝的万分之一,在不到1平方厘米的麒麟980内部有高达69亿个晶体管。从芯片工艺上看,7nm相当于70个原子直径,逼近了硅基半导体工艺的物理极限,麒麟980实现了在针尖上翩翩起舞。华为消费者业务CEO余承东表示,麒麟980的7nm工艺是由超过1000多名半导体工程师组成的团队历时3年时间、经历超过5000多次的工程验证精心打磨的成果。


相对于麒麟970来说,麒麟980全面升级。以图像识别速度为例,麒麟970可达到约2005张每分钟,而麒麟980在移动端双NPU强大算力加持下,实现每分钟图像识别4500张,识别速度相比上一代提升120%,远高于业界同期水平。随之而来的,是人脸识别、语音助手、AI拍照,及各类智能美拍P图等APP在手机上的全面升级。


同时,面对更海量的用户,麒麟710让更多消费者享受到人工智能的乐趣。到了2019年,华为推出麒麟810芯片,这是华为第二款7nm工艺的手机芯片,也是华为首款自研达芬奇架构NPU的手机芯片,这意味着更多海量用户享受到专用NPU带来的旗舰级的AI体验。


至此,华为完成第一轮在手机端的AI芯片布局(麒麟970、麒麟980、麒麟710、麒麟810),手机产业也正式走入了AI时代。


| “达芬奇”构建端边云算力大爆发基础


AI赛道比拼,影响的绝不仅是手机端,边缘侧、云侧的硬件算力、数据算法等元素无一不处于白热化的竞赛之中,几乎每天都有新的论文、新的产品问世。


如果说华为在芯片上的持续投入属“居安思危”,显示的是其远见与决心。那么,华为在人工智能领域的野心则更为宏大,这一次,华为不仅要覆盖 云、边、端各种场景,还要形成从应用使能到系统到芯片的闭环。


2018年10月,华为在其全联接大会上首次提出全栈全场景 AI 解决方案,华为轮值董事长徐直军表示,“全场景,是指包括公有云、私有云、各种边缘计算、物联网行业终端以及消费类终端等部署环境。全栈是技术功能视角,是指包括芯片、芯片使能、训练和推理框架和应用使能在内的全堆栈方案。”


其中,全栈AI的基础,是一系列基于统一的达芬奇架构的AI芯片——从IoT到终端(如麒麟芯片的NPU)、到边缘侧再到云。在会上,徐直军还宣布,“外界一直在传华为在开发AI芯片,我要告诉大家,这是事实,我们今天发布两颗AI芯片:华为昇腾(Ascend)910和310。”此言一出,立刻在国内外人工智能圈子惊起波澜——华为终于祭出了大招。


75ed6a7851d66aa424f181d973cf5c9d.png


达芬奇架构针对AI运算特征而设计,以高性能3D Cube计算引擎为基础,实现了算力和能效的大幅提升。从云、边缘、端独立的和协同的AI实际需求出发,从极致低功耗,到极致大算力的AI场景,为云、边、端之间的算法协同、迁移、部署、升级和运维,提供了统一架构底层核心支撑,大大降低了人工智能算法开发和迭代的门槛,降低企业人工智能部署和商用成本。


目前,昇腾(Ascend)芯片家族中的昇腾310已经落地商用。基于昇腾310,华为陆续发布了包括Atlas 200、Atlas 300、Atlas 500、Atlas 800等产品,已被广泛应用于安防、金融、医疗、交通、电力、汽车等行业,涉及摄像机、无人机、机器人、智能小站、MDC(Mobile Data Center)等产品形态。并提供基于昇腾310的AI云服务,比如华为云图像分析类服务、OCR服务、视频智能分析服务等超过50款API已经基于昇腾310,日均调用量超过1亿次。另有大量企业客户正在借助昇腾310芯片自己开发算法服务。

13f9270f748a6def636aec3701677f98.png

随着昇腾310相关产品大规模上市,外界对昇腾910的期待更盛。毕竟,去年10月,徐直军在会上公布,“昇腾910是计算密度最大的单芯片,最大功耗为350W,半精度为(FP 16)256 Tera FLOPS,比英伟达 V100的125 Tera FLOPS还要高出近1倍。若集齐1024个昇腾910,将会出现迄今为止全球最大的AI计算集群,性能也将达到256个P,不管多复杂的模型都能轻松训练。”简单来说就是,昇腾910是业界算力最高的AI处理器,相同功耗情况下,它的算力是业界芯片的2倍,最强CPU的50倍。


| 全栈全场景AI逐步落地


除了昇腾系列芯片外,华为提出的全栈AI,还包括支持端、边、云独立的和协同的统一训练和推理框架MindSpore,芯片算子库和高度自动化算子开发工具——CANN,提供全流程服务(ModelArts)、分层API和预集成方案的应用使能。


其中,在2019年已经落地实现商用的,除了昇腾310,还有其面向用户和开发者的门户——华为云ModelArts。作为一站式AI开发平台,ModelArts可以提供海量数据预处理及半自动化标注、大规模分布式训练、自动化模型生成,及端-边-云模型按需部署能力,帮助用户快速创建和部署模型,管理全周期 AI 工作流。2019年5月,在斯坦福大学DAWNBench榜单,华为云ModelArts获得图像识别训练第一,ImageNet-1k数据集上用128块V100 GPU训练ResNet-50模型仅需要2分43秒,而在2017年10月,斯坦福DAWN的训练时间是13天10小时41分钟。斯坦福大学DAWNBench榜单几乎聚集了国内外领先AI厂商,ModelArts如果由强大的昇腾910加持,是否能进一步刷新世界纪录?若再采用1024个昇腾910的全球最大AI计算集群,又将出现什么样的成绩?


| 华为又要出大招了!


继8月9日在开发者大会上推出鸿蒙操作系统后,华为将于23日下午召开Ascend 910 AI处理器和MindSpore计算框架发布会。


据了解,华为将在会上宣布,采用达芬奇架构的又一款“巨无霸”——AI芯片Ascend 910正式商用,与之配套的新一代AI开源计算框架MindSpore也将同时亮相。


华为昇腾910有多牛?


作为华为“达芬奇项目”的重磅成果,用华为副董事长、轮值董事长徐直军的话来说,华为昇腾910是目前单芯片计算密度最大的芯片,计算力远超谷歌及英伟达。


华为不久前发布的“面向2025十大趋势”预测,智能AI正在加速而来,到2025年,智能技术将渗透到每个人、每个家庭、每个组织。


那么,华为昇腾910的商用对智能AI的加速到来有什么意义呢?


去年10月,华为发布华为AI战略与全栈全场景AI解决方案,正式宣布将携手各行各业把握新机遇,打造无所不及的智能,构建万物互联的智能世界。华为昇腾910就是在上述大会上首次亮相的。


发布会上华为共发布了两款Ascend(昇腾)系列AI芯片,即Ascend 910(华为昇腾910)和Ascend 310(华为昇腾310)。


作为华为AI解决方案的底层芯片,也是方案最核心的硬件部分,这两款芯片能够大大加速AI在平安城市、互联网、金融、运营商、交通、电力等各行业的应用。


目前,最大功耗仅8W的极致高效计算低功耗AI芯片华为昇腾310已经商用量产,而华为昇腾910将在23日下午被宣布正式上市商用。


除此之外,华为还将在会上公布支持端、边、云独立和协同的统一训练和推理的MindSpore计算框架的部分技术参数,降低AI的开发和使用门槛,释放AI生产力,最大程度发挥AI芯片算力潜力,以便共同打造AI生态,推动AI产业落地。


“华为致力通过技术,帮助企业和用户跨越AI的鸿沟,让世界、让每个人,都能体验AI带来的改变,让AI聚焦于服务人类社会。本次发布会上,我们将推出业界迄今为止性能最快的AI处理器及全场景的AI计算框架,用更快的速度、更低的功耗、以及更自由的使用角度,支持人类对未来的创新与探索。”华为称。


工信部此前发布《促进新一代人工智能产业发展三年行动计划(2018-2010)》,力争到2020年,一系列人工智能标志性产品取得重要突破,在若干重点领域形成国际竞争优势,人工智能和实体经济融合进一步深化,产业发展环境进一步优化。


在华为AI芯片的推动下,人工智能产业有望迎来快速发展。从端侧到边缘侧再到云侧,从底层硬件到深度学习框架再到上层应用使能,华为的全栈全场景AI战略正在逐步落地。在一年前关于AI的豪言中,哪些是华为下一步将要向市场兑现的呢?我们拭目以待。


半导体展会在在半导体行业的发展中扮演着非常重要的角色。中国发展战略性新兴产业的决定,《中国制造2025》中将集成电路放在发展新一代信息技术产业的首位。半导体、集成电路、“芯”、北斗产业等在升级转型中脱颖而出。中国半导体产业的发展黄金时期的到来,半导体产业面临着前所未有的发展机遇,只有抓住这个时间窗口才能重新定义全球市场格局。全球半导体产业博览会为半导体行业各大厂商提供合作交流的平台。