性能最高比英伟达T4强三倍!百度昆仑AI芯片详解,编程性更好

面对西方强霸制裁,我们的芯片制造路在何方?

全球智能手机销量三巨头,三星,苹果,华为牢牢稳居前三。虽然三星败走中国市场,但是在全球其他各国销量依然稳居榜首,其次才是苹果,然后就是我们的国产华为。众所周知最早华为是从做网络设备起家,后来才涉足手机,平板电脑等移动终端设备领域。在通讯领域

芯片行业近几年发展非常迅速,国内各个科技厂商都在积极地投身研发自己的芯片,让国内芯片行业在被美国针对后,不仅没有受挫,反而出现逆势增长。

就在昨天,百度智能芯片昆仑和大家见面,总经理在公开课中首次对这个芯片进行了详细的分享,并公开了昆仑K200与英特尔T4 GPU的多项对比数据,其中最有优势的一项数据是Gemm-Int8 的Benchmark是T4性能的3倍。视频还展示了昆仑芯片的杀手锏,与国产处理器飞腾的良好适配。

在2018年的百度AI开发者大会上,百度的创始人宣布推出自研AI芯片昆仑,百度做芯片的基础也是在多年的行业经验积累上的,在用FPGA做AI加速、软件定义加速器、XPU架构上都很有经验。

其实百度最早在2010年就已经开始用FPGA做AI架构的研发,之后开始小规模的部署,在2017年部署超过了1万片FPGA,就是在这样的条件以及丰富的经验下,百度在2018年开始了自主研发AI芯片,并且在去年下半年正式流片成功,开始量产。

捋一捋5G产业链逻辑——芯片(2020-4-2)

一、今日指数: 上证指数收报2780.64, 涨幅1.69%, 成交量2331亿, 涨跌比1413:198; 深证成指收报10179.20,涨幅2.28%, 成交量3646亿, 涨跌比1967:251; 中小板指收报6683.15, 涨幅2.78%, 成交量1714亿, 涨跌比799:132; 创业板指收报1916.95, 涨幅2.

昆仑芯片的定位是通用AI芯片,目标是提供高性能、低成本、高灵活性的AI芯片。百度方面也表示,相比GPU,昆仑芯片的通用性和可编程性都做得不错,并且还在努力把编程性做得更好。

架构方面,昆仑有2个计算单元,512GB/S的内存带宽,16MB SRAM/unit。16MB的SRAM对AI推理很有帮助,XPU架构上的XPU-SDNN是为Tensor等而设计,XPU-Cluster则能够满足通用处理的需求。昆仑第一代芯片并没有采用NVLink,而是通过PCIE 4.0接口进行互联。在三星14nm的制造工艺和2.5D封装的支持下,昆仑芯片峰值性能可以达到260TOPS,功耗为150W。在灵活性和易用性方面,昆仑面向开发者提供类似英伟达CUDA的软件栈,可以通过C/C++语言进行编程,降低开发者的开发难度。

目前,基于第一代昆仑芯片,百度推出了两款AI加速卡,K100和K200,前者算力和功耗都是后者的两倍。其中在Gemm-Int8数据类型,4K X 4K的矩阵下,昆仑K200的Benchmark分出超过2000,是英伟达T4的3倍多。

百度能够研发出如此高性能的AI芯片,与自身在科技领域多年的摸爬滚打是分不开的,百度目前的市场也并不算大,更需要一些技术性的产品来提升自己,而昆仑应运而生。

本文源自头条号:互联网深科技如有侵权请联系删除

顶级旗舰芯片的厮杀,对比麒麟990 5G,高通865,天玑1000

2019年9月6日,华为在德国柏林IFA大会发布了最新处理器芯片—麒麟990芯片,共有两个版本,其中一款支持5G,即麒麟990 5G。 麒麟990 5G 麒麟990 5G 采用7nm+ EUV工艺制程,首次将5G Modem集成到SoC上,面积相比其他方案小了36%。这也是世界上第一款晶体管数量