昆仑AI芯片来了!性能比英伟达T4强三倍,百度或将再次崛起

中国“芯”不再难,ASML最新款光刻机要来了,芯片行业要重新洗牌

Hello大家好,我是兼容机之家的小牛! 光刻机对于很多人来说,只觉得这是芯片生产过程中非常重要的工具,但它的重要程度,大家可能还只有一个模糊的概念。 毫不夸张的说,光刻机直接代表了人类目前最高的工业生产能力。我们手机、电脑等各种数码产品的芯片全

芯片行业近几年发展非常迅速,国内各个科技厂商都在积极地投身研发自己的芯片,让国内芯片行业在被美国针对后,不仅没有受挫,反而出现逆势增长。

就在昨天,百度智能芯片昆仑和大家见面,总经理在公开课中首次对这个芯片进行了详细的分享,并公开了昆仑K200与英特尔T4 GPU的多项对比数据,其中最有优势的一项数据是Gemm-Int8 的Benchmark是T4性能的3倍。视频还展示了昆仑芯片的杀手锏,与国产处理器飞腾的良好适配。

在2018年的百度AI开发者大会上,百度的创始人宣布推出自研AI芯片昆仑,百度做芯片的基础也是在多年的行业经验积累上的,在用FPGA做AI加速、软件定义加速器、XPU架构上都很有经验。

其实百度最早在2010年就已经开始用FPGA做AI架构的研发,之后开始小规模的部署,在2017年部署超过了1万片FPGA,就是在这样的条件以及丰富的经验下,百度在2018年开始了自主研发AI芯片,并且在去年下半年正式流片成功,开始量产。

基于清华“天机”芯片,类脑芯片研发商「灵汐科技」可实现自行车无人驾驶

神经拟态芯片是AI芯片的一种,又俗称“类脑芯片”,指的是一种从结构层面模拟大脑,参考人脑神经元结构和人脑感知认知方式来设计的芯片。 灵汐科技成立于2018年1月,公司主要研发类脑芯片和计算系统,产品包括类脑芯片、基于类脑芯片的加速板卡和服务器、软件

昆仑芯片的定位是通用AI芯片,目标是提供高性能、低成本、高灵活性的AI芯片。百度方面也表示,相比GPU,昆仑芯片的通用性和可编程性都做得不错,并且还在努力把编程性做得更好。

架构方面,昆仑有2个计算单元,512GB/S的内存带宽,16MB SRAM/unit。16MB的SRAM对AI推理很有帮助,XPU架构上的XPU-SDNN是为Tensor等而设计,XPU-Cluster则能够满足通用处理的需求。昆仑第一代芯片并没有采用NVLink,而是通过PCIE 4.0接口进行互联。在三星14nm的制造工艺和2.5D封装的支持下,昆仑芯片峰值性能可以达到260TOPS,功耗为150W。在灵活性和易用性方面,昆仑面向开发者提供类似英伟达CUDA的软件栈,可以通过C/C++语言进行编程,降低开发者的开发难度。

目前,基于第一代昆仑芯片,百度推出了两款AI加速卡,K100和K200,前者算力和功耗都是后者的两倍。其中在Gemm-Int8数据类型,4K X 4K的矩阵下,昆仑K200的Benchmark分出超过2000,是英伟达T4的3倍多。

百度能够研发出如此高性能的AI芯片,与自身在科技领域多年的摸爬滚打是分不开的,百度目前的市场也并不算大,更需要一些技术性的产品来提升自己,而昆仑应运而生。

本文源自头条号:互联网深科技如有侵权请联系删除

百度祭出昆仑AI芯片杀手锏 性能最高比NV芯片强三倍

4月2日下午,百度智能芯片总经理欧阳剑在一场公开课中首次对昆仑芯片进行了详细分享,并公开了昆仑K200与英特尔T4 GPU的多项对比数据,其中最有优势的一项数据是Gemm-Int8 的Benchmark是T4性能的3倍。欧阳剑还通过视频展示了昆仑芯片的杀手锏,与国产处理器飞