百度昆仑已量产部署,规模最大
百度独立开发的百度昆仑芯片为新的基础设施提供了可靠的动力。9月15日,"万事智能-百度世界2020"大会召开。在主要论坛上,百度创始人、董事长兼首席执行官李彦宏和百度商界领袖们举行了一场时尚、极客的在线新闻发布会,全面展示了百度人工智能的最新成就,并与各界人士讨论了人工智能、新基础设施、智能经济等热门话题,引起了全行业的关注。
在当天下午的百度脑子论坛上,百度智能芯片的总经理欧阳健系统解释了过去10年基本层芯片的技术积累和最新发展:百度昆仑1号已经大规模生产,在百度搜索引擎和云计算用户中部署了2万块平板电脑,在不同的模式下,百度智能芯片的性能提高了1.5至3倍。同时,采用7nm先进技术的百度昆仑2号已经提前发布,其性能是百度昆仑1号的三倍,2021年上半年的批量生产等等。
欧阳健首先介绍了人工智能芯片的发展背景。他说,IT发展的每一个阶段都有一个非常独特的芯片处理器体系结构:大型机、小型计算机时代、芯片架构是自定义处理器;PC+互联网时代,X86CPU处理器占据家庭;移动+云时代,处理器架构进入ARMCPU和X86CPU共存,其中ARMCPU占据移动端,X86CPU占据服务器端;AI+智能云时代,出现了一种新的芯片架构--AI芯片。
百度对人工智能芯片的研究和开发的积累得益于它利用FPGA加速积累AI,以及多年来它在软件定义加速器和XPU体系结构中的积累。据报道,百度在2010年首次开始使用FPGA进行人工智能架构的研究和开发,2011年推出在线小规模部署,部署1万多个FPGA,2018年发布芯片,209年下半年成功开发AI芯片,2020年开始批量生产,2021年有望生产第二代百度昆仑。与此同时,百度昆仑团队还发表了四篇关于Hotchips的论文,这是目前中国最高的芯片大会。
欧阳健强调,人工智能芯片是科技竞争的制高点,只有通用人工智能处理器才能在激烈的竞争中取胜。百度昆仑核心产品定位是人工智能处理器的总目标,目标是提供高性能、低成本、高灵活性的人工智能芯片。值得一提的是,百度昆仑芯片使百度大脑具有更完整的软硬件集成能力,形成了从芯片到深入学习框架、平台和生态的一整套人工智能技术布局。
百度昆仑--通用人工智能处理器有三个特点:高性能、低成本、灵活。首选的通用性是指它支持所有人工智能应用程序和场景的能力;第二,它易于编程,可以建立一个强大的软件生态护城河;第三,它可以支持人工智能应用来突破新的可能性;第四,低成本,最重要的是自我控制。
为了更直观地显示百度昆仑芯片的实际性能,欧阳健还在今天的共享中给出了一系列百度昆仑比较T4数据。例如,百度昆仑芯片可以测量200多个桌面的实际性能,与业界最先进的T4 GPU相比,可以测量到大约70顶,百度昆仑与T4相比性能提高了三倍;而在图像分割YOLOV 3算法中,百度昆仑的性能大约是T4的2倍。此外,它还显示了百度昆仑在工业智能设备中的应用。
可以看出,百度昆仑芯片不仅具有很高的性能优势,而且其实际机型的性能在业界也处于领先地位。到目前为止,百度昆仑芯片完全支持语音、图像、NLP模型、灵活支持用户定义的模型、支持传统机器学习模型;100%独立的芯片设计,可以实现与国产处理器、国产操作系统、国内框架的适应;同时,它也是国内行业最大的部署规模,并拥有10多个外部客户。