首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|元宇宙|博客|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片报告|智慧城市|移动互联网|会展
首页 >> 头条固定一 >> 正文

盘点2023|“iPhone时刻”引爆芯片需求,3nm来了

2023年12月26日 08:28  CCTIME飞象网  作 者:源初

飞象网讯(源初/文)2023年,全球芯片行业继续保持增长态势,根据国际半导体产业协会预测,2023年全球半导体销售额将达到6860亿美元,同比增长10.1%,5G、云计算、人工智能等新兴应用的快速发展,推动了芯片需求的增长。

而要说2023年芯片领域什么最热,故事还要从年初的ChatGPT开始,黄仁勋当时表示:“我们正处于AI的‘ iPhone 时刻’。”成就生成式AI的背后,自然是AI算力的支持。

“iPhone时刻”引爆芯片需求

2023年3月,英伟达宣布推出全新的H100 NVL计算加速卡,专为大型语言模型训练(LLM)设计,性能更强。其搭载了两个基于Hopper架构的H100芯片,顶部配备了三个NVLink连接器,在服务器里使用了两个相邻的PCIe全长插槽。H100 NVL计算卡的FP64计算性能为134TFLOPS,TF32计算性能为1979 TFLOPS,FP8计算性能为7916 TFLOPS,INT8计算性能为7916 TFLOPS,是H100 SXM的两倍。其具有完整的6144位显存接口,显存速率可达5.1Gbps,意味着最大吞吐量为7.8TB/s,是H100 SM3的两倍多。

年底,英特尔CEO 基辛格首次公开介绍第三代英特尔AI加速器Gaudi 3,它用于深度学习和大型生成式AI模型。英特尔计划明年发布Gaudi 3,称Gaudi 3的性能将优于英伟达的主打AI芯片H100。据悉,Gaudi 3将于2024年推出,采用5nm制程,相较前代提供到达4倍的BFloat16 功能、2 倍的运算能力、1.5倍的网络频宽和1.5倍的HBM容量。

AMD也在年底正式发布两款AI芯片旗舰产品,Instinct MI300X与MI300A。MI300X专为生成式AI智能算力设计的数据中心GPU,正面对标英伟达H100;MI300A则是专为超级计算机设计的APU产品。APU为AMD在2011年提出的升级版CPU概念,其将CPU和GPU组合在同一个晶片上,以满足超级计算机高性能计算的要求。

 

端侧AI卷起来

端侧AI的概念也开始兴起。今年5月,高通在线上发布了《混合AI是AI的未来》白皮书,梳理了高通在AI领域技术发展和应用趋势方面的洞察,旨在与更多合作伙伴共同探索AI技术普惠之路。通过终端侧AI算力与云端的结合,恰恰能够解决目前生成式AI完全依靠云端而出现的各种隐忧。例如在功耗方面,如果在云端运行一个超过10亿参数的生成式AI模型,可能需要数百瓦功耗的话,但在终端侧运行需要的功耗仅有几毫瓦。

高通在今年巴展期间所带来的Stable Diffusion在Android终端上的演示为例,能够在15秒内完成20步推理,生成包含细节的图像,整个过程全部在本地化进行,即使手机设置成飞行模式,也能完成根据文字描述所进行的绘画创作任务。这种特性既为用户带来了更加灵活高效的使用方式,又大大提升了隐私保护性。

骁龙峰会期间发布的第三代骁龙8移动平台,NPU提升高达98%,能效提升40%。在AI表现上可实现本地运行100亿参数的模型,面向70亿参数大语言模型每秒生成高达20个token,实际应用中可在本地实现一秒内完成Stable Diffusion的图片生成。同期发布的面向移动PC领域的骁龙X Elite,CPU+GPU+NPU结合而成的AI算力更是高达75TOPS,其中NPU算力高达45TOPS,AI处理速度是竞品的4.5倍。

年底,英特尔在以“AI Everywhere”为主题的活动中发布酷睿Ultra移动处理器,英特尔为新CPU配备NPU提供“低功耗人工智能加速和CPU/GPU卸载”,专为在低功耗下长时间运行的AI工作负载而设计,与CPU 和GPU的AI功能相辅相成,与前代相比,能够带来2.5倍的能效表现,能够执行人工智能驱动的任务,如背景模糊、眼动追踪和图片框架等。

联发科的9300同样搭载了基于硬件的生成式 AI 引擎,生成式 AI transformer 运算速度快 8 倍,2 倍整数和浮点运算速度,功耗较前一代降低 45%,最高可支持 330 亿参数的 AI 大语言模型,支持 NeuroPilot Compression 内存硬件压缩技术,生成式 AI 端侧技能扩充技术。

 

3nm终于来了

相比于去年A16处理器的小修小补,苹果伴随iPhone 15 Pro系列推出的A17 Pro终于迎来台积电3nm制程,拥有高达170亿个晶体管,也成为了业界首款搭载3nm制程芯片的系列手机。A17 Pro芯片硬件加速光线追踪的运行速度提升最高可达4倍,神经网络引擎运行机器学习模型的速度提升最快可达2倍,每秒可执行最高达35万亿次操作。

根据台积电给出的数据显示,3nm制程的逻辑密度将增加约70%,相同功耗下,速度提升10~15%,或于相同速度下,功耗降低25~30%。不过,台积电3nm制程对于iPhone所带来的使用体验提升并不明显。考虑到机身设计问题,也为iPhone 15 Pro系列带来了散热问题。

10月底,苹果再次伴随新款Macbook Pro系列发布采用3nm制程的M3系列芯片。苹果表示M3在CPU性能上比M1快了35%。M3还配备了采用下一代架构的10核GPU,图形性能比M1快65%。M3还支持高达 24G B 的统一内存和一台外接显示器。M3 Pro在单线程任务中,CPU性能比M1 Pro快30%。M3 Pro最高支持36GB统一内存。M3 Max拥有920亿个晶体管和16核GPU,包括12个性能核心和4个效率核心,以及40核GPU,比M1 Max快50%。M3 Max最高支持128GB统一内存。M3 Max的GPU性能比M1 Max快80%。

展望2024年,全球芯片行业仍将保持增长态势。 云计算、人工智能等新兴应用的快速发展,将继续推动高性能芯片的需求。预计在2024年,云计算、人工智能芯片的市场规模将达到3000亿美元,同比增长15%。

编 辑:魏德龄
声明:刊载本文目的在于传播更多行业信息,本站只提供参考并不构成任何投资及应用建议。如网站内容涉及作品版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容。本站联系电话为86-010-87765777,邮件后缀为#cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
相关新闻              
 
人物
工信部张云明:大部分国家新划分了中频段6G频谱资源
精彩专题
专题丨“汛”速出动 共筑信息保障堤坝
2023MWC上海世界移动通信大会
中国5G商用四周年
2023年中国国际信息通信展览会
CCTIME推荐
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像