在去年9月,我们三易生活曾经参考当时的最新架构资料,以及一些独家内部数据,率先为大家“解读”了英特尔最新一代移动处理器架构
当然,现在大家都已经知道,当时我们所“解析”的对象就是刚刚发布的第一代酷睿ultra处理器的某个es版本。
说实话,当初我们所获取的资料相对较早,虽然已经十分详细,但与最终上市版本还有一定差距。因此,我们非常关注英特尔于2023年12月15日发布的新品。最终的结果是,这次活动确实没有让我们失望
更大、更强,第五代可扩展至强“大杀器”登场
英特尔此次新品发布会与以往相比最大的不同就在于他们几乎首次将面向企业的云端服务器cpu新品和面向消费者的端侧计算设备cpu新品放到了一起。这次发布会可谓别开生面
新一代的至强可扩展处理器已经亮相。这款代号为“emerald rapide-sp”的处理器采用了intel 7制程,并对架构进行了大幅度的重新设计。根据相关技术资料,相较于第四代的至强可扩展处理器,这款处理器有着更高的性能
重写后的内容:最新一代至强可扩展处理器在此次亮相中展现了其全新的规格。它具备了64颗内核,相比上一代的60颗内核有所增加。这些内核现在被分成了2个mcm模块,而不再是上一代的4个模块。这也意味着每个cpu模块都拥有了上一代的两倍以上的内核数量
在此基础上,第五代至强可扩展处理器的基本架构也从golden cove更新到了raptor cove,这就意味着它与大家熟悉的13代、14代酷睿一样,对缓存和内存子系统进行了大幅度的增强。比如将新款的xeon 8592+与前代xeon 8490h对比就会发现,它的l3 cache从112.5mb一口气增加到了320mb。同时与前代的ddr5-4800相比,八通道ddr5-5600起步的内存频率,也代表其内存带宽得到了显著的增强。
当然,以上的内容主要针对云服务提供商,例如京东、阿里巴巴、百度等。这些架构和性能改进的目的是加速云端中ai大模型的迭代和应用效率。除此之外,大家也知道英特尔还有一条面向发烧友的产品线xeon w。因此,第五代可扩展至强架构实际上也透露了下一代xeon w的许多信息
更多核心、更强核显、还有npu,酷睿ultra来了
紧接着就是此次发布会的重头戏——全新的英特尔酷睿 ultra 处理器
在架构方面,英特尔的第一代酷睿ultra处理器是采用了多模块、多制程混合封装设计的。每个核心都包含四个模块,包括使用intel 4制程的cpu模块、采用台积电5nm制程的gpu模块,以及采用台积电6nm制程的soc模块和io模块
这样的设计有什么好处呢?首先,它可以让处理器集成更多的功能组件。以酷睿i9-185h为例,它的cpu模块集成了6p+8e,总共14颗cpu核心。同时,在soc模块中还有2颗额外的e核,可以在运行极低负载时完全关闭cpu模块,从而达到更省电的目的
又比如说,酷睿ultra的arc gpu模块现在拥有更“全”的xe架构。它最多拥有128个执行单元(而非前代的96个),运行频率可以高达2250mhz,并拥有64个纹理单元和32个光栅单元,此外还支持硬件光追和xess硬件ai超分抗锯齿。在这样的配置下,新的核显fp32性能可以高达4.608tflops,相当于前代的整整两倍。
除此之外,酷睿ultra还成为了英特尔首款集成npu的移动处理器方案。根据相关技术资料显示,它的npu算力可达10tops。与此同时,该处理器还内置了雷电4控制器
经过大幅改进,酷睿ultra在架构和设计方面有了显著提升。此次发布的一个非常值得关注的亮点是,它的标压版本的默认tdp仅为28-45w,最大tdp也只有115w。要知道,自从第11代开始,标压的移动版酷睿已经很久没有出现过如此低的官方tdp参数了。例如,高端的标压移动cpu 14900hx甚至有着157w的官方最高tdp设定。从目前曝光的各种信息来看,超高的能效比很可能成为第一代酷睿ultra在实际使用中的亮点
如何让“ai pc”真正实用,英特尔确实带了个好头
如果大家有关注最近的相关信息想必知道,其实英特尔的竞争对手,比如高通、超微,在此前就发布了具备独立npu的移动cpu产品线。相比之下,英特尔的酷睿ultra系列反而算是来得比较晚的了。
英特尔并不比竞争对手晚,在ai pc技术路线上。实际上,早在2019年,英特尔就在当时的酷睿x系列处理器(cascade lake)中首次引入了dl boost指令集,用于加速深度学习计算
后续到了10代、11代酷睿移动版上,dl boost和avx-512指令集进一步被普及到更多的普及型产品上,从而使得当时的许多笔记本电脑产品就具备了类似摄像头居中、麦克风降噪、视频超分这类ai体验。
随着英特尔将xe架构引入酷睿处理器的核显,这些核显也具备了ai加速能力。例如,在一些12代、13代酷睿的笔记本和台式电脑上,可以看到基于核显算力实现的ai语音助手和ai背景虚化等功能
正因如此,在第一代酷睿ultra处理器里,虽然表面上看,它的“ai单元”好像就是一个npu。但实际上,英特尔早就搞定了让cpu、gpu、npu根据不同代码承担不同ai任务、有时甚至可以协同计算的异构加速体系,并且他们将这种技术称之为“xpu”。
在今天的发布会上,可以看到英特尔已经吸引了许多国内软件厂商参与,并展示了他们的产品在酷睿ultra上通过ai加速运行的效果。据英特尔方面表示,尽管酷睿ultra刚刚发布不久,已经有超过100款软件正式适配该产品,并能够发挥出ai的加速效果
可以说,在酷睿ultra与竞争对手相比,英特尔采用的独特的异构处理设计以及他们为推动“ai pc”普及而进行的大量适配,可能是最为明显的优势。相比于简单地往cpu中添加硬件ai加速单元,这种处理方法更为高效
以上就是推开新时代pc的大门,英特尔全新“ai处理器”解析的详细内容。