
英特尔的领导层对这一定律的态度始终明确:摩尔定律仍然具备生命力,并将继续被实践者践行。尽管业界存在对定律“死亡”的声音,英特尔坚守的路线是通过创新的封装与异构架构来延续性能与能效的提升。
在制程与架构的层面,英特尔提出了一条“看似不可能但正在推进”的路线图,即四年内实现多节点的演进与组合式设计。灵感源自戈登·摩尔在早期提出的系统分解思想:把大型系统拆解为若干互连的较小功能模块,以降低能耗与成本。英特尔的新一代Meteor Lake正是沿此思路展开的探索。
一、全新封装技术带来的分离式模块化架构
英特尔在封装领域持续保持领先:从早期的芯片组封装到量产级2.5D封装(EMIB,嵌入式多芯片互联桥接)用于数据中心与服务器的Sapphire Rapids,再到即将推出的采用3D Foveros实现分离式模块化设计的Meteor Lake。这种分离式模块化的核心理念是:将处理器分解为互相独立、可按需组合的功能块,每个模块内再划分若干功耗单元,像拼搭乐高一样灵活增减功能、调整性能与功耗。
MTL(Meteor Lake)在架构上采用四大模块(Tile):
- 顶部的Graphics Tile:图形模块
- 中间的SoC Tile(低功耗岛):负责低功耗任务与关键系统功能
- 左下的IO Tile:控制接口
- 右下的Compute Tile:高性能计算核心
二、巧思妙想的“低功耗岛”SoC Tile
SoC Tile承载了多项重要功能,聚焦低功耗高效能的平衡。核心要点包括:
- LP E-Core(低功耗能效核):在SoC Tile内集成两颗低功耗核,形成“大核心+小核心+超小核心”的三核混合结构。与Compute Tile不同,LP E-Core位于SoC Tile之中,负责处理低负载任务与与内存控制、媒体引擎、接口控制(IOC)等功能的低功耗调度。通过极低功耗的互联与内存访问,实现“低功耗岛”的高能效。
- 媒体引擎与显示引擎:这两部分功能被移至SoC Tile内部,减少对图形与计算模块的持续供电需求。这样在视频编解码、显示输出等场景下,只需SoC Tile就能完成,降低了大部分场景下的功耗。媒体编解码能力继续保持行业领先水平,支持HEVC、10位色深、4:2:2采样等高要求格式。
- 显示输出与接口:显示输出(如HDMI 2.1、DP 2.1)及多路显示需求也在SoC Tile中得到优化,进一步降低整体能耗。
- IOC(输入/输出控制)与无线/有线接口:Wi-Fi、蓝牙、USB、PCIe等接口的调度统一交由IOC管理,再由LP E-Core执行,从而避免对Compute Tile的额外唤醒和功耗增加。
- NPU(用于人工智能的神经处理单元):SoC Tile内置两组神经计算引擎,包含推理管道和可编程数字信号处理器,专门优化矩阵乘法、卷积、量化网络等AI工作负载。NPU具备高吞吐的向量运算能力,支持多种数据表示与快速数据重排,能在背景AI、图像处理等场景中显著提升能效。将NPU放在SoC Tile内,还可以在日常办公、视频增强等任务中实现更低功耗的AI加速,整体提升在AI场景中的能效比。
三、Graphics Tile与Compute Tile——性能与能耗兼得
分离式模块化架构让系统在能耗与性能之间获得更灵活的权衡。SoC Tile承担低功耗工作,而Compute Tile与Graphics Tile则聚焦于高性能处理能力的提升。
- Compute Tile:采用全新制程工艺,核心定位于高性能计算能力。核心架构信息指向基于新一代高效能核心(P核)和高能效核心(E核)的组合,规格上可能包含若干P核与E核,以及辅助的低功耗核(LPE)。以往的演进显示,Compute Tile将承担大多数计算密集型任务的执行。
- Graphics Tile:采用Xe LPG架构的全新代际,基于Xe显卡家族的演进经验,性能相较前代显著提升。新的架构与更强的单元数量(EU单位)将带来更高的并行计算能力与图形渲染性能。显卡功能将与计算模块紧密协同,支持现代图形API和高端显示输出,并在某些场景中提供更强的光线追踪与图形渲染能力。
通过将媒体引擎和显示引擎提前置于SoC Tile,Graphics Tile的堆料空间得到释放,理论上能够容纳更多Xe核心(达到128个EU级别的规模),并提升对DirectX 12 Ultimate等现代图形API的支持与扩展能力。整个平台在性能与功耗之间的权衡将得到显著改善。
四、英特尔线程调度器
自从引入大小核混合架构以来,任务调度一直是性能与能效的关键。新的调度体系结合了硬件与操作系统层面的协作,以更精准地将任务分派到最合适的核心上。
- 弹性评分体系:在Windows等系统层面,以一个基于核心状态的评分机制对任务进行细分,并对可用核心进行评分,确保将任务分配给最合适的执行单元。
- 四等级评估:任务被分为四个等级(Class 0~Class 4),用于描述在P核心与E核心之间执行效率的对比情况。系统综合任务等级与当前核心状态,动态选定最优执行核心,以实现更高的性能与更低的能耗。
这套改进不仅提升日常工作负载的响应速度,也在多线程和高并发情境下带来更稳定的能效表现旋乐吧spin8。对Meteor Lake而言,新的硬件调度器与软件协同优化是实现更高能效的关键环节之一。
五、总结
通过全新的高级封装与分离式模块化设计,Meteor Lake实现了“在同一芯片上同时追求更高性能与更低功耗”的目标。低功耗岛通过LP E-Core、媒体与显示引擎的独立运行,以及NPU等专用单元,显著降低了日常轻量任务的能耗;Compute Tile与Graphics Tile在性能提升方面获得更大空间,且具备更强的图形与AI处理能力;新一代线程调度器则进一步提升调度准确性与能效比。综合来看,Meteor Lake的架构思路为消费级CPU在未来的性能与能耗平衡提供了新的范式,也为摩尔定律在当前阶段继续向前提供了技术支撑。