Arm芯片來勢洶洶,英特爾出招!

👆如果您希望可以時常見面,歡迎標星🌟收藏哦~

來源:內容由半導體芯聞(ID:MooreNEWS)編譯自anandtech,謝謝。


英特爾今天上午公佈了即將推出的 Lunar Lake SoC 的一些更詳細的架構和技術細節,該芯片將成爲下一代 Core Ultra 移動處理器。英特爾還披露了 Lunar Lake 的諸多方面,包括代號爲Lion Cove的新 P 核設計和新一波 E 核,這些 E 核更像 Meteor Lake 的開創性低功耗島 E 核。英特爾還披露了英特爾 NPU 4,英特爾聲稱它可提供高達 48 TOPS 的速度,超過了微軟對新時代 AI PC 的 Copilot+ 要求。


英特爾的 Lunar Lake 代表了其移動 SoC 產品線的戰略性演進,以去年推出的 Meteor Lake 爲基礎,專注於提高能效和全面優化性能。Lunar Lake 利用先進的調度機制,根據工作負載需求將任務動態分配給高效核心 (E 核心) 或性能核心 (P 核心),以確保最佳的功耗和性能。不過,英特爾線程控制器和 Windows 11 再次在此過程中發揮了關鍵作用,指導操作系統調度程序根據工作負載強度進行實時調整,以平衡效率和計算能力。



Lunar Lake:由英特爾設計,由臺積電製造(由英特爾組裝)


雖然 Lunar Lake 有很多方面值得深入瞭解,但也許我們最好從最引人注目的部分開始:誰在建造它


英特爾的 Lunar Lake 模塊並未使用自己的任何代工廠進行製造,這與歷史先例大相徑庭,甚至與最近的 Meteor Lake 也大相徑庭,後者的計算模塊是使用intel 4 工藝製造的。相反,分解後的 Lunar Lake 的兩個模塊都在臺積電製造,使用臺積電的 N3B 和 N6 工藝混合製造。


2021 年,英特爾開始解放他們的芯片設計團隊,讓他們使用最好的代工廠——無論是內部還是外部——而這裏就是最明顯的體現。


總體而言,Lunar Lake 代表了英特爾面向移動市場的第二代分解式 SoC 架構,取代了低端領域的 Meteor Lake 架構。目前,英特爾已披露其採用 4P+4E(8 核)設計,禁用超線程/SMT,因此處理器支持的總線程數只是 CPU 核心數,例如 4P+4E/8T。



Lunar Lake 的構建結合了英特爾架構設計團隊與臺積電製造工藝節點的協同合作,將最新的 Lion Cove P 核引入 Lunar Lake,這將提升英特爾架構的 IPC,正如人們對新一代架構的期望一樣。與此同時,英特爾還推出了 Skymont E 核,取代了 Meteor Lake 的 Low Power Island Cresmont E 核。但值得注意的是,這些 E 核不像 P 核那樣連接到環形總線,這使它們成爲一種混合 LP E 核,結合了更先進的臺積電 N3B 節點的效率提升和比之前的 Crestmont 核高出兩位數的 IPC 提升。


整個計算塊,包括 P 核和 E 核,都建立在臺積電的 N3B 節點上,而 SoC 塊則使用臺積電 N6 節點製造。


在更高層次上,英特爾再次使用了他們的 Foveros 封裝技術。計算和 SoC(現在稱爲“平臺控制器”)模塊都位於基礎模塊之上,基礎模塊在模塊之間提供高速/低功耗路由,並進一步與芯片的其餘部分及其他部分建立連接。


作爲主流英特爾酷睿產品的另一項首創,Lunar Lake SoC 平臺還在芯片封裝本身中包含高達 32 GB 的 LPDDR5X 內存。它被安排爲一對 64 位內存芯片,提供總共 128 位內存接口。與其他使用封裝內存的供應商一樣,這一變化意味着用戶不能隨意升級 DRAM,而 Lunar Lake 的內存配置最終將由英特爾選擇發貨的 SKU 決定。



藉助 Lunar Lake,英特爾也高度關注 AI,因爲該架構集成了一個名爲 NPU 4 的新 NPU。這款 NPU 的額定 INT8 性能高達 48 TOPS,因此它已爲 Microsoft Copilot+ AI PC 做好準備。這是所有 PC SoC 供應商的目標,包括 AMD 和高通。


英特爾的集成 GPU 也將在這裏發揮重要作用。雖然 Arc Xe2-LPG 不像專用 NPU 那樣高效,但它帶來了數十個額外的 T(FL)OPS 性能,以及 NPU 所不具備的一些額外靈活性。這就是爲什麼你還會看到英特爾以總平臺 TOPS 來評估這些芯片的性能——在本例中爲 120 TOPS。


英特爾與微軟的合作通過傳說中的英特爾線程控制器進一步增強了工作負載管理,該控制器針對 Copilot 助手等應用程序進行了優化。考慮到 Lunar Lake 的推出時間,它爲 2024 年第三季度的發佈奠定了基礎,這與 2024 年假期市場相吻合。


英特爾 Lunar Lake:更新英特爾線程控制器和電源管理改進


說能效是 Lunar Lake 的一個關鍵目標,這還不夠。儘管英特爾在移動 PC CPU 市場佔據主導地位(AMD 在該市場的份額仍然很小),但過去幾年來,該公司一直感受到來自客戶轉爲競爭對手的蘋果的壓力。蘋果的 M 系列 Apple Silicon 在過去幾年中一直在爲能效設定標準。現在,高通試圖利用即將推出的驍龍 X 芯片爲 Windows 生態系統做同樣的事情,英特爾正準備發揮自己的實力。


與 Meteor Lake 相比,英特爾針對 Lunar Lake 的線程控制器和電源管理更新顯示出了各種顯著的改進。線程控制器使用異構調度策略,最初將任務分配給單個 E 核,並在需要時擴展到其他 E 核或 P 核。操作系統遏制區旨在將任務限制在特定內核上,這直接提高了電源效率,併爲當前工作負載提供了正確內核所需的性能。與電源管理系統和四重電源管理控制器 (PMC) 陣列的集成進一步使芯片與 Windows 11 協同進行上下文感知調整,確保以最小的功耗和浪費實現最佳性能。



Lunar Lake 的調度策略可以有效處理功耗敏感型應用。英特爾給出的一個例子是,視頻會議任務被保留在效率核心集羣內,利用 E 核心來保持性能,同時將功耗降低高達 35%,如英特爾提供的數據所示。這些改進是通過與微軟等操作系統開發商的合作實現的,以實現無縫集成,從而優化功耗和性能之間的最佳平衡。



英特爾專注於 Lunar Lake 的電源管理系統,使用其 SoC 電源管理,以效率、平衡和性能模式運行,這些模式經過量身定製,旨在適應運行時工作負載的任何需求。這種多層方法使 Lunar Lake SoC 能夠高效運行。同樣,與英特爾線程控制器非常相似,PMC 可以平衡功耗和性能需求。



英特爾進一步計劃通過增加場景粒度、實施基於 AI 的調度提示以及在 Windows 11 中啓用跨 IP 調度來增強線程控制器。這些增強功能本質上等同於工作負載管理,旨在提高整體電源效率並在需要時跨各種應用程序提供性能,而不會通過將較輕的任務分配給更高功率的 P 核來浪費功率預算。


在接下來的幾頁中,我們將探索新的 P 和 E 核心以及英特爾對集成 Arc Xe(Xe2-LPG)顯卡的更新。


英特爾 Lunar Lake:全新 P 核心,加入 Lion Cove


英特爾 Lion Cove CPU 架構帶來了一些變化,以提高英特爾 P 核的性能和效率。


這些改進中最重要的是對英特爾傳統的 P 核緩存層次結構的重大改進。Lion Cove 的新設計使用多層數據緩存,其中包含一個 48KB L0D 緩存(加載到使用延遲爲 4 週期)、一個 192KB L1D 緩存(延遲爲 9 週期)以及一個擴展的 L2 緩存(最高可達 3MB,延遲爲 17 週期)。總的來說,這使得 240KB 緩存的延遲時間與 CPU 內核的延遲時間相差無幾,而之前的 Redwood Cove 只能在相同時間內達到 48KB 緩存。


數據轉換後備緩衝區 (DTLB) 也進行了修改,將其深度從 96 頁增加到 128 頁,以提高其命中率。



最後,英特爾添加了第三個地址生成單元 (AGU)/存儲單元對,以進一步提升存儲性能。值得注意的是,這使加載和存儲管道的數量達到平衡,分別爲 3 個;在大多數英特爾架構中,加載單元的數量都比存儲單元多。


總體而言,英特爾在真正的長期 CPU 設計理念中,已經投入了更多緩存來解決這個問題。隨着 CPU 複雜度的增加,緩存子系統也在不斷增加,以保證其正常運行。在這種情況下,保證 CPU 正常運行是提高其性能和保持其能效的關鍵改進。



深入研究 Lion Cove 的計算架構,該架構在英特爾的 P 核設計上又向前邁進了一步,再次專注於提高性能和效率。該架構採用一種新的前端方法來處理指令,其預測塊比以前大 8 倍,提取範圍更廣,解碼帶寬更高,Uops 緩存容量和讀取帶寬也大幅增加。UOP 隊列容量增加,這也提高了整體吞吐量。在執行過程中,Lion Cove 的無序引擎在整數 (INT) 和矢量 (VEC) 域之間劃分,具有獨立的重命名和調度功能。



這種分區方式可以實現未來的可擴展性、每個域的獨立增長,並且有利於降低特定域工作負載的功耗。亂序引擎也得到了改進,分配/重命名從 6 個增加到 8 個,退出從 8 個增加到 12 個,深度指令窗口從 512 個增加到 576 個,執行端口從 12 個增加到 18 個。這些變化使管道更加穩健,執行起來也更加靈活。



Lion Cove 中的整數執行單元也得到了改進,整數 ALU 從 5 個增加到 6 個,跳躍單元從 2 個增加到 3 個,移位單元從 2 個增加到 3 個。它們將單元從 64x64 增加到 64 個,從 1 個增加到 3 個,爲最複雜的操作提供更強大的計算能力。另一個顯著的進步是 P 核心數據庫從“一堆亂七八糟的東西”遷移到“一堆單元”。更新 P 核心子結構組織的過程從微小的、以鎖存器爲主的分區轉變爲更廣泛、更大的以觸發器爲主的分區,這些分區在發展過程中非常不可知。



Lion Cove 架構也與性能提升保持一致,與上一代 Redwood Cove 相比,IPC 預計將提升兩位數。這種提升尤其明顯,尤其是在超線程的改進方面,IPC 提高了 30%,動態功率效率提高了 20%,並且在不增加核心面積的情況下平衡了先前的技術,體現了英特爾在現有物理限制內提高性能的承諾。



電源管理也得到了改進,包括採用 AI 自調節控制器來取代靜態熱保護帶。它讓系統以自適應方式動態響應實際的實時運行條件,以實現更高的持續性能。它使用更精細的時鐘粒度,現在間隔爲 16.67MHz。與 100MHz 相比,這意味着更精確的電源管理和性能調整,從而從功率預算中獲得最大效率。


至少從紙面上看,Lion Cove 看起來比 Golden Cove 有了很大的改進。它整合了改進的內存和緩存子系統、更好的電源管理以及 IPC 性能的提升,而不是專注於提高頻率。


英特爾 Lunar Lake:全新 E-Core、Skymont 助力實現峯值效率


Skymont E-cores 是英特爾 Lunar Lake 架構的核心,專爲實現全新水平的效率和性能而設計。



Skymont 核心具有更全面的機器架構,首先是 9 寬解碼階段,其解碼簇比前幾代多 50%。這由更大的微操作隊列支持,現在可容納 96 個條目,而舊設計中只有 64 個。使用“Nanocode”可在每個解碼簇內增加更多微代碼並行性。



無序執行引擎也得到了顯著改進。分配寬度增加到 8 位,而退出階段則加倍到 16 位。這增強了內核同時發出和執行多條指令的能力,並通過依賴中斷機制減少了延遲。



Skymont 將重排序緩衝區從之前的 256 個條目加深到 416 個條目,以提供排隊和緩衝功能。此外,物理寄存器文件 (PRF) 和保留站的大小也增加了。這些增強功能使內核能夠處理更多正在運行的指令,從而提高指令執行的並行性。



請注意,調度端口最初爲 26 個,其中 8 個用於整數 ALU,3 個用於跳轉操作,3 個用於每個週期的加載操作,從而進一步實現了靈活高效的資源分配。在矢量性能方面,Skymont 支持 4x128 位 FP 和 SIMD 矢量,這使每秒千兆次浮點運算 (Gigaflops/TOPs) 翻倍,並降低了浮點運算的延遲。該公司還重新設計了內存子系統,四個內核共享 4MB L2 緩存,將 L2 帶寬翻倍至每週期 128B,在此過程中,降低了內存訪問延遲,同時提高了數據吞吐量。



性能指標凸顯了電源效率的顯著提升:與 Meteor Lake 的 LP E 核相比,單線程性能提高了 1.7 倍,而功耗僅爲其三分之一。



當將 Skymont E-core 集羣與 Meteor Lake 及其 LP E-core 直接進行比較時,多線程性能提高了 2.9 倍,而功耗卻全面降低。



這對於移動和桌面設計同樣有用。換句話說,Skymont E 核心非常靈活,在移動場景中充分利用了低功耗結構和系統緩存,並針對桌面計算塊優化了多線程吞吐量。與 Raptor Cove 相比,Skymont 在單線程工作負載中提供了 2% 更好的整數和浮點性能,其功率和熱量範圍幾乎與其前代產品相同。



這樣,Skymont 的 E 核代表了英特爾架構開發的下一步,在解碼、執行、內存子系統和電源效率方面取得了顯著的進步,滿足了更節能計算的需求,並且比以前的 Crestmont E 核提高了 IPC 增益。


全新 NPU:英特爾 NPU 4,峯值 TOPS 高達 48


從營銷角度來看,英特爾的主要焦點可能是其神經處理單元(NPU)的最新世代變化。英特爾在其最新的 NPU(恰當地稱爲 NPU 4)上取得了一些重大突破。儘管 AMD 在其 Computex 主題演講中披露了速度更快的 NPU,但英特爾聲稱其峯值 AI 性能高達 48 TOPS。與上一代 NPU 3 相比,NPU 4 在增強神經處理能力和效率方面有了巨大飛躍。NPU 4 的改進是通過實現更高的頻率、更好的電源架構和更多的引擎數量來實現的,從而賦予它更好的性能和效率。



在 NPU 4 中,這些改進在矢量性能架構中得到了增強,計算塊數量更多,矩陣計算的優化性更好。這需要大量的神經處理帶寬;換句話說,這對於需要超高速數據處理和實時推理的應用程序至關重要。該架構支持 INT8 和 FP16 精度,INT8 每週期最多可進行 2048 次 MAC(乘法累加)運算,FP16 每週期最多可進行 1024 次 MAC 運算,這顯然表明計算效率顯著提高。



更深入地瞭解架構後,可以發現 NPU 4 的層次有所增加。第 4 版中的每個神經計算引擎都嵌入了令人難以置信的出色推理管道 - 包括 MAC 陣列和許多用於不同類型計算的專用 DSP。該管道專爲衆多並行操作而構建,從而提高了性能和效率。新的 SHAVE DSP 經過優化,矢量計算能力是上一代的四倍,可以處理更復雜的神經網絡。



NPU 4 的一項重大改進是提高了時鐘速度,並引入了一個新節點,在與 NPU 3 相同的功率水平下將性能提高了一倍。這使峯值性能提高了四倍,使 NPU 4 成爲要求苛刻的 AI 應用的強大引擎。新的 MAC 陣列在芯片上具有先進的數據轉換功能,允許動態進行數據類型轉換、融合操作和輸出數據佈局,從而使數據流以最小的延遲達到最佳狀態。



NPU 4 的帶寬改進對於處理更大的模型和數據集至關重要,尤其是在基於 Transformer 語言模型的應用程序中。該架構支持更高的數據流,從而減少瓶頸並確保即使在運行時也能順利運行。NPU 4 的 DMA(直接內存訪問)引擎將 DMA 帶寬翻倍——這是提高網絡性能的重要補充,也是處理重型神經網絡模型的有效方法。進一步支持更多功能,包括嵌入標記化,從而擴大了 NPU 4 的潛力。



NPU 4 的顯著改進在於矩陣乘法和卷積運算,其中 MAC 陣列可以在單個週期內處理最多 2048 個 MAC 運算(INT8)和 1024 個 MAC 運算(FP16)。這反過來又使得 NPU 能夠以更高的速度和更低的功率處理更復雜的神經網絡計算。這在矢量寄存器文件的維度上產生了差異;NPU 4 的寬度爲 512 位。這意味着在一個時鐘週期內,可以進行更多的矢量運算;這反過來又提高了計算效率。



NPU 4 支持激活函數,現在有更多種類的激活函數可以支持和處理任何神經網絡,並可選擇精度來支持浮點計算,這將使計算更加精確和可靠。改進的激活函數和優化的推理管道將使其能夠以更快的速度和更高的準確度執行更復雜和更細緻的神經網絡模型。



NPU 4 中的 SHAVE DSP 升級爲 NPU 3 中的 SHAVE DSP,其矢量計算能力是 NPU 3 的四倍,將使矢量性能整體提高 12 倍。這對於轉換器和大型語言模型 (LLM) 性能非常有用,使其更加快速和節能。增加每個時鐘週期的矢量操作可以實現更大的矢量寄存器文件大小,從而顯著提升 NPU 4 的計算能力。



總體而言,NPU 4 的性能比 NPU 3 有了大幅提升,矢量性能提高了 12 倍,TOPS 提高了 4 倍,IP 帶寬提高了 2 倍。這些改進使 NPU 4 成爲高性能和高效率的解決方案,適合性能和延遲至關重要的最新 AI 和機器學習應用。這些架構改進以及數據轉換和帶寬改進使 NPU 4 成爲管理要求極高的 AI 工作負載的頂級解決方案。


更好的 I/O:包括 Thunderbolt 4、Thunderbolt Share、Wi-Fi 7


英特爾最近在 Lunar Lake 平臺的 I/O 和連接方面取得了進展,這意味着在性能和效率方面遠遠領先於 Meteor Lake。Lunar Lake 的主要亮點包括原生 Thunderbolt 4 連接、新的 Thunderbolt Share 功能以及升級到 Wi-Fi 7 無線連接。



Thunderbolt 4 完美地建立在 Thunderbolt 3 的基礎上,從控制器的角度來看,Thunderbolt 3 並不是什麼新東西,但它確實在連接性和帶寬方面有所增強,而內部選擇是這裏的關鍵區別。現在每檯筆記本電腦都允許使用三個 Thunderbolt 端口,這使得此功能非常靈活且可用。



Thunderbolt 5 SSD 的另一項改進是讀寫速度提升了 25%,這提高了整體數據傳輸率並減少了傳輸文件所需的時間。這對於需要高數據傳輸率的應用程序(如視頻編輯和處理相當大的文件)非常重要,這樣用戶在工作中就不會出現延遲或以最小的速率延遲。



Thunderbolt Share 是 Lunar Lake 中的一項新技術。它允許多臺 PC 以高達每秒 60 幀的速度直接快速地跨系統共享屏幕、顯示器、鍵盤、鼠標和存儲。



具體來說,這在協作環境中非常重要,因爲這樣可以輕鬆快速地共享數據,從而改善工作流程。生產力任務中的實用程序允許用戶同步文件夾,並具有在 PC 之間高速拖放文件共享功能。



Lunar Lake 平臺還集成了 Wi-Fi 7,而 Meteor Lake 在無線連接方面則省略了 Wi-Fi 7。Wi-Fi 7 的這種多鏈路操作功能增加了無線信號的完整性和可靠性,並通過在所有鏈路上覆制數據包來提高吞吐量並減少延遲。這意味着即使在要求苛刻的應用程序中,性能也會更流暢,負載平衡也會更好。Wi-Fi 7 新功能的最大好處在於用戶在處理帶寬密集型任務時;它旨在讓用戶獲得穩定有效的無線連接。



它還包括 RF 干擾緩解技術,其中 DDR 時鐘頻率會自動調整以最大限度地減少對 Wi-Fi 信號的干擾。此功能可節省 50% 的內存噪聲導致的吞吐量下降;因此,從理論上講,它應該可以提升整個無線網絡的性能。用戶可以期待的另一個積極效果是即使在非常苛刻的環境中也能實現強大的連接性。



英特爾與 Meta 的合作更進一步,利用這項 Wi-Fi 7 技術來增強 VR 體驗。這進一步優化了視頻延遲性能並減少了干擾,從而使 VR 應用更加無縫和引人入勝,至少從無線連接的角度來看是如此。Wi-Fi 7 的新增強功能提供了高、可靠的速度和低延遲,可滿足 VR 應用中最具挑戰性的需求。



總而言之,與 Meteor Lake 相比,英特爾 Lunar Lake 平臺配備了 Thunderbolt 4、Thunderbolt Share 和 Wi-Fi 7,代表了連接解決方案的全面升級。這些技術帶來了全面的增強,包括大規模數據交換,有線和無線連接的速度和可靠性都有所提高,旨在擴展和改善最終用戶體驗。


全新顯卡:英特爾 Xe2、第二代 Arc Xe Core 移動版


除了 Lunar Lake,英特爾剛剛發佈了其用於移動設備的 Xe2 圖形架構,該架構由第二代 Arc Xe Core 支持。從紙面上看,它的性能和效率有了非凡的提升。除了遊戲(我們認爲 4P+4E 部分不會成功)之外,我們選擇關注英特爾圖形演示的關鍵要點,包括其中的媒體引擎。



英特爾推出的 Xe2 架構顯著提高了計算能力,與 Meteor Lake 上的 Xe-LPG 相比,它提供高達 67 個 TOP,並增加了光線追蹤單元。據英特爾稱,第二代 Xe 核心的圖形性能比 Meteor Lake 快 1.5 倍,這得益於新的 XMX 引擎。增強型 XeSS 內核可提供更好的圖形和計算性能。



特爾似乎與 Meteor Lake 有所改變的一個元素是,它提供了更靈活、更高質量的顯示輸出。在顯示引擎中,雙像素管道中的流可以組合起來進行多流傳輸。有了這種架構,端口將在四個位置可用,這將爲連接提供靈活性。英特爾的配置中還提供了一個 eDP 端口,它將增強顯示效果,以在高端、優質和功能強大的顯示器上爲輸出設置高分辨率和刷新率。



英特爾的 eDisplayPort 1.5 包含面板重放功能,該功能集成了自適應同步和選擇性更新機制。這有助於通過僅刷新屏幕發生變化的部分而不是整個顯示屏來降低功耗。這些創新不僅節省能源,而且還通過減少顯示延遲和提高同步精度來改善視覺體驗。



描繪像素處理管道是英特爾顯示引擎所依賴的基本基礎之一,每條管道支持六個平面,用於高級顏色轉換和合成。此外,它還集成了對顏色增強、顯示縮放、像素調整和 HDR 感知量化的硬件支持,確保屏幕上的圖形生動準確。該設計非常靈活,非常節能,性能經過精心設計,至少在紙面上支持各種輸入和輸出格式。到目前爲止,英特爾尚未提供任何可量化的功率指標、TDP 或其他功率元素。



在壓縮和編碼方面,Xe2 架構可無損地將顯示流壓縮率提高到 3:1,包括針對 HDMI 和 DisplayPort 協議的傳輸編碼。這些芯片功能可進一步降低數據負載,並在輸出端保持高分辨率,而不會損失視覺質量。



英特爾採用 VVC 編解碼器對視頻壓縮技術的改進意義重大。與 AV1 相比,此編解碼器可將文件大小減少 10%,並支持自適應分辨率流媒體和針對 360 度和全景視頻的高級內容編碼。這將確保流媒體的比特率較低,而不會降低質量——這是現代多媒體應用的一個基本方面。



Windows GPU 軟件堆棧從上到下都非常強大,支持 D3D、Vulkan 和 Intel VPL API 和框架。這意味着,結合這些品質可以爲市場上各種運行時和驅動程序提供全面支持,從而提高其在不同軟件環境中的整體效率和兼容性。



英特爾的 Xe2 和第二代 Arc Xe Core 顯著提高了性能、效率和靈活性。這些創新增強了英特爾在移動圖形解決方案競爭格局中的地位,增強了顯示、媒體和計算操作方面的能力。


結束語:Lunar Lake 即將於 2024 年第三季度推出


那麼,Lunar Lake 到底是什麼?我們知道 Lunar Lake 不是使用英特爾的任何節點構建的,這可能會讓一些人大喫一驚,但它確實利用了臺積電的 3 nm N3B 節點,從紙面上看,它看起來像是 Meteor Lake 的重大升級。與移動 SoC 領域的 Meteor Lake 相比,Lunar Lake 似乎是英特爾在移動 CPU 架構上的一次重大提升,標誌着特定任務處理能力的重大飛躍。現在,他們將 Lion Cove P 核與 Skymont E 核集成在一起,處理密集任務和後臺活動,以確保最大性能。


此外,NPU 4 的加入使 Lunar Lake 成爲 AI 和機器學習領域的強大競爭對手,具有“世界級”的 AI 性能,凸顯了英特爾在 AI 驅動的未來方面對 AI 的投資。然而,AMD 最近基於 Zen 5 和 Ryzen AI 300 的披露使其在 TOPS 方面處於 8 位水平的領先地位。與 AMD 不同,英特爾專注於爲 Lunar Lake 提供綜合 TOPS 的整體數字,儘管其中大部分是 NPU 和 GPU。


英特爾的系統效率在提供的幻燈片和英特爾臺北技術巡展的演示中得到了完美的展示。然而,硅片在手上的表現以及它在設備中的表現纔是真正的證據。儘管如此,隨着最新的 Xe2-LPG 和使用 Foveros 封裝技術實現的高達 32 GB 的封裝內存,整個行業對內存容量升級的限制程度仍有待觀察。



Lunar Lake 還帶來了電源管理方面的改進,包括增強的英特爾線程控制器和四陣列電源管理控制器,使 Lunar Lake 能夠動態調整以適應不斷變化的工作負載需求。由於電池壽命問題和對持久性能的需求,後者對於移動設備越來越重要。Lunar Lake 有望於 2024 年第三季度推出,雖然 Meteor Lake 的上市時間比英特爾希望的要晚,但希望 Lunar Lake 能夠保持正軌。


英特爾爲 Lunar Lake 做出的選擇讓它看起來更像是一次漸進式的飛躍,而不是對 Meteor Lake 的全面重新思考。是的,從紙面上看,英特爾通過引入新的 P 核、E 核、新的工藝節點、功率改進、新的 NPU 4 和新的 Xe2-LPG 顯卡取得了重大改進。儘管如此,英特爾未能提供任何有意義的性能數據來與市場進行比較,也沒有提供功率數據。


總而言之,Lunar Lake 表明英特爾對專注於創新工程的需求有所瞭解。從紙面上看,Lunar Lake 確實有望爲超薄輕便筆記本電腦提供更高效的性能和先進的 AI 功能。Lunar Lake 似乎更像是“看看我們能做什麼”,而不是英特爾分解移動架構的結果。與高通和 AMD 的產品相比,Lunar Lake 的表現如何還有待觀察,但很明顯,英特爾是三者中更雄心勃勃的,我們期待看到 Lunar Lake 能提供什麼。


參考鏈接

https://www.anandtech.com/show/21425/intel-lunar-lake-architecture-deep-dive-lion-cove-xe2-and-npu4/7


點這裏👆加關注,鎖定更多原創內容

*免責聲明:文章內容系作者個人觀點,半導體芯聞轉載僅爲了傳達一種不同的觀點,不代表半導體芯聞對該觀點贊同或支持,如果有任何異議,歡迎聯繫我們。



推薦閱讀

突然倒閉的國產芯片公司
先進封裝,競爭白熱化!
韓國,贏不了非存儲的喫雞遊戲
外交部長秦剛:光刻機的問題,中國有嚴重擔憂
TI降價,加入國產芯片內卷!


喜歡我們的內容就點“在看分享給小夥伴哦~