前言：酷睿Ultra來了，但目前的解析著實有些無聊

最近幾天，關於英特爾第一代酷睿Ultra（並非14代酷睿）的架構解析內容開始多了起來。

一方面，這是因為英特爾在9月19剛剛召開了他們今年的“架構日”活動，並公佈了了Intel 4製程、Foveros封裝、Meteor Lake架構的很多信息。

另一方面，此前在今年8月份，英特爾方面曾邀請了一些媒體去參觀了他們的封測工廠、實驗室，並分享了部分新品的信息，而這些信息近日也正式解禁。

正因如此，現在可以看到有許多內容都在討論英特爾新款處理器的種種細節，並分析它的製程、半導體材料、封裝技術的原理，以及所謂“一分四”的設計等等。

但縱觀這些內容大家可能會發現一個現象，它們雖然看似講了很多很細節的東西，但多半都只是“看圖說話”，照著官方PPT做解說，並沒有太多自己的看法或對比分析。因此也就導致這些關於“酷睿Ultra”的解析內容，有些過於相似。

為什麼會這樣？一方面，當然是因為目前英特爾的新架構從嚴格意義上來說，還沒有真正地發佈、上市，所以哪怕有些已經拿到了產品、知道了更詳細的參數，也不能說出來。另一方面，英特爾此次“架構日”上公佈的產品資料，本質還是過於偏技術向。如果只是照著這些PPT去寫，確實很難讓普通消費者感興趣。

不過以上這些對於我們三易生活來說其實都不是問題，因為我們通過相關渠道，得知了一些更詳細的產品資料。而且大家只要看過以往的相關內容就會知道，我們對於英特爾下代架構的關注、分析準備，也不是一天兩天的事情了。所以在看到這一輪的“分析內容”後我們意識到，是時候來寫一些其他人所不知道、或是不能寫的東西了。

首先，我們來詳細聊聊所謂的“一分四”

其實早在幾年前，我們就曾在相關內容中指出，英特爾是整個消費電子行業裡對“製程數字”態度最誠懇、最不“吹牛”的廠商。

但這種“誠懇”卻帶來了兩個問題，其一是英特爾從來不會宣傳製程上的“小改款”，比如大家都知道，從第5代到第11代酷睿的桌面版，英特爾方面一直聲稱他們用的是14nm製程。但實際上，這個“14nm”本身的工藝細節是一直有在改進的，其晶體管密度、處理器所能達到的頻率等等實上也都在提升，而且提升幅度並不小。但英特爾自己不宣傳，就反而造成了部分消費者的誤解，以為他們的製程一直都沒有進步。

其次，就是按照英特爾以往的做法，他們的處理器指的是整個核心“統一”製程的思路。也就是本身需要高頻、需要高密度的計算部分，與其實並不需要高頻、高密度的IO、核顯、緩存等部分，都是從一塊晶圓上切出來的。

很顯然這就帶來了很大的浪費，也提高了製造成本，還不利於宣傳。看看隔壁的AMD，早在初代銳龍上就已經實現了計算核心和IO核心的分製程製造，只把計算部分用先進製程，宣傳時也不提及IO部分的製程。

或許是因為明白了這一點，所以在第一代酷睿Ultra、或者說Meteor Lake架構上，英特爾總算是搞出了他們的模塊化設計。其中只有CPU核心（性能P核+能效E核）部分使用英特爾自家的“Intel 4”製程打造，而ARC核顯、SoC核心、IO控制器等部件，則都會採用5nm、7nm等更低成本的工藝、甚至包括外包（臺積電）生產，以降低成本、提高良品率。

但是與競爭對手僅僅將不同功能模塊單純焊接在同一個PCB上，靠PCB內部的銅電路進行通訊的做法相比，英特爾在模塊之間的互聯方式上要想得更“細”一點。是字面意思上的“細”，因為Metor Lake模塊之間採用了硅晶片直接堆疊的方式，來實現電氣互聯。

這樣做的好處是什麼？很簡單，模塊之間的互聯路徑短了，延遲就降低了、帶寬也大大增加了。於是，它也就解決了模塊化CPU設計往常可能會出現的一些“大問題”。

不退步的內存控制器，這本身其實就是進步

在第一代酷睿Ultra之前，英特爾CPU內部的計算模組（CPU核心）和內存控制器、緩存、核顯，都是基於相同的製程、在一整塊晶圓上刻出來的。而現在換了新架構之後，不同的模組現在變成了用不同的晶圓“粘”在一起了。

那麼這會造成什麼問題？沒錯，從理論上來說，這會導致計算模塊和其他模塊之間互聯線路的電氣性能退步，從而可能反而造成CPU內存頻率下降、緩存延遲增大等問題。

有沒有覺得很眼熟？沒錯，這些現象前幾年我們在隔壁家的處理器上其實就已經見到過了。但是英特爾這次真正厲害的地方，就在於他們成功規避了這些原本可能發生的退步現象。

從我們三易生活拿到的獨家資料來看，移動版第一代酷睿Ultra處理器支持至少四種內存頻率，分別是DDR5 1R 5600MHz、DDR5 2R 4400MHz，LPDDR5 6400MHz，以及LPDDR5X 7467MHz。

與目前的13代酷睿移動版相比，移動版第一代酷睿Ultra的內存兼容頻率，在所有類型的內存上都沒有降低，這就證明英特爾成功解決了模塊化CPU可能面臨的內部通信壁壘問題。或者也可以反過來理解為，他們選擇一直等到解決了這些問題、確保新的模塊化CPU設計不會導致部分性能參數下降為止，才切換到了這一新設計上。而這種“不讓用戶為新技術短板買單”的態度，顯然是值得點讚的。

頻率低了、緩存大了，我們的“夢想”也得以實現

就在不久前我們三易生活還曾感嘆，最近幾年的CPU設計大有重新走上“高頻路線”，以發熱和功耗強行換取性能增長的危險。但是在第一代酷睿Ultra上，情況很可能發生了良性的轉變。

我們三易生活結合目前各方的消息源，整理出了上面這張表格。從中可以看到，與12代、13代的移動版45W酷睿相比，新的酷睿Ultra似乎主頻有著比較明顯的降低，同時將L1緩存和L2緩存進行了增大，並新增了位於SoC模塊裡的128MB系統緩存。

很顯然，這“恰好”符合了我們此前對於CPU發展還是應該追求IPC、大緩存、高併發，而非高主頻方向的期望。不過值得注意的是，目前的頻率相關數據還不能代表最終上市的狀態，但基本可以確定的是，最終上市的版本主頻依然要低於13代酷睿。也就是說，新架構這一次至少在“破除頻率迷信”這個維度，走出了正確的一步路。

當然，熟悉英特爾以往產品線發展規律的朋友可能馬上就會想到，既然這一代的酷睿Ultra頻率降低了，那麼有沒有一種可能，英特爾在下代產品上“吃透”新制程和新架構後，會推出大幅提升頻率的“半代升級”型號呢？

別說，確實有這種可能。但從目前已知的信息來看，英特爾似乎還是更急於在短期內完成製程和架構的多代跨越。所以即便Meteor Lake將來也有“Refresh”，我們推測其產品規模可能也並不大，或許只會限定在少數細分產品線上。

最後關於新的內置NPU設計，我們有點想法

想必大家都已經知道了，英特爾這一次為Meteor Lake架構集成了NPU單元，使得其具備了獨立的低功耗AI加速能力。

請注意，這裡面有兩點是需要特別強調的。第一是這並非英特爾的第一款NPU設計，因為他們早在多年前就已經有NPU產品了，只不過是第一次集成到消費級CPU裡而已。

183644467203093025670049intel-neural-compute-stick-2.jpg

Meteor Lake的集成NPU，和這玩意或多或少有些聯繫

其次，實際上從10代酷睿-X開始，英特爾就已經為旗下CPU本身添加了AI、深度學習相關的加速指令集，而且在Xe、ARC架構的GPU裡，也都具備AI加速的相關單元。

從目前的官方資料來看，Meteor Lake支持異構AI計算、並不只依賴NPU

所以這就讓我們產生了一些大膽的想法，一是Meteor Lake、或者說“第一代酷睿Ultra”的AI加速功能，到底是隻依賴於新集成的NPU，還是可以實現CPU、GPU、NPU，甚至外置獨立顯卡的“異構加速計算”？

183818175175164747694744QQ圖片20230202163709.jpg

我們的測試平臺，早已準備多時

第二就是從此前洩露的一些信息來看，Meteor Lake的NPU會得到微軟Windows系統的原生支持，甚至可以直接在任務管理器裡看到NPU的佔用率。這就不禁令我們感到好奇，如果使用一塊內置DLBoost指令集的英特爾老款CPU、搭配ARC獨顯，再插上英特爾的外置NPU計算棒，這套組合是否也能在屆時的新版Windows系統、新版驅動下，享受到“AI加速”的好處呢？

說實在的，針對這個問題，我們三易生活已經準備了很久，或許不久後就能得到一些有趣的答案。我們相信，如果英特爾允許帶有DLBoost的老款CPU+ARC獨顯+NPU計算棒的組合也能受益於新驅動的加成，那麼對於現有的用戶來說，或許將會有助於鞏固他們的用戶粘性。

【本文部分圖片來自網絡】

推薦閱讀：

雷電5標準解析：最高120G帶寬、更強但也更貴了

剛剛發佈的雷電5接口標準，這些信息更值得關注。

不甘人後，字節跳動如今也開始提供公共DNS了

對於字節跳動來說，此舉顯然不是“重複造輪子”。

雷電5標準解析：最高120G帶寬、更強但也更貴了

不甘人後，字節跳動如今也開始提供公共DNS了

相關文章