-
前言:酷睿Ultra來了,但目前的解析著實有些無聊
最近幾天,關於英特爾第一代酷睿Ultra(並非14代酷睿)的架構解析內容開始多了起來。
一方面,這是因為英特爾在9月19剛剛召開了他們今年的“架構日”活動,並公佈了了Intel 4製程、Foveros封裝、Meteor Lake架構的很多信息。
另一方面,此前在今年8月份,英特爾方面曾邀請了一些媒體去參觀了他們的封測工廠、實驗室,並分享了部分新品的信息,而這些信息近日也正式解禁。
正因如此,現在可以看到有許多內容都在討論英特爾新款處理器的種種細節,並分析它的製程、半導體材料、封裝技術的原理,以及所謂“一分四”的設計等等。
但縱觀這些內容大家可能會發現一個現象,它們雖然看似講了很多很細節的東西,但多半都只是“看圖說話”,照著官方PPT做解說,並沒有太多自己的看法或對比分析。因此也就導致這些關於“酷睿Ultra”的解析內容,有些過於相似。
為什麼會這樣?一方面,當然是因為目前英特爾的新架構從嚴格意義上來說,還沒有真正地發佈、上市,所以哪怕有些已經拿到了產品、知道了更詳細的參數,也不能說出來。另一方面,英特爾此次“架構日”上公佈的產品資料,本質還是過於偏技術向。如果只是照著這些PPT去寫,確實很難讓普通消費者感興趣。
不過以上這些對於我們三易生活來說其實都不是問題,因為我們通過相關渠道,得知了一些更詳細的產品資料。而且大家只要看過以往的相關內容就會知道,我們對於英特爾下代架構的關注、分析準備,也不是一天兩天的事情了。所以在看到這一輪的“分析內容”後我們意識到,是時候來寫一些其他人所不知道、或是不能寫的東西了。
-
首先,我們來詳細聊聊所謂的“一分四”
其實早在幾年前,我們就曾在相關內容中指出,英特爾是整個消費電子行業裡對“製程數字”態度最誠懇、最不“吹牛”的廠商。
但這種“誠懇”卻帶來了兩個問題,其一是英特爾從來不會宣傳製程上的“小改款”,比如大家都知道,從第5代到第11代酷睿的桌面版,英特爾方面一直聲稱他們用的是14nm製程。但實際上,這個“14nm”本身的工藝細節是一直有在改進的,其晶體管密度、處理器所能達到的頻率等等實上也都在提升,而且提升幅度並不小。但英特爾自己不宣傳,就反而造成了部分消費者的誤解,以為他們的製程一直都沒有進步。
其次,就是按照英特爾以往的做法,他們的處理器指的是整個核心“統一”製程的思路。也就是本身需要高頻、需要高密度的計算部分,與其實並不需要高頻、高密度的IO、核顯、緩存等部分,都是從一塊晶圓上切出來的。
很顯然這就帶來了很大的浪費,也提高了製造成本,還不利於宣傳。看看隔壁的AMD,早在初代銳龍上就已經實現了計算核心和IO核心的分製程製造,只把計算部分用先進製程,宣傳時也不提及IO部分的製程。
或許是因為明白了這一點,所以在第一代酷睿Ultra、或者說Meteor Lake架構上,英特爾總算是搞出了他們的模塊化設計。其中只有CPU核心(性能P核+能效E核)部分使用英特爾自家的“Intel 4”製程打造,而ARC核顯、SoC核心、IO控制器等部件,則都會採用5nm、7nm等更低成本的工藝、甚至包括外包(臺積電)生產,以降低成本、提高良品率。
但是與競爭對手僅僅將不同功能模塊單純焊接在同一個PCB上,靠PCB內部的銅電路進行通訊的做法相比,英特爾在模塊之間的互聯方式上要想得更“細”一點。是字面意思上的“細”,因為Metor Lake模塊之間採用了硅晶片直接堆疊的方式,來實現電氣互聯。
這樣做的好處是什麼?很簡單,模塊之間的互聯路徑短了,延遲就降低了、帶寬也大大增加了。於是,它也就解決了模塊化CPU設計往常可能會出現的一些“大問題”。
-
不退步的內存控制器,這本身其實就是進步
在第一代酷睿Ultra之前,英特爾CPU內部的計算模組(CPU核心)和內存控制器、緩存、核顯,都是基於相同的製程、在一整塊晶圓上刻出來的。而現在換了新架構之後,不同的模組現在變成了用不同的晶圓“粘”在一起了。
那麼這會造成什麼問題?沒錯,從理論上來說,這會導致計算模塊和其他模塊之間互聯線路的電氣性能退步,從而可能反而造成CPU內存頻率下降、緩存延遲增大等問題。
有沒有覺得很眼熟?沒錯,這些現象前幾年我們在隔壁家的處理器上其實就已經見到過了。但是英特爾這次真正厲害的地方,就在於他們成功規避了這些原本可能發生的退步現象。
從我們三易生活拿到的獨家資料來看,移動版第一代酷睿Ultra處理器支持至少四種內存頻率,分別是DDR5 1R 5600MHz、DDR5 2R 4400MHz,LPDDR5 6400MHz,以及LPDDR5X 7467MHz。
與目前的13代酷睿移動版相比,移動版第一代酷睿Ultra的內存兼容頻率,在所有類型的內存上都沒有降低,這就證明英特爾成功解決了模塊化CPU可能面臨的內部通信壁壘問題。或者也可以反過來理解為,他們選擇一直等到解決了這些問題、確保新的模塊化CPU設計不會導致部分性能參數下降為止,才切換到了這一新設計上。而這種“不讓用戶為新技術短板買單”的態度,顯然是值得點讚的。
-
頻率低了、緩存大了,我們的“夢想”也得以實現
就在不久前我們三易生活還曾感嘆,最近幾年的CPU設計大有重新走上“高頻路線”,以發熱和功耗強行換取性能增長的危險。但是在第一代酷睿Ultra上,情況很可能發生了良性的轉變。
我們三易生活結合目前各方的消息源,整理出了上面這張表格。從中可以看到,與12代、13代的移動版45W酷睿相比,新的酷睿Ultra似乎主頻有著比較明顯的降低,同時將L1緩存和L2緩存進行了增大,並新增了位於SoC模塊裡的128MB系統緩存。
很顯然,這“恰好”符合了我們此前對於CPU發展還是應該追求IPC、大緩存、高併發,而非高主頻方向的期望。不過值得注意的是,目前的頻率相關數據還不能代表最終上市的狀態,但基本可以確定的是,最終上市的版本主頻依然要低於13代酷睿。也就是說,新架構這一次至少在“破除頻率迷信”這個維度,走出了正確的一步路。
當然,熟悉英特爾以往產品線發展規律的朋友可能馬上就會想到,既然這一代的酷睿Ultra頻率降低了,那麼有沒有一種可能,英特爾在下代產品上“吃透”新制程和新架構後,會推出大幅提升頻率的“半代升級”型號呢?
別說,確實有這種可能。但從目前已知的信息來看,英特爾似乎還是更急於在短期內完成製程和架構的多代跨越。所以即便Meteor Lake將來也有“Refresh”,我們推測其產品規模可能也並不大,或許只會限定在少數細分產品線上。
-
最後關於新的內置NPU設計,我們有點想法
想必大家都已經知道了,英特爾這一次為Meteor Lake架構集成了NPU單元,使得其具備了獨立的低功耗AI加速能力。
請注意,這裡面有兩點是需要特別強調的。第一是這並非英特爾的第一款NPU設計,因為他們早在多年前就已經有NPU產品了,只不過是第一次集成到消費級CPU裡而已。
Meteor Lake的集成NPU,和這玩意或多或少有些聯繫
其次,實際上從10代酷睿-X開始,英特爾就已經為旗下CPU本身添加了AI、深度學習相關的加速指令集,而且在Xe、ARC架構的GPU裡,也都具備AI加速的相關單元。
從目前的官方資料來看,Meteor Lake支持異構AI計算、並不只依賴NPU
所以這就讓我們產生了一些大膽的想法,一是Meteor Lake、或者說“第一代酷睿Ultra”的AI加速功能,到底是隻依賴於新集成的NPU,還是可以實現CPU、GPU、NPU,甚至外置獨立顯卡的“異構加速計算”?
我們的測試平臺,早已準備多時
第二就是從此前洩露的一些信息來看,Meteor Lake的NPU會得到微軟Windows系統的原生支持,甚至可以直接在任務管理器裡看到NPU的佔用率。這就不禁令我們感到好奇,如果使用一塊內置DLBoost指令集的英特爾老款CPU、搭配ARC獨顯,再插上英特爾的外置NPU計算棒,這套組合是否也能在屆時的新版Windows系統、新版驅動下,享受到“AI加速”的好處呢?
說實在的,針對這個問題,我們三易生活已經準備了很久,或許不久後就能得到一些有趣的答案。我們相信,如果英特爾允許帶有DLBoost的老款CPU+ARC獨顯+NPU計算棒的組合也能受益於新驅動的加成,那麼對於現有的用戶來說,或許將會有助於鞏固他們的用戶粘性。
雷電5標準解析:最高120G帶寬、更強但也更貴了
剛剛發佈的雷電5接口標準,這些信息更值得關注。