Intel Sapphire Rapids – i9-12980XE nadchodzi? Ujawniamy nowe zdjęcia nadchodzących potężnych procesorów

14 stycznia 2022,
23:59
Kacper Fryta

Pewien czas temu przeglądając Reddita r/Intel, natknąłem się na zdjęcie ukazujące procesory Sapphire Rapids wraz z odmianą Core-X ze zdjętym IHS. Zainteresowanie było tym większe, gdy post zniknął po paru godzinach z serwisu. Od tamtej pory badałem tę tajemniczą sprawę, by w poniższym artykule przedstawić wam wnioski, do których doprowadziło mnie własne śledztwo.

Intel Sapphire Rapids Xeon - postrument z logiem Intela
Na skróty
  • Wyciekły zdjęcia obrazujące serwerowe modele Xeon z serii Sapphire Rapids oraz następcę profesjonalnych modeli Cascade Lake-X, czyli Sapphire Rapids-X.
  • Procesory będą korzystać z ogromnej podstawki LGA 4677 o wymiarach 78 × 57 mm oraz wspierać będą pamięci DDR5.
  • Ich premiera przewidziana jest na drugi lub trzeci kwartał 2022 roku.
  • Następca jednostki 10980XE może przebić wydajność 32-rdzeniowej jednostki AMD Threadripper 3970X.

Na zdjęciu możemy zaobserwować nadchodzącą platformę HEDT Intela: po prawej serię Xeon na architekturze Sapphire Rapids, po lewej – Saphire Rapids-X będącą następcą Cascade Lake-X na LGA 2066. Fotografie procesorów Sapphire Rapids mogliśmy już zobaczyć w maju bieżącego roku, jednak w tamtym okresie były to wczesne próbki inżynieryjne, a najczęściej widoczne PCB było wybrakowane. Tym razem prawdopodobnie mamy do czynienia z próbkami QS – Qualified Sample – będącymi pierwowzorami gotowych jednostek.

Na PCB Sapphire Rapids widać zewnętrzny układ krzemowy, przypominający układ eDRAM znany z Broadwelli. Być może to zewnętrzny układ FIVR lub chip CXL w wersji 1.1 bądź 2.0 (odpowiednik CCIX produkowanego przez Xilinx stosowanego u AMD).

Możemy zmierzyć wielkość układów krzemowych widocznych na zdjęciu. Sapphire Rapids-X po lewej stronie posiada rdzeń o wielkości 25 × 20 mm, mniej więcej 500 mm2. Xeon po prawej to natomiast plus minus 41 × 29 mm, czyli 1189 mm2. We wcześniejszych przeciekach mogliśmy znaleźć zdjęcia pokazujące, iż wielkość układów krzemowych wynosi w rzeczywistości około 1600 mm2. Dodatkowo, poniżej widzimy niezidentyfikowany od miesięcy układ o wymiarach 5 × 7 mm, tj. 35 mm2. Mam przekonanie graniczące z pewnością, że jest to chip CXL.

Sapphire Rapids-X nadal pozostają oparte o budowę monolityczną – wersja Xeon składa się natomiast z chipletów komunikujących się ze sobą przez mostek EMIB. Ten przy wspomaganiu UPI 2.0 pozwala na piekielnie szybką wymianę danych między konkretnymi chipletami, nie wymagając do tego procesu dużych nakładów energii. Należy zaznaczyć, iż do produkcji mostków EMIB nie są wymagane spore ilości krzemu.

Źródło: Intel

Oprócz tego procesory serwerowe Xeon doczekają się DSA – Intel Data Streaming Accelerator. Są to moduły do sprzętowej akceleracji wykonywanych zadań w celu odciążenia ich od problemów związanych z ruchem danych, co zwiększa efektywność i wydajność rdzeni. Według Intela obecność DSA pozwala na wykonanie 39% więcej instrukcji przez jednostkę.

Kolejnym modułem jest Intel QAT – Intel Quick Assist Technology Acceleration Engine. Jego zadanie to przyspieszenie wykonywanych zadań związanych w głównej mierze z kryptografią oraz kompresją i dekompresją danych. Ten ma zmniejszyć wykorzystanie jednostki o 98%.

Procesory będą współpracowały z nowym gniazdem LGA 4677 o nazwie kodowej W790 i wymiarach 78 × 57 mm, wspierającym kości typu DDR5. Samo PCB będzie miało wymiary 75 × 55 mm. Muszę nadmienić, iż procesory Xeon wyposażone w dodatkowe moduły HBM2e najprawdopodobniej otrzymają osobne gniazdo o wymiarach 100 × 57 mm, a więc samo PCB będzie wielkości 97 × 55 mm.

Przecieki wydajności

W lipcu tego roku w bazie GeekBench pojawił się wpis na temat 20-rdzeniowej wersji próbki inżynieryjnej Xeon Sapphire Rapids – możemy to poznać po bardzo niskim taktowaniu w wysokości 1,5 GHz. Co ciekawe dane znajdujące się w pliku JSON wskazują, iż ten mógł przez cały czas operować na niespełna 4,7 GHz na wszystkich rdzeniach. 

Zwróćcie uwagę, iż jest to platforma dwuprocesorowa, stąd mówimy o 20, a nie o 40 rdzeniach!

Jednostki mają zapewnić wsparcie dla 56 rdzeni Golden Cove, czyli tych, które dostępne są w desktopowych procesorach 12. generacji Intel Alder Lake. Pamięć L1 urosła z 32 KB do 48 KB na rdzeń, a cache L2 wzrósł z 1 MB do 2 MB. Niesamowity wzrost odnotowała natomiast pamięć podręczna L3, wykazując 3,75 MB na rdzeń (zapewne będzie to pamięć współdzielona). Oznacza to, że najmocniejsze 56-rdzeniowe modele mogą otrzymać aż 210 MB pamięci L3 SmartCache. Wyobrażacie sobie, jaką wydajność będzie posiadać pojedynczy rdzeń mający dostęp do 210 MB cache’u?

Serwerowe jednostki Xeon oczywiście otrzymają wsparcie dla 8-kanałowej pamięci DDR5, ponadto dostaną do dyspozycji aż 80 Linii PCIe 5. generacji czy też wsparcie dla 64 GB wbudowanej pamięci HBM2e. Ta będzie w stanie zastąpić pamięć RAM, wspomagać ją bądź działać jako cache o przepustowości 1 TB/s (pamięć ta nie będzie wbudowana we wszystkie modele) oraz TDP na poziomie 350 W. Według Intela powinniśmy spodziewać się 32-procentowego wzrostu wydajności w porównaniu do konkurencyjnych modeli AMD.

Potencjalne zmiany oraz wzrost wydajności w oparciu o Alder Lake

Rozmarzmy się na chwilę i spróbujmy przenieść te wyniki na układy Core-X, służące profesjonalnej pracy, przeznaczone dla zdecydowanie szerszej grupy odbiorców aniżeli układy Xeon.

Poprzednio rodzina zamknęła się na 18-rdzeniowych układach 10980XE z rodziny Cascade Lake-X, jednakże rozpoczęła od 4-rdzeniowych modeli Kaby Lake-X 7640x. Dość wątpliwym jest, aby Intel ponownie rozszerzał swoją rodzinę tak mocno, gdy widzimy wypieranie modeli 4-rdzeniowych przez AMD oraz Intela. W przypadku AMD model R3 5300x nie powstał, Intel natomiast modele 11. generacji i3 jedynie odświeżył – nie bazują one na nowej architekturze. 

Patrząc również na to, iż wymiary rdzenia nie zmieniły się mimo zmniejszenia litografii, możemy spodziewać się wprowadzenia 24-rdzeniowych i 48-wątkowych modeli Core-X. 

Rdzenie Golden Cove zastosowane w rodzinie Sapphire Rapids będą produkowane w procesie 10 nm Enhanced SuperFin (Intel 7), co powinno umożliwić im bezproblemowe przekroczenie taktowania 5 GHz tak samo, jak robiła to mobilna architektura Tiger Lake. Te oferują aż 28-procentowy wzrost IPC w porównaniu do swoich poprzedników oraz prawie trzykrotny wzrost cache’u L3 czy też podwojenie prędkości szyny DMI wykorzystywanej do komunikacji z resztą komponentów zestawu komputerowego.

Przechodząc do konkretów – posługując się testami dostępnymi w bazie cgdirector, dowiedziałem się, iż wydajność pojedynczego rdzenia procesora i9-12900K w programie Cinebench R23 znajduje się na poziomie 2003 punktów. Porównując to do 10. generacji procesorów, i9-10900K, która w tym teście uzyskała wynik 1415 punktów, widzimy blisko 42-procentowy wzrost wydajności pojedynczego rdzenia – jest to astronomiczny wynik!

AMD Epyc 7702 dla porównania – wewnątrz znajduje sie chip I/O, na zewnątrz natomiast widać chiplety zawierające rdzenie. Źródło: Fritzchens Fritz / Flickr / Wikipedia

i9-10980XE zebrał w teście pojedynczego rdzenia 1063 punkty. Czy możemy po prostu dodać do wyniku 42%, uzyskując w ten sposób ostateczną wydajność? Nie do końca, a to z dwóch głównych powodów:

  • Cache L3. Wszystkie konsumenckie procesory Intela od lat posiadają ilość pamięci podręcznej równą 2 MB na rdzeń. Im większa jest ta pamięć, tym więcej instrukcji może być w niej przechowywane. Gdy natomiast jej limity zostaną wyczerpane, procesor sięga do wolniejszej pamięci RAM.

    Jednostki HEDT z rodziny Cascade Lake-X posiadają jedynie 1,375 MB pamięci przypadającej na każdy rdzeń – dosyć mało. Alder Lake natomiast ma w swoim zanadrzu aż 3,75 MB cache trzeciego poziomu dostępnej dla każdego rdzenia. Obydwie wymienione platformy używają technologii SmartCache, więc każdy z rdzeni ma tak naprawdę dostęp do całkowitej ilości cache. Zaczyna to mieć duże znaczenie przy obciążaniu całej jednostki, a nie wyłącznie pojedynczego rdzenia.
  • Temperatura. Nie oszukujmy się, o wiele łatwiej jest schłodzić 8-rdzeniowy procesor, aniżeli 18-rdzeniowy. Pobór energii i9-12900K zamyka się w okolicy 300 W nawet po overclockingu – i9-10980XE natomiast potrafi zjeść bagatela 750 W. Wzrost temperatury do niebezpiecznego poziomu będzie wiązać się ze spadkiem taktowań, o które o wiele łatwiej przy jednostkach HEDT – z tego powodu to one w głównej mierze wyposażone są w custom loopy.

Różnica w ilości pamięci dla instrukcji trzeciego poziomu między architekturą Cascade Lake oraz Alder Lake to 87,5% – w przypadku nadchodzącej wersji HEDT będzie to 272%.

Nadchodzące 24-rdzeniowe jednostki postrachem dla 64-rdzeniowych Threadripperów?

Postarajmy się teraz przenieść uzyskane wyniki na platformę Sapphire Rapids-X. Następca Cascade Lake-X w postaci i9-12980XE byłby 18-rdzeniową i 36-wątkową jednostką z dostępem do 22,5 MB pamięci L2 oraz 67,5 MB pamięci SmartCache L3. Zakładając, iż te jednostki składać się będą wyłącznie z rdzeni typu „Performance”, możemy spodziewać się wyników w Cinebenchu R23 na poziomie ~1900 punktów jednordzeniowo oraz bagatela ~46 000 punktów, uwzględniając efektywne skalowanie jednostki. Jest to wynik na poziomie 32-rdzeniowego AMD Threadripper 3970X.

Wynik jednego z porównań, które możecie zobaczyć klikając w link widoczny poniżej

Gdyby jednak Intel wypuścił 24-rdzeniową i 48-wątkową wersję z 30 MB pamięci L2 oraz 90 MB cache L3, moglibyśmy szacować, iż wielowątkowy wynik zakręciłby się w okolicy 61 000 punktów, a po OC przebijając barierę 70 000 punktów, doganiając tym samym najszybszą 64-rdzeniową jednostkę AMD Threadripper 3995WX – po prostu wow!

Jeśli chodzi o wydajność w grach, postanowiłem posłużyć się w tym wypadku testami, które przeprowadził trzy lata temu mój znajomy (pozdrawiam, Konradzie!) na kanale Extreme Hardware w oparciu o podkręconą jednostkę i9-7960X @4,7 GHz + 3,1 GHz mesh oraz kartę Titan V, z pamięciami G.Skill Trident Z ustawionymi na 3800 MHz oraz opóźnieniach CL16-16-16 T1 w konfiguracji 4 x 8 GB oraz 2 x 16 GB. Wtedy większość gier nie czerpała większych benefitów z pamięci działających w Quad-channel aniżeli w dualu, jednakże nierzadko możemy zaobserwować wzrost w okolicy 20–30% wyników 1% low – wskazuje to w skrócie na fakt, iż klatki nie spadają tak nisko, zapewniając płynniejsza rozgrywkę w newralgicznych momentach.

Jeśli chodzi o różnicę wynikającą z liczby rdzeni, powinniśmy się spodziewać przyrostu w okolicy 30% w grach typu Anno 1800 bądź Ashes of the Singularity, w przypadku reszty tytułów maksymalnie będzie to 5-10%.

Intel Sapphire Rapids – potężny kontratak nadchodzi?

Podsumujmy sobie wszystkie informacje, które udało nam się do tej pory zdobyć. Pierwszy raz w ciągu ostatniego dziesięciolecia będziemy obserwować tak duży wzrost IPC z generacji na generację wynoszący niespełna 40%. Najnowsze jednostki będą obsługiwać natywnie moduły DDR5 oraz magistrale PCIe 5gen, ulegnie drastycznemu zwiększeniu ilość pamięci cache każdego poziomu, prędkość szyny DMI oraz otrzymamy nowe gniazdo – LGA 4766. Te będzie obsługiwać zarówno jednostki serwerowe Xeon, jak i Core-X przeznaczone dla entuzjastów. Niektóre z modułów serwerowych zostaną dodatkowo wyposażone we wbudowane kości HBM2e o przepustowości 1 TB/s mogące zastąpić w pełni pamięć RAM, otrzymają również technologię DSA oraz Intel QAT. Topowe jednostki Core-X przeznaczone na rynek „konsumencki” będą rywalizowały z najwyższymi w hierarchii 64-rdzeniowymi modelami Threadripper od AMD.

Widzimy, że Intel szykuje potężną kontrofensywę na jednostki Threadripper – nie zapominajmy natomiast, iż AMD nie zaprezentowało do tej pory najnowszych jednostek Threadripper 5000 opartych o rdzenie Zen3. Najbliższe miesiące będą nad wyraz ciekawe.

Premiera rodziny Sapphire Rapids przewidziana jest na drugi lub trzeci kwartał 2022 roku.