News

Skrót konferencji NVIDIA GTC – premiera kart z serii RTX 4000

20 września 2022,

21:42

Kacper Fryta

Dzisiaj o godzinie 17:00 rozpoczęła się wyczekiwana przez wielu konferencja NVIDIA GTC. Czy zaprezentowano nadchodzące karty graficzne? O czym była mowa oraz czym jest NVIDIA Omniverse?

Cooler Master prezentuje obudowę TD500 Max z preinstalowanym AiO oraz zasilaczem

Nvidia na krótko wyprzedziła Amazon pod względem wartości rynkowej

Doładowania portfela PS Store na mega promocji! Np. 200 zł za jedyne ~170 zł, a 100 zł za ~85 zł

Jen-Hsun Huang, CEO NVIDIA, od razu przeszedł do konkretów przedstawiając, o czym będzie mowa w czasie konferencji. Dostajemy więc informacje o rozmowach w kwestii NVIDIA RTX, NVIDIA AI oraz NVIDIA Omniverse. Ale może zanim zaczniemy skrót konferencji, wytłumaczę, czym są wyżej wymienione terminy.

NVIDIA RTX – generacja rodziny kart firmy umożliwiająca renderowanie fotorealistycznych scen trójwymiarowych poprzez analizę promieni świetlnych – również tych załamanych oraz odbitych od różnych powierzchni.
NVIDIA AI – jest to zbiór sztucznych inteligencji służących do optymalizacji wszelakich procesorów technologicznych, medycznych czy też naukowych, włączając w to uczenie maszynowe.
NVIDIA Omniverse – jest to platforma współpracy graficznej w czasie rzeczywistym stworzona przez NVIDIA. Jest stosowana w branży efektów wizualnych i przemysłowych symulacji. Omniverse w dużym stopniu wykorzystuje format uniwersalnego opisu sceny.

RacerX – najbardziej zaawansowany silnik 3D oparty o NVIDIA Omniverse

Takimi właśnie słowami Jen-Hsun Huang opisuje najnowszy silnik 3D. Wskazuje on, iż jest to najbardziej rozbudowany, w pełni interaktywny silnik oparty na prawach fizyki. Oświetlenie, odbicia jak i załamania światła są renderowane w czasie rzeczywistym – silnik jest pozbawiony prerenderowanych, sztucznych symulacji oświetlenia. Wykorzystanym przykładem jest tutaj wypełniony po brzegi różnymi obiektami pokój, z odsłoniętymi żaluzjami, o różnych porach dnia, pokazując w ten sposób zmiany oświetlenia.

Następnie jako przykład ukazane jest auto – według słów Huanga każda z jego części i połączenie jest indywidualnie symulowane, a fizyczne właściwości, jak i kształt konkretnych elementów ma wpływać na zachowywanie się pojazdu podczas jazdy.

Żaden z elementów znajdujących się w silniku NVIDIA Omniverse nie jest statycznym obiektem, a jest symulowany jako przedmiot, materiał czy też płyn. Dym, ogień czy pył są renderowane przy pomocy wolumetrii w celu oddania realistycznego zachowania tychże obiektów.

Przyszłe gry nie będą miały gotowych światów. Przyszłe gry będą symulacjami.
Jen-Hsun Huang, NVIDIA GTC 2022

Według słów CEO „Zielonych”, silnik RacerX w trakcie pokazu pracował z wykorzystaniem wyłącznie jednej karty graficznej. Zastanawiacie się jakiej?

Ada Lovelace – NVIDIA 3rd gen RTX 4000 series

Nazwa oczywiście pochodzi od imienia brytyjskiej matematyczki żyjącej w latach 1815-1852, która jest uważana za pierwszą programistkę w historii. Najnowsza architektura kart graficznych została oparta o 4 nm proces technologiczny od TSMC, co pozwoliło na upakowanie 18.000 rdzeni CUDA oraz 76 miliardów tranzystorów, co z kolei odpowiada zwiększeniu ilości tranzystorów o 70% w porównaniu do poprzedniej generacji.

Ada Lovelace jest wyposażona w najnowsze generacje swoich procesorów:

Procesory strumieniujące

Następna generacja procesorów strumieniujących o wydajności 90 TFLOP – jest to wynik niemalże dwukrotnie wyższy w porównaniu do architektury Ampere. Oprócz tego jednostki SM pobierają dwukrotnie mniej energii. Dzięki zastosowaniu nowej technologii Shader Execution Reordering która w locie zmienia zastosowanie jednostek SM, zwiększono wydajność RT nawet trzykrotnie.

*Shader Execution Reordering – technologia, która na bieżąco jest w stanie zmieniać kolejność wykonywania operacji strumieniowych w celu ich uporządkowania, czego skutkiem jest lepsza utylizacja zasobów karty graficznej.

Rdzenie RT

Następna generacja rdzeni RT z podwojoną wydajnością w obliczeniu promienia świetlnego (ray-triangle intersection throughput) o wydajności ponad 200 TFLOP. Oprócz tego trzecia generacja rdzeni RT została wyposażona w nowe jednostki: Opacity Micromap Engine przyśpieszający renderowanie promieni poprzez wczesne obliczanie geometrii (alpha-test geometry) nawet dwukrotnie oraz „Micro-Mesh Engine” zwiększający szczegółowość obiektów geometrycznych bez wykorzystania BVH, nie używając przy tym dodatkowej przestrzeni w pamięci.

*BVH – drzewo brył organicznych – struktura danych stosowana w grafice komputerowej do akceleracji algorytmu śledzenia promieni oraz w symulacjach fizyki ciał do akceleracji detekcji kolizji w celu przechowywania i szybkiego wykonywania zapytań dotyczących obiektów w przestrzeni trójwymiarowej.

Rdzenie Tensor

Czwarta generacja rdzeni Tensor została wyposażona w „Hopper FP8 Transformer Engine” o wydajności 1.4 petaFLOP. Od teraz rdzenie Tensor potrafią pracować w połowicznej precyzji, skutkując zwiększeniem mocy obliczeniowej oraz przyśpieszeniem czasu pracy.

DLSS 3 – przełom w renderowaniu grafiki komputerowej

Huang opisuje DLSS jako jedno z największych osiągnięć firmy. Technologia wykorzystuje „autoenkoder splotowy” (convolutional autoencoder), pobiera obecnie wyświetlaną klatkę w niskiej rozdzielczości oraz poprzednio wyrenderowaną klatkę w wysokiej rozdzielczości, a na ich podstawie renderuje piksel po pikselu obecnie wyświetlaną klatkę – tak to wyglądało do wersji DLSS 2.1.

Technologia AI była trenowana z wykorzystaniem obrazów o rozdzielczości 16 K w celu uzyskania jak najlepszych efektów. Sztuczna inteligencja dostawała najpierw obraz referencyjny w dużej rozdzielczości, następnie w bardzo niskiej rozdzielczości, po czym musiała odtworzyć obraz z niskiej rozdzielczości z powrotem do wysokiej rozdzielczości. Te dane były używane w celu jej trenowania oraz ulepszania. Sytuacja ta była powtarzana dziesiątki tysięcy razy do momentu, w którym sieć neuronowa potrafiła odtwarzać obraz w bardzo wysokiej rozdzielczości bez obecności zaawansowanych błędów graficznych.

Ada Lovelace wykorzystuje DLSS 3 – technologię, która generuje zupełnie nowe klatki zamiast pojedynczych różnic w pikselach. Nowa generacja technologii DLSS została wyposażona w cztery nowe komponenty: Optical Flow Accelerator, game engine motion vectors” convolutional autoencoder AI frame generator oraz Reflex super-flow latency pipeline.

Optical Flow Accelerator – technologia, która dostarcza sieci neuronowej informacji o kierunku oraz prędkości poruszania się piksela klatka po klatce. Pary klatek z gry łącznie z geometrią obiektów oraz wektorami ruchu pikseli (pixel motion vectors) są dostarczane do sieci neuronowej w celu stworzenia klatek pośrednich. To redukuje artefakty generowania obrazu głównie w przypadku cieni, pyłu czy też odbić świetlnych.

Technologia jednocześnie przetwarza obecną klatkę oraz poprzednią klatkę w celu wykrycia między nimi różnic. DLSS 3 generuje zupełnie nowe klatki, pomijając potok graficzny (graphics pipeline), zwiększając wydajność gry aż czterokrotnie w porównaniu do trybu natywnego. Nowa technologia nie ingeruje w grę, nie wykorzystując zasobów procesora oraz karty graficznej, co skutkuje jeszcze lepszymi wynikami wydajności.

DLSS 3 umożliwia karcie graficznej renderowanie gry w o wiele wyższej liczbie klatek aniżeli pozwala na to procesor. Przy zastosowaniu obecnej technologii w Cyberpunku 2077 oraz włączeniu RT, silnik jest w stanie wykonywać 635 operacji na sekundę w celu obliczania promienia świetlnego NA JEDEN PIKSEL – jest to ponad 16-krotny wzrost w stosunku do tego co widzieliśmy cztery lata temu przy premierze kart z serii RTX 2000 w Battlefieldzie V.

Jako przykład został pokazany również Microsoft Flight Simulator obchodzący obecnie 40. urodziny istnienia serii. Przy zastosowaniu DLSS 3 oraz włączonym Ray-Tracingu gra oferuje ponad dwukrotnie wyższe osiągi FPS w porównaniu z natywnym działaniem z wyłączonym RT.

Portal RTX – realistyczne oświetlenie w grze sprzed 15 lat

NVIDIA Lightspeed Studios wykorzystało silnik Omniverse, aby zremasterować grę Portal w celu dodania wsparcia dla technologii RT oraz DLSS 3. Od teraz produkcja wygląda niesamowicie z racji dodatkowych odbić świetlnych, które były na wysokim poziomie w momencie oryginalnej premiery tytułu. Portal RTX jest modyfikacją do gry, która zostanie wdrożona w listopadzie w formie darmowego DLC dla jej posiadaczy.

RTX Remix – aplikacja do modyfikowania gier oparta o Omniverse

RTX Remix jest aplikacją opartą o Omniverse służącą do modowania dowolnego tytułu, wprowadzając do niego wsparcie dla RT oraz DLSS. Ma być ona wykorzystana w celu modyfikowania głównie starszych tytułów, dając im drugie życie oraz dodając do niemalże każdej gry wsparcie dla RT oraz DLSS.

W celu zaprezentowania możliwości aplikacji firma wykorzystała The Elder Scrolls III: Morrowind. Oprócz dodania wyżej wymienionych możliwości w postaci RT oraz DLSS RTX Remix przy wykorzystaniu narzędzi opartych o sztuczną inteligencję jest w stanie przeskalować widoczne tekstury do większej rozdzielczości oraz nadać materiałom wykorzystanym w grze ich fizyczne właściwości.

Gdy już skończymy modyfikowanie gry w aplikacji RTX Remix ,należy wyeksportować RTX Mod Pack do gry, aby cieszyć się wszystkimi zaaplikowanymi zmianami.

RTX 4000 – Wydajność najpotężniejszych GPU

Według słów Jen-Hsuna Huanga, karty oparte o architekturę Ada Lovelace są szybsze od poprzedniej generacji Ampere ponad dwukrotnie w standardowej rasteryzacji oraz ponad czterokrotnie w kwestii śledzenia promieni świetlnych.

Oprócz tego dostajemy informację o wydajności energetycznej, której mały skrawek został ujawniony wcześniej przy okazji ukazania rdzenia oraz efektywności rdzeni SM. Karty zbudowane na architekturze Ada Lovelace mają oferować dwukrotnie wyższą wydajność przy identycznym poziomie pobieranej energii.

Zmiany w architekturze oraz zmniejszony proces litograficzny doprowadziły również do zwiększenia zegarów. CEO NVIDIA informuje, iż w laboratoriach firmy udało się podkręcić karty na poziom przekraczający 3GHz. Niestety nieznane są stockowe zegary. Oprócz tego widać wzrost jednostek Tensor o 437,5%, wzrost jednostek OFA o 238%, jednostek RT o 263,1% oraz rdzeni SM o 225%.

Premiera RTX 4090 & 4080

Zostaje nam też zaprezentowana karta RTX 4090 – potężna, 3-slotowa bestia. Według tego, co widzieliśmy wcześniej, zależnie od zastosowania karta ma być szybsza od dwóch do czterech razy od modelu RTX 3090Ti posiadając nadal 24 GB pamięci GDDR6X na pokładzie. Premiera modelu odbędzie się 12 października tego roku w cenie MSRP na poziomie 1599 $.

Następnie prezentacja RTX 4080 – model ten ma być również od dwóch do czterech razy szybszy od swojego poprzednika w postaci RTX 3080Ti. Karta ma być sprzedawana w dwóch wariantach – z 16GB oraz 12GB pamięci GDDR6X. Cena układu została ustalona na 1199 $ MSRP za model 16GB oraz 899 $ MSRP za model 12GB. Premiera już w listopadzie tego roku.