Xbox Series X od środka - analiza Digital Foundry
Poznaliśmy imponujące możliwości nowej generacji od Microsoftu.
Stało się. Po miesiącach trailerów, wpisów na blogu i kilku „przeciekach” możemy w końcu przekazać fakty na temat Xbox Series X. W pierwszym tygodniu marca odwiedziliśmy siedzibę Microsoftu, zobaczyliśmy konsolę, zagraliśmy na niej i nawet sami zbudowaliśmy jeden egzemplarz z przygotowanych komponentów.
Widzieliśmy otwarty na rozbudowanie interfejs pamięci NVMe oraz sprzętowo napędzany ray tracing, a także podejście utalentowanych deweloperów, starających się wycisnąć wszystko, co tylko możliwe z produkcji już teraz dostępnych na rynku. Mieliśmy okazję sprawdzić pomysłowe rozwiązania dotyczące wstecznej kompatybilności. Poznaliśmy też oficjalną specyfikację Xbox Series X.
Mamy mnóstwo materiału do przekazania, ale na razie staramy się skupić na kluczowych punktach, z obietnicą kolejnych testów w przyszłości. W tym artykule przyglądamy się technologii napędzającej nową maszynę. Poruszamy tutaj tematy:
- Series X jest dwa razy mocniejsze od Xbox One X. Co to oznacza w praktyce?
- Jak sprzętowo napędzany ray tracing zmieni wygląd gier?
- Jaką rewolucję zapewni przełomowe podejście do pamięci i jej szybkość? Włącznie ze świetną opcją Quick Resume.
- W jaki sposób Microsoft walczy z opóźnieniami w sterowaniu i tearingiem ekranu?
- Na koniec imponująca kompatybilność wsteczna, w tym automatyczna paleta kolorów HDR!
Zaczynamy od trzech filarów, na których opierać ma się nowa generacja konsoli Xbox: mocy, prędkości i kompatybilności. Microsoft ma zapewne własny przekaz medialny w oparciu o te wartości, które nam mogą posłużyć za podwaliny artykułu.
Jak potężny jest Xbox Series X?
Jeśli o mocy mowa, wszystko zaczyna się od układu Project Scarlett SoC (system on chip). Procesor budowany jest w technologii 7 nm w wersji firmy TSMC, co - jak rozumiemy - przekłada się na szereg usprawnień, ale bez litografii „ekstremalnym ultrafioletem” (EUV). Sam układ ma rozmiar 360 mm2 (a więc jest mniejszy, niż oczekiwaliśmy). W środku poza CPU Zen 2 znajduje się oczywiście także GPU, z 12,155 teraflopsami możliwości obliczeniowych.
Jak się spodziewano, otrzymujemy 8 rdzeni i 16 wątków procesora, w dwóch czterordzeniowych jednostkach. Jeden rdzeń (i dwa wątki) zarezerwowano dla systemu operacyjnego i głównego interfejsu. Microsoft obiecuje czterokrotną poprawę mocy w zestawieniu z Xbox One X, zarówno z jednego rdzenia, jak i ogólnie. Taktowanie CPU jest imponujące, maksymalnie 3,8 GHz.
Takie wartości osiągniemy, gdy wyłączony jest hyper-threading (SMT). Co ciekawe, deweloperzy mogą zdecydować się na działanie na ośmiu rdzeniach przy tym wyższym taktowaniu, lub też na wszystkich rdzeniach i wątkach, ale przy 3,6 GHz. Oba zegary są zablokowane i nie będą zmieniać się w zależności od obciążeń czy temperatur, co Microsoft podkreślał kilka razy podczas naszej wizyty.
W testach na podobnym PC, włączenie SMT może przełożyć się nawet na 30-procentowe wzrosty w odpowiednio dostosowanych aplikacjach. Przynajmniej w premierowych tytułach Microsoft spodziewa się jednak, że deweloperzy będą celować w 3,8 GHz i brak hyper-threadingu.
- Z punktu widzenia deweloperów, oczekujemy, że większość postawi na osiem rdzeni, ponieważ ich obecne tytuły działają najczęściej z dystrybucją na siedem rdzeni i wątków - wyjaśnia Andrew Goossen, architekt systemu. - Będą więc mieli system gotowy, by pójść szerzej, na 14 wątków, z lepiej zbalansowanymi obciążeniami. Z rozmów z deweloperami wynika jednak, że zdecydowana większość postawi na wyłączenie SMT i wyższe taktowanie.
Rdzeń procesora doczekał się modyfikacji z myślą o bezpieczeństwie, mocy i wydajności, a 76 MB pamięci SRAM w całym układzie SoC pozwala zakładać, że ogromna pula L3 cache ze standardowych chipów Zen 2 została zredukowana. Procesor Series X działa także na serwerach Project Scarlett, zastępując model xCloud oparty o rozwiązania z Xbox One S. Dlatego też AMD zbudowało system kodowania korekcyjnego (ECC) dla pamięci GDDR6, działający bez negatywnego wpływu na wydajność (ECC nie jest standardem w GDDR6, więc AMD i Microsoft przygotowali własne rozwiązanie). Do tego dodano opcję wirtualizacji. To prowadzi do pierwszej zaskakującej nowiny: procesor Series X może jednocześnie uruchomić cztery sesje gier Xbox One S w jednym układzie, obejmując także nowy koder wideo, sześciokrotnie szybszy od tego zewnętrznego z serwerów xCloud.
Do tej pory koncentrowaliśmy się na GPU, gdzie Microsoft obiecywał 12 teraflopsów mocy obliczeniowych, generowane przez 3328 shaderów i 52 jednostki obliczeniowe (w układzie jest 56, w tym 4 wyłączone, by usprawnić produkcję), działające przy stałym taktowaniu 1825 MHz. Microsoft ponownie podkreśla, że wartość ta jest niezmienna na wszystkich maszynach i obciążeniach.
- 12 teraflopsów było naszym założeniem od samego początku. Chcieliśmy co najmniej zdublować możliwości Xbox One X, by wspierać cele na poziomie 4K60 i 120 FPS. Chcieliśmy też, by to dublowanie było dostarczane równo do wszystkich gier - wyjaśnia Goossen. - Postawiliśmy sobie za cel podwojenie czystej liczby teraflopsów, wiedząc doskonale, że usprawnienia w architekturze sprawią, że wzrost wydajności będzie w rzeczywistości znacznie większy. Zdublowanie teraflopsów założyliśmy jeszcze zanim zaczęliśmy myśleć o architekturze, z kilku przyczyn. To pozwoliło zdefiniować ambitny cel w sferze zapotrzebowania na prąd i, co za tym idzie, całą architekturę systemu.
- Na początku prac projektowych trudno jest dokładnie przewidzieć wzrosty możliwości płynące ze zmian w architekturze, przy analizowaniu najgorszych możliwych scenariuszów. Naszym celem było podwojenie we wszystkich przypadkach, nie tylko w przypadku wartości uśrednionej. Najprostszą drogą do zrealizowania takich założeń jest podwojenie liczby teraflopsów. Następnie skoncentrowaliśmy wysiłki na sprawieniu, by efektywna wydajność była jeszcze wyższa, poprzez poprawki w architekturze i nowe funkcje.
Xbox Series X | Xbox One X | Xbox One S | |
---|---|---|---|
CPU | 8 rdzeni Zen 2 w 3,8 GHz (3,6 GHz z SMT) | 8 zmodyfikowanych rdzeni Jaguar w 2,13 GHz | 8 zmodyfikowanych rdzeni Jaguar w 1,75 GHz |
GPU | 12 TFLOPS, 52 CU w 1,825 GHz, autorskie RDNA 2 | 6 TFLOPS, 40 CU w 1,172 GHz, autorskie GCN + funkcje Polaris | 1.4 TFLOPS, 12 CU w 914 MHz, autorskie GCN |
Rozmiar kości | 360,45 mm2 | 366,94 mm2 | 227,1 mm2 |
Proces tech. | Rozszerzony TSMC 7 nm | TSMC 16nmFF+ | TSMC 16nmFF |
Pamięć | 16GB GDDR6 | 12GB GDDR5 | 8GB DDR3, 32MB ESRAM |
Przepustowość pamięci | 10 GB w 560 GB/s, 6 GB w 336 GB/s | 326 GB/s | 68 GB/s, ESRAM w 219 GB/s |
Pamięć wewnętrzna | 1 TB autorski NVMe SSD | 1 TB HDD | 1 TB HDD |
Prędkość pamięci wew. | 2,4 GB/s (bezpośrednio), 4,8 GB/s (po kompresji) | 120 MB/s | 120 MB/s |
Rozszerzenie pamięci | 1TB Expansion Card | - | - |
Pamięć zewnętrzna | Wsparcie USB 3.2 HDD | Wsparcie USB 3.2 HDD | Wsparcie USB 3.2 HDD |
Napęd optyczny | 4K UHD Blu-ray | 4K UHD Blu-ray | 4K UHD Blu-ray |
Docelowa jakość | 4K w 60 FPS - do 120 FPS | 4K w 30 FPS - do 60 FPS | 1080p w 30 FPS - do 60 FPS |
Pokazywaliśmy już w testach, że nowa architektura RDNA od AMD sprawia, że teraflops nie jest już równy teraflopsowi z przeszłości, dzięki radykalnym zmianom w projekcie oraz wyższemu taktowaniu (GPU w Series X ma 56-procentowy przyrost częstotliwości w porównaniu z Xbox One X). Są też mnożniki, które wkraczają do akcji dzięki nowym funkcjom układów scalonych, jak zmienne shadery (variable rate shading - VRS), które starają się zmniejszać i zwiększać precyzję renderowania w zależności od pozycji na scenie.
Nawet mało zaawansowane konwersje, które ledwo korzystają z nowości w Series X, dostarczają imponujące rezultaty. Mike Raynor oraz Colin Penty ze studia The Coalition pokazali nam nową wersję Gears 5, przygotowaną w zaledwie dwa tygodnie. Deweloperzy pracowali z Epic Games nad przystosowaniem silnika UE4 pod Series X, a następnie po prostu podnieśli wewnętrzne opcje graficzne do odpowiedników ultra z PC, dodali lepsze cieniowania na stykach obiektów oraz całkiem nową globalną iluminację, napędzaną przez ray tracing (programowy, nie sprzętowy) z Unreal Engine 4. Otrzymalismy więc benchmark takiego „dwutygodniowego” portu bez żadnej optymalizacji, który oferował wydajność bardzo zbliżoną do poziomu z RTX 2080.
- Patrząc na nasze dotychczasowe wrażenia z obcowania ze sprzętem w kontekście tej konkretnej gry, jesteśmy pozytywnie nastawieni, obserwując jego działanie. Zwłaszcza wiedząc ile niewykorzystanej mocy nadal drzemie w urządzeniu - ekscytuje się Mike Raynor, dyrektor techniczny The Coalition. - Gears 5 zostanie zoptymalizowane, więc to, co dzisiaj widzicie, zadebiutuje razem z Xbox Series X. Tytuł będzie wspierał Smart Delivery, więc jeśli posiadamy już grę w jakiejkolwiek formie, ściągniemy ją za darmo także na Series X.
Pokaz był bardzo interesujący, zwłaszcza jak na grę, która nawet nie zaczęła jeszcze korzystać z funkcji nowej generacji w GPU. Obecnie trudno jest wyrokować, jak w kwestii grafiki i liczby klatek na sekundę będą wyglądały te „pełnoprawne” usprawnienia wraz z upływem czasu. Nie brakuje bowiem cech wspólnych z obecną generacją, lecz nowy sprzęt i biblioteki API pozwalają w całkiem inny sposób obciążać GPU.
O uczeniu maszynowym mówiło się już w przeszłości, głównie w związku z architekturą Turing on Nvidii i „inteligentnym” skalowaniu DLSS. RDNA 2 w Series X nie ma odpowiednika rdzeni tensor od „zielonych”, ale Microsoft i AMD wymyślili nowe, efektywne rozwiązanie bazujące na standardowych shaderach. Przy ponad 12 teraflopsach mocy na operacjach FP32, RDNA 2 pozwala zdublować to przy precyzji FP16. Uczenie maszynowe korzysta zazwyczaj ze znacznie mniejszej dokładności, więc shadery RNDA 2 będzie można skalować jeszcze dalej.
- Wiedzieliśmy, że wiele algorytmów potrzebuje tylko 4 lub 8-bitowej precyzji przy określaniu znaczenia, a to operacje matematyczne związane z kalkulacją tego znaczenia to główne obciążenie w tych algorytmach - mówi Andrew Goossen. - Dodaliśmy więc specjalne, sprzętowe wsparcie dla tego określonego scenariusza. Rezultat jest taki, że Series X oferuje 49 terapsów w operacjach 8-bitowych oraz 97 terapsów w 4-bitowych. Warto pamiętać, że w obliczeniach tych stosuje się liczby całkowite, więc nie mówimy o teraflopsach. Podsumowując, Series X zapewnia niebywałą inteligencję dla uczenia maszynowego.
Są też inne przyszłościowe rozwiązania. Tak jak i Turing od Nvidii, RDNA 2 uwzględnia mesh shading (ten model shaderów samodzielnie zajmuje się nakładaniem materiałów na siatkę trójwymiarowych obiektów, co pozwala karcie graficznej kontrolować poziom detali. To z kolei oszczędza moce przerobowe w procesorze oraz GPU, bez utraty jakości), co może przełożyć się na znaczne zwiększenie geometrycznych detali.
- Podczas gdy przepustowość i moce obliczeniowe GPU rosną, obsługa geometrii coraz bardziej ograniczana jest przez standardowe trójkąty i teselację - mówi Goossen. - Mesh shading pozwala deweloperom kompletnie ominąć te wąskie gardła, oferując alternatywne opcje. Poza wzrostem wydajności, przekłada się to także na lepszą elastyczność oraz oszczędza pamięć. Mesh shading pozwoli twórcom zwiększyć detale kształtów i animacji obiektów, a także renderować bardziej złożone sceny bez negatywnego wpływu na liczbę klatek na sekundę.
To nie wszystko. Jest jeszcze więcej, dużo więcej. Dla przykładu, GPU w Series X pozwala dzielić obciążenia pomiędzy shaderami bez udziału CPU, oszczędzając spore pokłady pracy w rdzeniach Zen 2, ponieważ dane nie opuszczają układu graficznego. Większą innowacją jest jednak na pewno sprzętowo napędzany ray tracing. To dla nas w Digital Foundry bardzo ekscytujące, ponieważ śledzimy ewolucję tej technologii, od gier z DXR, Vulkan i RTX, podczas gdy konsolowy RT jest jeszcze ambitniejszy, niż uznawaliśmy za możliwe.
Ray tracing robi różnicę
RDNA 2 w pełni wspiera najnowszy standard DXR Tier 1.1 oraz - wzorem Turing - sprzętowo napędza tworzenie tak zwanych struktur BVH, potrzebnych do dokładnego mapowania przemieszczania i odbijania się promienie światła, testowanych na okolicznej geometrii sceny. W skrócie, tak samo jak światło odbija się od powierzchni w prawdziwym świecie, tak samo sprzętowa akceleracja tworzy mapy interakcji światła, do 380 miliardów próbek na sekundę.
- Bez sprzętowego wsparcia pracę tę musiałyby wykonać jednostki cieniujące, co samo w sobie wymagałoby 13 teraflopsów - mówi Andrew Goossen. - W Series X zadanie wykonuje dedykowany wycinek układu scalonego, więc shadery mogą działają równolegle, z pełną mocą. Innymi słowy, Series X podczas ray tracingu może dostarczyć sporo ponad 25 teraflopsów mocy.
Warto spojrzeć na to w kontekście. Funkcje te mogą być prowadzone jednocześnie, lecz kalkulacja BVH to tylko jeden komponent procedury ray tracingu. Standardowe shadery w GPU wcale nie mają ułatwionego zadania, ponieważ nadal mają swoje operacje, jak obliczanie oświetlenia, dodawane do procesu renderowania obrazu przez zapytania z biblioteki DXR.
Jeśli więc RT kojarzy się ze spadkiem wydajności, to nie inaczej będzie w wersji na konsoli Microsoftu. Sprzęt ma jednak zamkniętą architekturę, więc deweloperzy będą mogli bardziej agresywnie optymalizować i wprowadzać innowacje. Dobre wieści są takie, że Microsoft oferuje dostęp niskiego poziomu także do układu scalonego odpowiedzialnego za RT.
- Series X idzie jeszcze dalej niż standard PC, oferując deweloperom większą elastyczność - ujawnia Goossen. - Zgodnie z konsolową tradycją, wspieramy programowanie „w metalu”, w tym wsparcie dla konstruowania i optymalizowania BVH. Dzięki tym funkcjom bazowym, spodziewamy się, że ray tracing w toku generacji będzie dla deweloperów obszarem do tworzenia wspaniałej grafiki i innowacji.
Tyle teorii, a praktyka? Microsoft pokazał nam bardzo wczesną wersję dema technicznego Minecraft DXR na Series X, bazującą na kodzie Minecraft RTX. Całość wyglądała całkiem podobnie, choć działała na innym GPU. To sugeruje pewną ironię: podstawowy kod w wykonaniu Nvidii został zaadoptowany i działa teraz na sprzęcie od AMD. Imponuje fakt, że to ray tracing z pełną ścieżką, a więc poza niebem i księżycem, cała prezentacja jest generowana przez ray tracing, bez cienia rasteryzacji. To pokazuje, że pomimo potrzeby dostarczenia RT na konsoli z ograniczonymi możliwościami, Series X zapewnia najbardziej ambitną wersję ray tracingu, jak widzieliśmy - i w czasie rzeczywistym.
Minecraft DXR to swego rodzaju oświadczenie i pokaz - totalny ray tracing - ale możemy spodziewać się, że technologia będzie stosowana także na inne sposoby.
- Jesteśmy bardzo podekscytowani DXR i sprzętowym wsparciem RT - zapewnia Mike Raynor. - Mamy nieco programowego ray tracingu w Gears 5, dla cieni i [nowej] globalnej iluminacji w formie RT, więc jesteśmy ciekawi, jak sprzętowe wsparcie może wspomóc takie techniki, by następnie przenieść je do korzystania z rdzeni DXR.
- Dla nas, dla naszego podejścia i wizji na przyszłość, najlepsze jest hybrydowe renderowanie, pomiędzy tradycyjnymi technikami i korzystaniem z DXR. Czy to dla cieni, czy dla dodatkowych odbić. To rzeczy, które mogą wzbogacić scenę i możemy w pełni wykorzystać ten układ scalony, by zaoferować najlepszą jakość obrazu.
Efektywny projekt
Jednym z kluczowych elementów jest dla nas nie tylko sama moc, ale i efektywność projektu. Biorąc pod uwagę wszystkie te funkcje i stałe 12 teraflopsów mocy, wyobrażaliśmy sobie wielki, drogi chip - a więc i bardzo drogą konsolę. Tymczasem rozmiar układu na poziomie 360mm2 oznacza, że otrzymujemy coś znacznie mniejszego, niż sugerowały jakiekolwiek spekulacje przed pokazem. 15,3 mld tranzystorów to gęstość nieco ponad dwukrotnie większa niż procesor Xbox One X w procesie 16 nm FF, a przekłada się to przecież na znacznie więcej niż dwa razy większą wydajność.
Osiągnięcie takich możliwości, rozsądnego zapotrzebowania na prąd i rozmiarów wymagało więc innowacyjnego myślenia. Grafika to nie tylko teraflopsy, ale choćby przepustowość pamięci, co przekłada się na unikatowe wyzwania dla konsoli. Microsoft postawił na dziwny, 320-bitowy interfejs, z dziesięcioma modułami 14 gbps GDDR6 na płycie głównej: sześć 2 GB oraz cztery 1 GB. Dalszy podział dla deweloperów jest jeszcze ciekawszy.
- Wydajność pamięci jest asymetryczna. Czegoś takiego nie udałoby się zbudować na PC - wyjaśnia Goossen. - 10 GB pamięci fizycznej działa przy 560 GB/s. Możemy nazwać to pamięcią optymalną GPU. 6 GB działa przy 336 GB/s. Nazywamy to pamięcią standardową. Pamięć optymalna i standardowa oferują identyczną wydajność dla CPU w sferze audio i obsługi plików. Jedynym komponentem, który widzi różnicę, jest GPU.
W praktyce gry mogą wykorzystać w sumie 13,5 GB pamięci, na co składa się 10 GB tej optymalnej oraz 3,5 GB standardowej. To zostawia 2,5 GB GDDR6 z wolniejszej puli na system operacyjny oraz interfejs. Z punktu widzenia Microsoftu jest to jedna pula, nawet jeśli przepustowość może być inna.
- Z rozmów z deweloperami wynika, że zazwyczaj jest bardzo łatwo wypełnić z nawiązką tę standardową pulę, poprzez zadania procesora: audio, pliki wykonawcze, skrypty. A deweloperzy lubią takie decyzje, jeśli daje im to potencjał na większą przepustowość - wyjaśnia architekt.
Brzmi dość skomplikowanie, zwłaszcza gdy Microsoft już w przeszłości dostarczał bardziej standardowe, szersze interfejsy pamięci w Xbox One X - ale bez znacznie szybszych modułów GDDR6, co przełożyło się na dodatkowe wyzwania.
- Podczas rozmów z zespołem systemowym sporo mówiło się o problemach z integralnością sygnałów i tak dalej - wspomina Goossen. - Jak wiadomo, w Xbox One X postawiliśmy na 384-bitową szynę, ale przy tych niesamowitych prędkościach (14 gbps w przypadku GDDR6) poszliśmy tak daleko, jak tylko możliwe i uznaliśmy, że 320 będzie dobrym kompromisem, jeśli mowa o jak najlepszej przepustowości przy jednoczesnym budowaniu systemu, który będzie w ogóle działał.
Moc mamy więc z głowy, ale moc to nie wszystko. Równie ważny jest zestaw funkcji. W 2016 roku, jeszcze przed premierą Xbox One X, zespół Microsoftu pracował już nad Series X, budując podwaliny pod następną generację możliwości, które dotrą na rynek dopiero na święta 2020 r. To doskonale pokazuje, ile czasu potrzeba na rozwój nowości. Już wtedy na liście był właśnie ray tracing, podobnie jak potrzeba rewolucyjnej zmiany w pamięci masowej, co sprowadza nas do drugiego filaru projektu Series X. Mowa o fundamentalnym odejściu od HDD na rzecz SSD.
Dlaczego szybki dysk wszystko zmienia
Specyfikacja w tabeli powyżej to tylko ułamek potencjalnych możliwości, jakie przygotował Microsoft. W ubiegłym roku, mówiąc na targach E3 o Project Scarlett, Jason Ronald - dyrektor zarządzający w dziale Xbox - opisywał, jak SSD może stać się „wirtualną pamięcią”. Już wtedy sugerował, jakie funkcjonalności Microsoft wbudował w system.
Na poziomie sprzętowym, autorskie układy NVMe znacznie różnią się od standardowych SSD. Sprzęt jest krótszy, przypominając raczej kartę pamięci. Jest też raczej ciężki, zapewne ze względu na metalową konstrukcję, która ma służyć do odprowadzania ciepła z układu konsumującego 3,8 W prądu. Wiele SSD z rynku PC traci na wydajności wraz ze wzrostem temperatur, czego Microsoft po prostu nie mógł zaakceptować, podobnie jak zmiennego taktowania w CPU i GPU. Wydajność miała być stała w całym systemie.
Dysk wygląda uroczo, z imponującą gwarantowaną przepustowością na poziomie 2,4 GB/s. To jednak specjalne oprogramowanie dostarcza coś, co Microsoft uważa za rewolucję: nowy sposób na traktowanie pamięci masowej jako systemowej (a to sfera, w której zmiany chyba najbardziej odczujemy w nadchodzącej generacji). Założenie jest proste, przynajmniej na pierwszy rzut oka. Pliki z grą na dysku stają się rozszerzoną pamięcią, więc deweloperzy mogą błyskawicznie uzyskać dostęp do - powiedzmy - 100 GB danych na SSD. Microsoft określa całość jako Velocity Architecture (architektura prędkości), a SSD jest tylko jedną częścią układanki.
- Drugim komponentem jest sprzętowy blok wypakowujący, z przepustowością do 6 GB/s - ujawnia Goossen. - To specjalny układ scalony, który rozpakowuje dane bez konieczności angażowania CPU i działa w ten sposób, by rozpakowywanie danych nigdy nie stanowiło wąskiego gardła. Oferujemy wsparcie dla zlib w przypadku ogólnych danych, a także nowy system kompresji pod nazwą BCPack, przygotowany z myślą o teksturach dla GPU, które zazwyczaj stanowią zdecydowaną większość rozmiaru gry.
Trzecim komponentem jest rozszerzenie DirectX - DirectStorage. To potrzebna aktualizacja, biorąc pod uwagę fakt, że istniejące protokoły czytania i zapisywania plików będą miały wkrótce 30 lat i w obecnej formie wymagają dwóch rdzeni Zen. DirectStorage zmniejszy to obciążenie do jednej dziesiątej pojedynczego rdzenia.
- Są też inne korzyści - zapewnia Goossen. - Całość oszczędza mnóstwo mocy CPU. Oszacowaliśmy, że przygotowanie programowego rozwiązania do rozpakowania danych równolegle z naszym SSD wymagałoby trzech rdzeni Zen 2. Jeśli dodać do tego funkcje zapisu i odczytu, to dwa dodatkowe rdzenie. Razem daje to więc pięć rdzeni, ale teraz możemy zrobić to samo w jednej dziesiątej pojedynczego rdzenia. Innymi słowy, by dorównać do wydajności Series X pod tym względem, potrzeba byłoby PC z 13 rdzeniami Zen 2: siedem na grę, jeden na Windows i pięć na operacje na plikach.
Ładowanie danych wchodzi więc na kolejny poziom, ale na tym Microsoft nie poprzestał. W poprzedniej generacji pamięć systemowa wzrosła szesnastokrotnie, lecz teraz tylko dwukrotnie - lub o 50 procent, jeśli porównamy z Xbox One X. Poza załataniem tej „dziury” poprzez szersze korzystanie z pamięci masowej, firma zaczęła także proces optymalizacji samego użycia pamięci, co przełożyło się na szokujące niekiedy poprawki.
- Zauważyliśmy, że zazwyczaj tylko mały procent pamięci ładowanej przez gry był kiedykolwiek wykorzystywany - ujawnia Goossen. - Winowajcą były głównie tekstury. To zazwyczaj największy konsument pamięci, ale tylko ułamek wszystkich tekstur jest w danym momencie potrzebny w GPU. Dla przykładu, największy wycinek tekstury 4K to osiem megabajtów i niekiedy więcej, ale zazwyczaj tylko mała porcja tego wycinka jest widoczna na scenie i musi być wczytana przez GPU.
Podczas gdy rozmiary tekstur rosły, by sprostać wyświetlaczom 4K, efektywne wykorzystanie pamięci stawało się coraz gorsze - Microsoft zdołał to potwierdzić za pomocą wbudowanego narzędzia monitorującego już w Xbox One X.
- Stąd wiemy, że gry w najlepszym przypadku korzystają zazwyczaj z połowy do jednej trzeciej ulokowanej pamięci przez dłuższy czas - wyjaśnia Goossen. - Jeśli więc gra nigdy nie musi ładować zasobów, które w praktyce nie są używane, to oznacza 2-3-krotny mnożnik efektywnej pamięci i podobny mnożnik efektywnej wydajności w operacjach zapisywania i wczytywania.
Powstała więc technika Sampler Feedback Streaming do sprawniejszego odpowiadania na zapotrzebowanie GPU, inteligentnie ładując wymagane fragmenty tekstur. Gwarantuje przy tym, że wczytywana jest niższej jakości mipmapa, jeśli ta w wyższej jakości nie jest dostępna, co eliminuje „luki” w układzie graficznym, a co za tym idzie - skoki w czasie generowania klatek. Dedykowany układ scalony w GPU odpowiada za płynne przejścia pomiędzy mapami, gdyby przypadkiem mipmapa o wyższej jakości pojawiła się klatkę lub dwie później. Microsoft uznaje te elementy systemu Velocity Architecture za coś przełomowego, na dobrą sprawę multiplikując efektywność zarządzania pamięcią.
Velocity Architecture uwzględnia także inną funkcję, która brzmi imponująco na papierze, by w praktyce okazać się jeszcze bardziej niesamowitą. Quick Resume pozawala na dobrą sprawę przełączać pomiędzy zapisami, z zaledwie kilkusekundowym ładowaniem - widać to w materiale wideo powyżej. Gdy wychodzimy z gry, systemowy RAM zrzucany jest na SSD po uruchomieniu innego tytułu, by być gotowym na ponowne załadowanie. Sama gra nie ma pojęcia, co dzieje się w tle - z jej perspektywy włączyła się po prostu pauza.
Widzieliśmy, jak Xbox Series X przełącza się pomiędzy Forza Motorsport 7 (w 4K60), State of Decay 2, Hellblade: Senua's Sacrifice oraz The Cave (z X360). Przejście z gry w trybie Xbox One X na Series X to około 6,5 sekundy opóźnienia - całkiem imponujące. Microsoft nie dzielił się rozmiarem, jaki takie cache zajmuje na SSD, lecz mówiono o minimum trzech grach na Series X. Biorąc pod uwagę 13,6 GB dostępne na tytuł, można zakładać jakieś 40 GB, ale doliczyć należy zapewne sprzętową kompresję, co powinno zmniejszyć wynik.
Walka z opóźnieniami w sterowaniu i przesuniętymi klatkami
Nacisk na prędkość w Series X oznacza także radykalne przeprojektowanie podejścia do poleceń kontrolera z myślą o usunięciu opóźnień w każdym możliwym momencie. Oznacza to, że pomiędzy wciśnięciem przycisku a reakcją na ekranie powinno minąć dużo mniej czasu. Microsoft wspominał już o Dynamic Latency Input, ale dopiero teraz mówił o działaniu tego systemu. Wszystko zaczyna się od pada, gdzie standardowe 8 ms analogowego kontrolera jest znacznie zmniejszane poprzez transmitowanie danych zanim gra będzie ich potrzebowała. Cyfrowe polecenia są oznaczane czasowo i wysyłane do gry, co zmniejsza opóźnienia bez zwiększania częstotliwości „nasłuchiwania”.
Pady połączone przez USB natychmiast wysyłają dane do konsoli. Aby wszystko to umożliwić, cała warstwa oprogramowania odpowiedzialnego za ten aspekt została przepisana, co pozwoliło wprowadzić usprawnienia także gdzie indziej. Opóźnienia to kluczowa, lecz niewidzialna zmienna, z którą muszą poradzić sobie deweloperzy. A gdy poziom komplikacji silników rośnie, trudno znaleźć wszystkie miejsca, w których opóźnienia rosną. To właśnie coś, co Microsoft chce zaadresować za pomocą DLI.
- Ułatwiliśmy deweloperom optymalizowanie opóźnień. Gry na Xbox wyświetlają identyfikator w każdej klatce - mówi architekt systemu. - Gdy pojawia się polecenie kontrolera, identyfikator klatki jest parowany z czasem wydania tego polecenia i gdy klatka jest wyrenderowana w całości, identyfikator razem z kompletnym buforem trafia do systemu. Dzięki temu mechanizmowi można teraz określić kompletne opóźnienia dla każdej klatki obrazu.
Microsoft zapewnia, że przygotował system pozwalający dokładnie śledzić opóźnienia w całym silniku, tak samo jak proste jest śledzenie czasu generowania klatki obrazu. Nową metrykę dodano do wewnętrznego narzędzia testowego. Ostatnim elementem DLI jest wsparcie Xbox Series X dla nowej fali ekranów 120 Hz HDMI 2.1. Firma zaczęła już testowanie opcji w rozdzielczościach poniżej 4K na wyświetlaczach HDMI 2.0, na Xbox One S i Xbox One X. Urządzenia 120 Hz aktualizują obraz dwa razy częściej, więc również polecenia kontrolera realizowane są szybciej, co powinno dotyczyć także ekranów VVR, ze zmienną częstotliwością. Producent z Redmond ma już też tryb ALLM w istniejących konsolach, za pomocą którego można wymusić przełączenie telewizora na tryb „gry” bez angażowania użytkownika.
Microsoft ma także innowację, która może raz na zawsze poradzić sobie z przesuniętymi klatkami - tearingiem. Standardowym sposobem na zmniejszenie opóźnień jest wyświetlenie klatki podczas fazy scan-out, gdy jest ona przesyłana do portu i dalej, na monitor. Potrójne buforowanie może wyrównać zgubione klatki, ale dodaje dodatkowe opóźnienia. Na Series X sytuacja ewoluuje.
- Przeprojektowaliśmy fazę prezentacji, za pomocą których gry wysyłają kompletne klatki do telewizora - mówi Goossen. - Kompletnie odłączyliśmy tradycyjne połączenie pomiędzy podwójnym i potrójnym buforowaniem oraz opóźnieniem. Było tak, że potrójne buforowanie poprawiało płynność, jeśli gra nie radziła sobie z podtrzymaniem zakładanego poziomu FPS, ale jednocześnie zwiększały się opóźnienia. Teraz obie funkcje nie są powiązane, więc można włączyć potrójne buforowanie i nie martwić się o pogorszenie sterowania. Opóźnienie między startem klatki w CPU i startem klatki w GPU można teraz określać w mikrosekundach, nie w częstotliwości synchronizacji.
- Twórcy mogą precyzyjnie ustalić opóźnienie między CPU i GPU, by wyeliminować „bąble” pustej przestrzeni w pracy układu graficznego, gdy procesor nie nadąża z poleceniami. Jest też rozbudowana informacja statystyczna, by te opóźnienia dynamicznie dostosowywać. Używając tego mechanizmu, gry mogą dokładnie redukować takie opóźnienie, w dość prosty sposób - dodaje architekt.
Usprawnienia i poprawki - nie mówiąc o nowym przycisku do dzielenia się treścią - dotyczą nowego kontrolera, ale dobra wiadomość jest taka, że technologia DLI zadziała także na istniejących padach. Wystarczy aktualizacja oprogramowania.
Jak na Series X zadziałają starsze gry
Ostatni z trzech filarów Microsoftu na nadchodzącą generację to kompatybilność. Firma radziła sobie w tym aspekcie świetnie od czasu ujawniania wsparcia dla gier z X360 na targach E3 w 2015 roku. Wiemy już, że cała biblioteka pozycji z Xbox 360 i pierwszego Xboksa zadziała na Series X, tak samo jak wszystkie istniejące peryferia (co wyjaśnia, dlaczego nowy sprzęt ma złącze USB-A, a nie nowy standard USB-C). Potwierdzamy: nie będzie trzeba kupować nowej kierownicy.
Zespół odpowiedzialny za kompatybilność wsteczną pracował w pocie czoła i nie został rozwiązany po zakończeniu projektu związanego z X360 i aktualizacjami Xbox One X. Zapewne nie będzie większą niespodzianką, że Series X potrafi z technicznego punktu widzenia uruchomić cały katalog z Xbox One, ale tym razem bez emulacji - zadbano o odpowiednie rozwiązania sprzętowe. Gry korzystają także z pełni możliwości CPU i GPU nowej konsoli (na Xbox One X było to efektywne 50 procent mocy graficznej). Można więc spodziewać się, że wiele „trybów wydajności” z Xbox One X powinno dotrzeć teraz do stałego 60 FPS.
Deweloperzy Microsoftu z tego działu słyną jednak z podnoszenia poprzeczki coraz wyżej i wczesne wrażenia z Series X są niebywałe. Microsoft obiecywał już lepszą jakość obrazu, wyższą płynność działania i krótsze ekrany ładowania, ale pokazane nam wczesna dema wyglądają jeszcze bardziej obiecująco. Wskazówki oferował już Phil Spencer, w ostatnim wpisie na oficjalnym blogu. Widzieliśmy Gears of War: Ultimate Edition działające w dwukrotnie wyższej rozdzielczości w obu osiach, a więc 1080p zamieniło się w natywne 4K. To ewolucja metody Heutchy'ego, za pomocą której wcześniej podnoszono tytułu X360 z 720p do pełnego 4K, często przy spektakularnych rezultatach. Co istotne, sami deweloperzy nie muszą robić absolutnie nic - o wszystko zadbał zespół kompatybilności wstecznej.
- Badamy sposoby na poprawienie, być może, określonej listy gier - mówi dość ostrożnie Peggy Lo, szefowa programu kompatybilności wstecznej. - Przyglądamy się wyższej rozdzielczości, klatkom na sekundę. Może wszystko to zdublujemy! Staramy się sprawdzać różne metody. Wiemy więc, co robić w przypadku metody Heutchy'ego, ale może trochę zmienimy, jest też kilka innych pomysłów, którym się przyglądamy.
- Zapewne nie wyjaśnimy wszystkich tych zawiłości dzisiaj, ponieważ nadal staramy się określić, jakie rozwiązanie będzie najlepsze dla Series X. Chcemy czuć się pewnie, że mamy rozwiązanie, które nie zawiedzie, a które będzie także przyszłościowe.
Microsoft ustawił dwa telewizory LG OLED, jeden z Gears of War: Ultimate Edition w 1080p na Xbox One X (gra nigdy nie doczekała się aktualizacji na X) oraz drugi w 4K na Series X. Na ekranie widać było dodatkowe informacje na temat renderowania, skalowania i rozdzielczości natywnej - w tym przypadku 2.0, do 3840 × 2160. Wyświetlenie dokładnej liczby skłoniło nas do zastanawiania się, czy można pójść wyżej, choćby z 720p lub 900p do natywnego 4K. Nie otrzymaliśmy odpowiedzi, choć Lo zaśmiała się, gdy zadaliśmy pytanie.
Dalej było jeszcze lepiej, zwłaszcza dla posiadaczy ekranów HDR. Widzieliśmy Halo 5 w wersji Xbox One X z bardzo dobrym HDR, pomimo tego, że studio 343 Industries nigdy takiego wsparcia nie przygotowało. Inżynier Claude Marais z Microsoftu wyjaśnił nam więc algorytm uczenia maszynowego, który „spojrzał” na świetną implementację HDR w Gears 5 i na tej bazie przygotował automatycznie szerszą paletę barw także dla Halo 5 w kompatybilności wstecznej. Nie jest to też „fałszywe” HDR, bo dane nam było zobaczyć specjalną mapę barw, potwierdzającą jasność każdego elementu na ekranie.
- Teoretycznie algorytm można nałożyć na wszystkie gry. Nadal pracujemy nad wrażeniami użytkownika i innymi takimi sprawami, ale demo technologiczne działa - mówi Marais. - Halo 5 ma cztery lata, ale powiedzmy, że cofamy się dalej, 19 czy 20 lat. Na przykład do Fusion Frenzy. Nikt wtedy nie wiedział nic na temat HDR, stosowano 8-bitowe buforowanie.
To był kolejny z tych momentów wywołujących opad szczęki. Patrzeliśmy na Fusion Frenzy z pierwszej konsoli Xbox. Gra działała ze standardowym, 16-krotnym podbiciem rozdzielczości dzięki kompatybilności wstecznej, ale także z zauważalnie „prawdziwym” HDR. Ogólny zamysł jest taki, by opcja była po prostu na Xbox Series X dostępna dla wszystkich produkcji, które nie mają własnych trybów HDR. A jak pokazał Marais, całość zadziała w całej rodzinie gier Xbox.
- Można wyobrazić sobie też inne zastosowania - dodaje inżynier. - Weźmy przystępność i osoby, które nie potrafią dobrze czytać czy widzieć. Można zwiększyć kontrast, gdy na ekranie jest dużo tekstu. To byłoby proste. Dziś rano rozmawialiśmy z osobą cierpiącą na ślepotę barw i to kolejny świetny przykład. Podmieniliśmy po prostu paletę kolorów.
Widać wyraźnie, że twórcy przywiązują dużą wagę do przeszłości rodziny Xbox, a zespół kompatybilności wstecznej jest bardzo podekscytowany tym, co robi.
- Mamy nadzieję, że zdacie sobie sprawę, że to nasza pasja - mówi Lo. - Dla wielu z nas to bardzo osobisty projekt i pozostajemy zaangażowani, by wszystkie nasze gry wyglądały jak najlepiej na Series X.
Moc, prędkość, kompatybilność. Microsoft przekonująco mówił o trzech filarach Series X, a po wstępnym pokazie udaliśmy się do budynku 37, gdzie projektant Chris Kujawski i jego koledzy pozwolili nam dobrać się do konsoli i rozłożyć ją na części pierwsze. Wiemy więc bardzo dużo na temat obudowy, rozmiarów i wnętrza, a także delikatnej ewolucji kontrolera Xbox. Do ujawnienia pozostało więc jeszcze sporo i nie możemy się już doczekać.
Zobacz: Kontroler Xbox Series X także dla mniejszych dłoni - wszystko o padzie nowej konsoli
Zobacz też: Porównanie wielkości Xbox Series X i Xbox One X
Zobacz też: Xbox Series X w akcji - prezentacja szybkiego ładowania i wznawiania gier
Tłumaczenie: Daniel Kłosiński, Eurogamer.pl