Komentarze
Komentarzy na stronę
1 2 3 4 5 6
Putout (2019.01.15, 23:05)
Ocena: 3
#1

0%
oby. dlss na papierze wygląda świetnie i naprawde dobrze by było aby wszyscy mogli z tego korzystać pod jakąś tam nazwą.
umcacz (2019.01.15, 23:11)
Ocena: 15
#2

0%
Ja już mam odpowiedź. Obniżam rozdzielczość o 30% i gotowe. Wydajność DSSL zachowana. Wygląd DLLS zachowany.
Edytowane przez autora (2019.01.15, 23:12)
tommo1982 (2019.01.15, 23:20)
Ocena: 21
#3

0%
Czy tylko mi się wydaje, że Nvidia zrobiła z ludzi głupców, tworząc jakieś tam DLLS, zamiast skorzystać z rozwiązania Microsoftu i obniżyć ceny za karty.
dracox (2019.01.15, 23:31)
Ocena: 18
#4

0%
Putout @ 2019.01.15 23:05  Post: 1184607
oby. dlss na papierze wygląda świetnie i naprawde dobrze by było aby wszyscy mogli z tego korzystać pod jakąś tam nazwą.

na papierze. w praktyce wymaga wpierw odpowiedniego przygotowania gry o bardzo powtarzalnych teksturach. podobną jakość co dlss 4k (jak wiadomo upscaling z 1440p) oferuje 1800p z TAA - dlss i te upskalowane 4k zzera podobne ilosci zasobów karty co odpalenie gry w 1800p z TAA... więc gdzie tu sens?

dracox (2019.01.15, 23:32)
Ocena: 16
#5

0%
umcacz @ 2019.01.15 23:11  Post: 1184612
Ja już mam odpowiedź. Obniżam rozdzielczość o 30% i gotowe. Wydajność DSSL zachowana. Wygląd DLLS zachowany.

no ale trzeba na to ładną marketingową nazwe wymyślic..a pozniej na slajdach porównywac ilosc fps w upscalingu vs karty liczące 4k natywnie :)
SNC (2019.01.15, 23:32)
Ocena: 8
#6

0%
Jeden z glupszych ficzerow.
deton24 (2019.01.16, 00:00)
Ocena: 7
#8

0%
No ale z powodu tego że najnowsze Radeony są lepsze w obliczeniach GPGPU, mówią że niby wypadają podobnie jak RTX 2080.
zomeer (2019.01.16, 01:05)
Ocena: 10
#10

0%
Krisol @ 2019.01.16 00:16  Post: 1184629
deton24 @ 2019.01.16 00:00  Post: 1184628
No ale z powodu tego że najnowsze Radeony są lepsze w obliczeniach GPGPU, mówią że niby wypadają podobnie jak RTX 2080.

Są ale nie o tyle żeby nadrobić tensory.
RTX 2080 -> 10 TFlops FP32, 20 TFlops FP16 + 80 TFlops Tensor FP16
Radeon VII -> 13.8 TFlops FP32, 27.6 TFlops FP16
To co na RTXie liczą rdzenie 80 TFlops w FP16 na Radeonie musi policzyć część rdzeni o mocy 7.6 TFlops w FP16, inaczej na Radeonie będzie większy spadek wydajności. Tak samo nie nadrobisz mocy rdzeni RT do liczenia ray tracingu na Radeonach.


Przecież te biblioteki od ms wcale nie potrzebują tensorów do obliczeń, a zwykłej mocy
Assassin (2019.01.16, 08:14)
Ocena: 3
#13

0%
Wszystko zależy od rodzaju zastosowanego algorytmu, tj. jak dużej mocy obliczeniowej on wymaga. W przypadku DLSS wymagana moc jest raczej duża patrząc na spadek wydajności względem 1440P pomimo wykorzystania jednostek dedykowanych. Są jednak też inne możliwe metody: checkerboarding (który sprawdza się na konsolach obecnej generacji), bardziej zaawansowane filtry upscalingowe... Radeony mają co do zasady nadwyżkę mocy obliczeniowej względem pixel fillrate, więc mają szansę dobrze sobie poradzić z wieloma algorytmami.

W sumie najważniejsze, żeby w końcu 'rynek' się na coś zdecydował, bo jednak natywne 4K to marnotrawstwo zasobów.
Edytowane przez autora (2019.01.16, 08:33)
darkmartin (2019.01.16, 08:16)
Ocena: 18
#14

0%
Tensor Core to tylko nazwa handlowa. To są zwykłe jednostki CUDA pracujące na całej macierzy 4x4 zamiast na pojedynczych liczbach. Potrafią mnożyć tylko w FP16 ale już dodają w FP32. Niczym innym się nie różnią i tak jak CUDA przeznaczone są do wykonywania takiej operacji matematycznej y = ax + b i innych dowolnych kombinacji opartych na tym wzorze y = ax, y = x+b. Tensor Core zapewnia po prostu bardzo dużo dodatkowych rdzeni CUDA. Dokładnie 16x ilość tensor core. Można tego użyć w dowolny sposób tak samo jak rdzeni CUDA. Radeon ma swoje jednostki obliczeniowe i tak samo może je użyć do DLSS, to tylko kwestia oprogramowania. W końcu to tylko zwykłe mnożenie i dodawanie macierzy. DLSS nie wymaga rzadnych jednostek dedykowanych. Tensor Core to jednostki ogólnego przeznaczenia. Dodatkowo, trzeba wiedzieć, że cała praca związana z przygotowaniem profilu DLSS (wyszkolonej sieci neuronowej) jest wykonywana przez twórcę gry albo przez dostawce sterownika. Podczas szkolenia sieci neuronowej potrzeba dużej mocy obliczeniowej, Przy jej używaniu ta moc już nie jest potrzebna. DLSS nie jest jakimś wielkim odkryciem 2018 roku i jest stosowany w technikach przetwarzania obrazu już dość dawno, tylko nie używa się takiej nazwy.
Edytowane przez autora (2019.01.16, 08:27)
darkmartin (2019.01.16, 08:41)
Ocena: 10
#16

0%
SebastianFM - nie wiem co tobą kieruję, jakaś personalna nienawiść, będziesz mnie gonił z nożem ?
Co chwilę naskakujesz na moje merytoryczne posty. Takie osoby jak ty trzeba izolować od społeczeństwa.
Edytowane przez autora (2019.01.16, 08:44)
Krisol (2019.01.16, 09:05)
Ocena: -4
#17

0%
zomeer @ 2019.01.16 01:05  Post: 1184637
Krisol @ 2019.01.16 00:16  Post: 1184629
(...)

Są ale nie o tyle żeby nadrobić tensory.
RTX 2080 -> 10 TFlops FP32, 20 TFlops FP16 + 80 TFlops Tensor FP16
Radeon VII -> 13.8 TFlops FP32, 27.6 TFlops FP16
To co na RTXie liczą rdzenie 80 TFlops w FP16 na Radeonie musi policzyć część rdzeni o mocy 7.6 TFlops w FP16, inaczej na Radeonie będzie większy spadek wydajności. Tak samo nie nadrobisz mocy rdzeni RT do liczenia ray tracingu na Radeonach.


Przecież te biblioteki od ms wcale nie potrzebują tensorów do obliczeń, a zwykłej mocy

Po to właśnie pisałem te liczby, widać przecież że Radeon nie nadrobi mocy tensorów.
Kenjiro (2019.01.16, 09:08)
Ocena: 4
#18

0%
SebastianFM @ 2019.01.16 08:29  Post: 1184651
Jeszcze ci się nie znudziło pisanie tych bzdur?

Niestety, to on ma rację, a nie ty.
https://stackoverflow.com/a/48073989/4631772
https://devblogs.nvidia.com/programming-tensor-cores-cuda-9/
Each Tensor Core provides a 4x4x4 matrix processing array which performs the operation D = A * B + C, where A, B, C and D are 4×4 matrices as Figure 1 shows. The matrix multiply inputs A and B are FP16 matrices, while the accumulation matrices C and D may be FP16 or FP32 matrices.
darkmartin (2019.01.16, 09:09)
Ocena: 5
#19

0%
To nie takie proste z tymi TFlopsami :)
Trzeba zauważyć że CUDA wykonuje jednocześnie 2 operacje, mnożenie i dodawanie.
I dla tych 2 jednoczesnych operacji wyznaczona jest moc obliczeniowa.

Jeżeli algorytm przewiduje tylko jedną operacje ta moc jest mniejsza :)
Nie znam dokładnie budowy jednostek obliczeniowych radeonów.
Jeżeli one wykonują tylko jedną operację to praktyczna moc obliczeniowa może być inna pomniędzy Radeonami a kartami nVidia. Co zresztą widać w praktyce, bo pewne algorytmy chodzą lepiej na Radeonach. Może, jak kiedyś znajdę troche czasu to sprawdzę jak to działa w Radeonach. Wydaje się, że CUDA było projektowane pod kątem obliczeń geometrycznych bo to D = A * B + C to przecież y = ax+b czyli równanie prostej.
Edytowane przez autora (2019.01.16, 09:15)
Kenjiro (2019.01.16, 09:15)
Ocena: 4
#20

0%
Krisol @ 2019.01.16 09:05  Post: 1184657
Po to właśnie pisałem te liczby, widać przecież że Radeon nie nadrobi mocy tensorów.

Tylko wcale niekoniecznie trzeba stosować taki sam algorytm, który stosuje DLSS używając tensorów (czyli jednostek operacji na macierzach 4x4), można użyć algorytm dla macierzy 2x2.
Niemniej jednak oczywiście tam, gdzie używamy konkretnie macierzy 4x4 to Tensor Core będą mocniejsze od zwykłego rdzenia GPU (np. Cuda Core) użytego do obliczenia wyniku takiej macierzy.
Zaloguj się, by móc komentować
Aktualności
Nowy flagowiec z rodziny Mi może pozamiatać konkurencję. 12
Czyżby jednak nie było tak dobrze, jak myśleliśmy? 62
Będzie też wersja Explore Edition. 12
Po co dziś kupować wersję pudełkową jakiejś gry? Powody mogą być dwa. 79
Portugalia w jednym szeregu z Włochami i Rosją. 26
Czasem porzucenie Steama jest po prostu opłacalne. 43
Codemasters znowu dało radę. 14
Nowy flagowiec z rodziny Mi może pozamiatać konkurencję. 12
Dobra wiadomość, ale czy na to tak naprawdę czekają użytkownicy Switcha? 7
Dzięki internetowi jest ona niepotrzebna. 11
Zgadniecie, jakie marki z Państwa Środka cieszą się u nas największym wzięciem? 18
Firma rośnie jak na drożdżach. 11
Facebook
Ostatnio komentowane