mail log

+621
с 2021
3 подписчика
36 подписок

Получается теоретическиТеоретически можно для топовых карт, практически вангую что не завезут. Ну или будет как с XeSS где будет общая версия для всех карт с хуже качеством

Не против, что звать тебя буду в технические дискуссииПротив :)
Чел, я на дтф иногда захожу поржать над идиотами. Дтф это главный аргумент за регулируемый рунет. На серьезке тут что-то кому-то доказывать... Разве что самоутвердится и наслаждаться тем что у чма пердак рвет т.к в защиту своей позиции есть лишь прилагательные(с тобой вот не получилось)
Поэтому увы, я не разраб ПО, моя работа с пк связана постольку поскольку, я лишь скромный теоретик который знает чуть больше обывателч и которому интересно как пк и софт на нем работает. Не более того. К реальным спецам вам на Gamedev.ru

1
Ответить

Не то помню?Не то помнишь. Мы не знаем точно какую точность использует dlss, но можно предположить исходя из слов сказанных Алексом
https://www.eurogamer.net/digitalfoundry-2020-image-reconstruction-death-stranding-face-off

"Microsoft has confirmed support for accelerated INT4/INT8 processing for Xbox Series X (for the record, DLSS uses INT8) but Sony has not confirmed ML support for PlayStation 5 nor a clutch of other RDNA 2 features that are present for the next generation Xbox and in PC via DirectX 12 Ultimate support on upcoming AMD products."
Не известно откуда он взял ли он эти данные от самой nv.
Но похоже на правду т.к :
1.Прямой конкурент в лице XeSS использует именно INT8(пакуется в dp4a если не интел) и именно этот тип ускоряет их XMX
https://www.tomshardware.com/news/intel-xess-technology-demo-and-overview
2.Этот тип поддерживается всеми ядрами начиная от тьюринга и выше.

Вон же, судя по производительности в SD, неплохаяВот только SD использует FP16, а не INT8.

Не хватит этого по твоему для FSR4?Если совсем кратко, хватит только если топовый ускоритель. А теперь минутка математики
Находим сколько за один такт CU/SM выдаёт INT8.
Для AMD это 512 на CU на такт
(https://gpuopen.com/learn/wmma_on_rdna3/.Кстати AMD конкретно int никак не ускорила, рейт тот же)
Для NV открываем Turing Whitepaper и читаем следующее
"A TU102 GPU contains 576 Tensor Cores: eight per SM and two per each processing block within
an SM. Each Tensor Core can perform up to 64 floating point fused multiply-add (FMA)
operations per clock using FP16 inputs. Eight Tensor Cores in an SM perform a total of 512 FP16
multiply and accumulate operations per clock, or 1024 total FP operations per clock. The new
INT8 precision mode works at double this rate, or 2048 integer operations per clock."
Итого мы получаем цифру в 2048 на SM на такт(для ампера будет та же цифра т.к скорость ядер увеличилась, но их стало 4 заместо 8. Хз используется ли в DLSS разреженность, но это сейчас и не важно)
Теперь ищем минимальный гпу тьюринг/ампер который поддерживает DLSS. Я нашёл вот это
https://www.techpowerup.com/gpu-specs/geforce-rtx-2050-max-q.c4012
Пруф того что на ней работает DLSS
https://www.youtube.com/watch?v=O6_tF2Bo1lI
Поколение ампер, но цифры мы знаем и берем в расчёт. Считаем
16(SM)*2048(кол-во операций на см)*1700(частота буста)=37 847 040 или если округлить 56 tops

Теперь считаем amd. Возьмем топовую 7900xt.
84(число CU)*512(кол-во операций за такт)*2400(частота буста)=103 219 200 или если округлить 103 tops(к слову для 2070 nv заявлет в том же turing whitepaper о 126 топсах)
О! Так вот же! Можно запустить на топовой amd карте. Да, в теории можно...если мы забудем про остальную линейку. Спустимся пониже
RX7600=44 tops. Самое минимальное из декстопа что есть у RDNA3. А что там у интеграшек?
Топовая Radeon 780M которая вроде как конкурирует с 2050 ест так же в районе 50 ватт
https://youtu.be/Urm3XSxx80M?feature=shared
Никакой DLSS не запустит.
Так чё, ждем FSR4 на картах от 7700 минимум? Нет, не ждём. Никто не будет так сильно разграничивать линейку

1
1
Ответить

но я не шарю в их архитектуре достаточно, чтобы сказать, что это значит.В RDNA 3 добавилась ещё одна ветка SIMD32 ALU и wave64 стал выполнятся за 1 цикл
Это и есть то самое "ускорение". Теперь есть возможность выполнять Dot2 (FP16, BF16, INT8) и Dot4 (INT4) в два раза быстрее
Всё, производительность выше чем была у RDNA2, но всё ещё хуже тьюринга

2
Ответить

Вон даже RTX2000 с 512 FLOPS FP16 на SM прекрасно с ним справляетсяОткуда ты взял эти цифры? С чего ты взял что DLSS вообще с точностью FP16 работает?

У RX 7000 серии такая же производительность для обработки нейронкиhttps://www.tomshardware.com/pc-components/gpus/stable-diffusion-benchmarks
В очке её производительность, они хуже чем Turing т.к задержка для wmma комманд слишком высокая
https://timdettmers.com/2023/01/30/which-gpu-for-deep-learning/

Это при том, что у Intel матричный движок в отличие от AMD и Nvidia работает целиком параллельно шейдерному доменуУ интела как у amd в Xe слайсе есть кэшы которые тупо не могут обслужить весь массив ядер при активном использовании ai блоков. Ничего там параллельно работать не может т.к это слишком большое давление на регистровый файл

1
1
Ответить

И да почему я должен платитьТак не плати, сиди дальше на 1080
Не включай ее, играй с обычным растром если РТ тебя не устраивает(пока ты еще можешь это делать). Че ноешь?

Ответить

Брат, че свой позорный коммент удалил? Стыдно стало?

Ответить

То что мощности выше, не говорит вообще не о чем
У прошки тоже цифры были кратно выше, только мощности тратились либо на 4к с шахматкой, либо 60фпс(тобишь без конкретного повышения качества графики). Либо вообще никак и на прошке не было дропов ниже 30 как на обычной версии

И тут ситуация будет примерно схожа

9
Ответить

Бля ну пдфер в вакууме, хоть сейчас в палату мер и весов ставь

Это насколько нужно быть забитой и антисоциальной хуйней что на прямые пруфы того что ты не прав агрится и называть кого-то клоуном. Ну вот все делаем чтобы не признавать обсер

Притом в защиту своей объективно не верной позиции присылаем скрин с реддита с 1 апвоутов

Другалек. Провожу для тебя ликбез что такое асинхронные вычисления. Это возможность запускать вычислительную очередь паралельно с графической. Реализовано оно сейчас в двух основных графических апи, вулкане и дх12
Соответственно если ты запускаешь две очереди и гпу их не объединяет(как это было с максвеллом), то гпу поддерживает асинхронные вычисления
Ибо суть этой фичи как раз в экономии времени кадра
И NV получила поддержку этой функции как раз с паскаля, это доказывает и любой профилировщик и реальные тесты где активация асинка дает прирост

Ответить

Чел харош, реально заебался и по полочкам раскидал

4
Ответить

В догонку еще вот это скину. Скрин профайлера где на паскале запущена графическая и вычислительная очередь одновременно

1
Ответить

Так у паскаля были асинхронные вычисления, была возможность запускать и вычислительную и графическую очередь одновременно
Собственно с паскаля они и появились

1
Ответить

Тени в скайриме от магииКлоун, в скайрима нет теней ни от магии, ни от факела
Ты откровенно пиздишь, о чем и было сказано
Тебе видео скинулм из Зова Припяти,Хуесос, показывай где в этой ветке мне был скинут этот видос
В ЗП такие тени угловатые, без любой контактной жесткости и опять же не от все объектов.
Что ты несёшь в конце?То что твоя фраза "Тебе надо" не имеет никакого смысла ибо написал изначально ты, а не я

Ответить

Паста высера на пустом месте.Какое у тебя волнение и пальцы по клавишам не попадают что ты два раза сообщение с одним и тем же текстом написал и отправить нажал
Паста эта была чтобы вас идиотов у которых "это мы уже видели" меньше в интернете плодилось. Я тебе прямо и доступно объяснил почему ты написал в хуйню
Зачилься друган
Только Скайрим работал на калькуляторе по нынешним меркам и движок там старое барахлоБля ты так в дэмэдж контрол пытаешься? Хуйня, как это защищает твой изначальный тейк что ещё в скайриме в 2011 году все тени можно было через конфиги выкрутить
Ты откровенно пропизделся и сейчас по жопе пот стекает в попытках оправдаться за свою хуйню.
Ну и да, тебе надо миллион динамических источников?Ебанат бля? ТЫ написал про какие-то чемоданы хуанга и что это всё было написано в скайриме. ТЫ написал, не я, а ты

Ответить

но что толку, если приходится использовать DLSS и генератор кадровЯ правильно понимаю что прирост мизерный потому-что в твоем манямире эти технологии не нужны?

В реальности гиммикАло дружок, ты пишешь про какой-то там гиммик в посте про игру и разрабов которые уже две игры выпустили с не отключаемым рт

Я бы не имел претензий, если бы включил лучи RT или PT и получил свои 60 кадровБлять ты клоун или че? Какого хуя ты пишешь про мизерный прирост не на основании реальных цифр роста за поколение, а на основании своих маняфантазий и манятребований где все бля тебя обязано работать в 4к60 и желательно нативе?

Да, 6 - 30 раз прирост за 3 поколенияНе, точно фрик. Ты в своем сообщении выше про мизерный прирост писал
Найс вертишься фрик

Ответить

Беги за 4080Кому бежать то надо?
Дружок, у тебя проблемы с головой раз ты свои комплексы перекладываешь на всех людей разом и борешься с мельницами которые тебе в штаны гадят
фундоментально и они уж точно не дают ту разницу, которую ждешь от 4080 с учетом её цены,Блять ну начни от часов за лям баксов просить не только статусность но и функцию отсоса ну иначе деньги на ветер, че оно такое дорогое?
Кто ждет то кстати? У тебя 4080? Я вот думаю что люди которые ее брали знали что они получат и что смогут с этой картой и каких-то душевных терзаний не испытывают. Ты опять в голову всем залез и свои болячки на чужих экстраполировал?
где-то они только художественный замысел руинят,Какой блять художественный замысел клоун? Ты знаешь какой он там был изначально или че? Овердрайв внедрили сами разрабы и если в этой сцене у персонажа затемнено лицо из-за того что тень там быть должна, а ее там нет но тебе это не нравится
То это значит что ТЕБЕ оно не нравится и ТЕБЯ оно не устраивает, а не ломает задуманный разрабами(которые и внедрили ПТ)художественный замысел который тебе блять как человеку не делавшему эту игру не известен. Играй дальше на своей ps4 которая "отрабатывает каждый флопсик" или не включай не интересные тебе функции на пеке. Все

3
Ответить

Включили даже на релизном SkyrimПокажешь?
Спойлерну. Не покажаешь, в скайриме есть движковое ограничение на 4 источника света в рамках одной ячейки ,от которых будут отбрасываться фулл динамические тени.
Ты хуйню несешь и откровенно врешь

Тени кушают крапаль и на RTТы хоть в какие-то игры играл где RТ тени присутствуют? Давай я для тебя фриказоида который нихера не разбирается но хуйню напишет объясню

Основная причина почему у нас нет кучи теней от локальных источников света это то, что нам нужно рисовать отдельные теневые карты для каждого источника и каждого объекта что попыдают под источник
А это огромный удар по пропускной способности ропов и кэша т.к вес этого очень большой. Поэтому от локальных источников мы либо теней не видим вообще, либо их мало, либо их много но реальный источник в кадре всего один
С глобальными тенями проще. Обычно глобальным источником является солнце и благодаря физике света теневых карт мы будем рисовать тупо меньше(а точнее всего одну на все объекты разом). Че мешает рисовать одну карту для локальных? То что движение теней правильным не будет. В случае с глобальным источником все ясно, он один и объектов много
В случае с локальным у нас источник также один, но характер света и соответственно тени для разных объектов уже будет разным
А теперь риторический вопрос. Трассировка тебе как блять поможет? Никак. Да, технически трассировка для теней это самый простой эффект ибо нужно просто пустить лучи от источника до объекта, а дальше на основании удаления закрасить пиксель в нужный цвет черного
Однако таких объектов дохуя, а тебе еще BVH нало для них строить
По итогу RT тени из казалось бы самых простых эффектов переходят в самые сложные(на 3 месте после GI и AO) тупо из-за кол-ва объектов и их полигонажа и по всем ним нужна RT тень

9
2
Ответить

Вот, можешь поискать ее на досугеПоискал, нашел
https://youtu.be/RG6jcY0Yx5U
Че ты доказать то хочешь фрик блять? Что разницу в ПТ(тобишь вещь которая больше всего влияет на непрямой свет) искать надо не под глобальным источником?

И толку?А какой тебе толк то нужен клоун? Чтобы как в эпоху шейдеров 3.0 старые видяхи новые игры вообще не запустили? Технологию внедрили во все апи и сделали де факто стандартом. Че еще тебе надо чтобы душа успокоилась?

3
Ответить

Маленьким приростомНу всего-то через поколение мы с 1 луча на пиксель и отражениями только для эмиссивов(Метро, BF5) перешли к трассировке пути(кибер, алан) и повсеместному внедрению РТ во все ААА

Да, маленький прирост блять.

Ответить

Ну покекай дальше клоуняра т.к в черном флаге они были только от глобального источника света, а не от поинтов или локальных источников
И при этом имели кучу артефактов при перекрытии, когда одна теневая карта ложилась на другую

2
Ответить

А вот как оно должно быть если поставить _svoTI_IntegrationMode на 2. Тобишь в режим FullGI
"Both ambient diffuse and ambient specular lighting is computed by voxel cone tracing. This mode works fine only on good modern PC."
и есть до сих пор.Покажешь где?

Ответить

Лол, SVOGI есть и работает даже на свиче.Как это доказывает что он работает на пеке? Сейчас игра использует
_svoTI_IntegrationMode в режиме 0
Это Large Scale AO(какая-то форма DFAO или около-того) плюс затенение от солнца что приводит к вот такой картинке где никакого воксельного трейсинга нет

Ответить

Не SVOGI.Он отрублен
А так тот же AO да лайтмапы

Ответить

В KCD нет SVOGi. Он отключен ибо сломан
Его активировали только на старых верисиях еще до патчей

Ответить

Там есть LumenКакой люмен лять, он фишка 5 версии и на 4 его нет

Ответить

Что ты скажешь конкретно по этому поводуЭту херню разбирали сами разрабы и сказали они что смотреть на какой-то полигонаж через wireframe режим это тупость т.к при нем отображаются все полигоны, даже те что отсекаются
https://www.cryengine.com/community/viewtopic.php?p=889047
И были тесты с этим морем и без, производительность не изменялась потому-что активно работает куллинг, этого океана при рендеринге вообще нет

1
Ответить

Есть люмен, работает на всем, что умеет в DX12.Люмен реализован только в UE5 играх и используется сейчас во ВСЕХ играх на этом движке. Я буквально не могу вспомнить где бы его не было. И он именно что софтверный. С хардварным люменом могу вспомнить только фортнайт и всё
Вот разве это хуже Ray Tracing'а хардверного?Ты хоть сам вообще видел чё скинул? Ты кидаешь игру на четвертом анриале где никакого люмена не было и где сравниваются SSR с полигональным RT
Софтверный люмен работает при помощи SDF и конкретно в отражениях показывает кал, увы. С GI всё получше но всё равно качество куда ниже хардварного RT
При том что люмен хоть и софтовый, но умеет ускорятся на RT ядрах.Херню написал. Софтверный люмен ни на каких RT ядрах не ускоряется т.к не работает с BVH структурой, а работает с SDF и трассировка там выполняется через обычный вычислительный шейдак

Ответить

и всем нормальноСтатистику приведешь этих "всех"? Мне вот не нормально и РДР2 поэтому была дропнута
в гта ты просто ездишь на тачке из точки А в точку БУ тебя на фоне этой езды что-то ещё происходит как в Рдр так и в Гта5
ждут какие-то мусорные активности не означает, что это рецепт "хорошего"Это не рецепт хорошего опенворлда, это рецепт опенворлда в котором хочется находится, а не доскакивать до очередной закрытой локации побыстрее как в элде ибо ничего за пределами них просто нет
Тут вон в пример выше РДР приводили, Так там эти активности как раз есть

Ответить

А в рдр2 ты как оцениваешь открытый мир?Мне RDR2 из-за своей медитативности не интересен

Ответить

Так а зачем тебе наполнение "контентом"Может потому-что скакать по полям в два километра длиной нахер не интересно и хочется других активностей?

Мне интересно было исследовать этот красивый мирНу тебе точно такое же предложение как человеку выше, моргни 3 раза
Если тебе очень интересно скакать на лошадке и лутать мусор, то я могу тебя только поздравить

Ответить