И пилил бы сперва технологию тамOptix доступен с 2009 года
9 лет прошло прежде чем RT докатился из рабочих задач в реалтайм рендер
Люмену не нужен rtx для динамикиКак не нужен если нужен. Документацию открой
При софтверном люмене любые не статические меши или меши с деформацией люменом не поддерживаются и SDF для них построен не будет
просто указали скорость для unsignedТак это и есть int4 и int8...
Зачем ты мне пишешь что я и так знаюВидимо не знаешь раз утверждаешь про какую-то конкуренцию с NV в сфере ИИ у которых их тензорные ядра ускакали на два поколения вперед того что сейчас есть в RDNA3
ты действительно думал что графический чип не умеет считать in4/8 ?Друг, нет не считал. Моё же сообщение которое я привел выше ссылается на статью от amd c которой ты взял этот скрин
И фраза "А, нет их" означала что скорости нет, её недостаточно для работы с апскейлом
Тут мой косяк, нужно выражаться более понятно чтобы никакого двоемыслия не было
В итоге в конце ролика видно как длсс дрыгается от страха перед фср.Джитеринг у DLSS FG Похоже на игровой баг если честно.
что ему прям необходимы какие-то там оптические потоки или чето в этом духеЭто правда. FSR FG больше артефачит, dlss FG обеспечивает выше качество
https://youtu.be/69k7ZXLK1to?feature=shared&t=193
У Тьюринга 1024 на флоп для int8 и 2048 для int4Ошибочка. 2048 для int8 и 4096 для int4 соответственно
"A TU102 GPU contains 576 Tensor Cores: eight per SM and two per each processing block within
an SM. Each Tensor Core can perform up to 64 floating point fused multiply-add (FMA)
operations per clock using FP16 inputs. Eight Tensor Cores in an SM perform a total of 512 FP16
multiply and accumulate operations per clock, or 1024 total FP operations per clock. The new
INT8 precision mode works at double this rate, or 2048 integer operations per clock."
Смотря где и в чёмДа? Ну покажешь мне тогда где Hip RT обгоняет нвидиевский optix?
ИИ ядра на амуде присутствуют уже давноФорматы не те. Нужны Int4 и int8 которые амдшные гпу считают слишком медленно
Откуда инфа про ни будит на старам пакалении?Банальный подсчёт производительности и сравнение с ближайшим конкурентом у которого есть аи апскейл
https://dtf.ru/u/52802-nicromarti/2995430-amd-podtverdila-chto-fsr-4-budet-polnostyu-osnovan-na-ii-i-sosredotochitsya-na-povyshenii-energoeffektivnosti-i-vremeni-avtonomnoi-raboty-portativnyh-ustroistv?comment=43224134
а на скрине что?)))А на скрине убогая скорость которая даже с тьюрингом не сравнится. У Тьюринга 1024 на флоп для int8 и 2048 для int4
Много Хуанг оставил для 3/2 поколения?Почти все технологии кроме FG и SER которые физически на нём не могут работать
Нейросети в 7000 картах есть, 168 AI accelerators - умеет считать FP16/BR16 через WMMA.Чё по поводу Int1,4, 8? А, нет их...
Ну покупайте RDNA 4. Там будет
https://chipsandcheese.com/2024/01/28/examining-amds-rdna-4-changes-in-llvm/
Есть RCOM/Hip и Hip rt, кому надо используют.Скорость в жопе по сравнению с NV
на подходе FSR 4 AIПока все наслаждаются уже 4 года. Амд только в следующем поколении выкатит какую-то ответку. Которая ещё и не будет работать на старом поколении
Получается теоретическиТеоретически можно для топовых карт, практически вангую что не завезут. Ну или будет как с XeSS где будет общая версия для всех карт с хуже качеством
Не против, что звать тебя буду в технические дискуссииПротив :)
Чел, я на дтф иногда захожу поржать над идиотами. Дтф это главный аргумент за регулируемый рунет. На серьезке тут что-то кому-то доказывать... Разве что самоутвердится и наслаждаться тем что у чма пердак рвет т.к в защиту своей позиции есть лишь прилагательные(с тобой вот не получилось)
Поэтому увы, я не разраб ПО, моя работа с пк связана постольку поскольку, я лишь скромный теоретик который знает чуть больше обывателч и которому интересно как пк и софт на нем работает. Не более того. К реальным спецам вам на Gamedev.ru
Не то помню?Не то помнишь. Мы не знаем точно какую точность использует dlss, но можно предположить исходя из слов сказанных Алексом
https://www.eurogamer.net/digitalfoundry-2020-image-reconstruction-death-stranding-face-off
"Microsoft has confirmed support for accelerated INT4/INT8 processing for Xbox Series X (for the record, DLSS uses INT8) but Sony has not confirmed ML support for PlayStation 5 nor a clutch of other RDNA 2 features that are present for the next generation Xbox and in PC via DirectX 12 Ultimate support on upcoming AMD products."
Не известно откуда он взял ли он эти данные от самой nv.
Но похоже на правду т.к :
1.Прямой конкурент в лице XeSS использует именно INT8(пакуется в dp4a если не интел) и именно этот тип ускоряет их XMX
https://www.tomshardware.com/news/intel-xess-technology-demo-and-overview
2.Этот тип поддерживается всеми ядрами начиная от тьюринга и выше.
Вон же, судя по производительности в SD, неплохаяВот только SD использует FP16, а не INT8.
Не хватит этого по твоему для FSR4?Если совсем кратко, хватит только если топовый ускоритель. А теперь минутка математики
Находим сколько за один такт CU/SM выдаёт INT8.
Для AMD это 512 на CU на такт
(https://gpuopen.com/learn/wmma_on_rdna3/.Кстати AMD конкретно int никак не ускорила, рейт тот же)
Для NV открываем Turing Whitepaper и читаем следующее
"A TU102 GPU contains 576 Tensor Cores: eight per SM and two per each processing block within
an SM. Each Tensor Core can perform up to 64 floating point fused multiply-add (FMA)
operations per clock using FP16 inputs. Eight Tensor Cores in an SM perform a total of 512 FP16
multiply and accumulate operations per clock, or 1024 total FP operations per clock. The new
INT8 precision mode works at double this rate, or 2048 integer operations per clock."
Итого мы получаем цифру в 2048 на SM на такт(для ампера будет та же цифра т.к скорость ядер увеличилась, но их стало 4 заместо 8. Хз используется ли в DLSS разреженность, но это сейчас и не важно)
Теперь ищем минимальный гпу тьюринг/ампер который поддерживает DLSS. Я нашёл вот это
https://www.techpowerup.com/gpu-specs/geforce-rtx-2050-max-q.c4012
Пруф того что на ней работает DLSS
https://www.youtube.com/watch?v=O6_tF2Bo1lI
Поколение ампер, но цифры мы знаем и берем в расчёт. Считаем
16(SM)*2048(кол-во операций на см)*1700(частота буста)=37 847 040 или если округлить 56 tops
Теперь считаем amd. Возьмем топовую 7900xt.
84(число CU)*512(кол-во операций за такт)*2400(частота буста)=103 219 200 или если округлить 103 tops(к слову для 2070 nv заявлет в том же turing whitepaper о 126 топсах)
О! Так вот же! Можно запустить на топовой amd карте. Да, в теории можно...если мы забудем про остальную линейку. Спустимся пониже
RX7600=44 tops. Самое минимальное из декстопа что есть у RDNA3. А что там у интеграшек?
Топовая Radeon 780M которая вроде как конкурирует с 2050 ест так же в районе 50 ватт
https://youtu.be/Urm3XSxx80M?feature=shared
Никакой DLSS не запустит.
Так чё, ждем FSR4 на картах от 7700 минимум? Нет, не ждём. Никто не будет так сильно разграничивать линейку
но я не шарю в их архитектуре достаточно, чтобы сказать, что это значит.В RDNA 3 добавилась ещё одна ветка SIMD32 ALU и wave64 стал выполнятся за 1 цикл
Это и есть то самое "ускорение". Теперь есть возможность выполнять Dot2 (FP16, BF16, INT8) и Dot4 (INT4) в два раза быстрее
Всё, производительность выше чем была у RDNA2, но всё ещё хуже тьюринга
Вон даже RTX2000 с 512 FLOPS FP16 на SM прекрасно с ним справляетсяОткуда ты взял эти цифры? С чего ты взял что DLSS вообще с точностью FP16 работает?
У RX 7000 серии такая же производительность для обработки нейронкиhttps://www.tomshardware.com/pc-components/gpus/stable-diffusion-benchmarks
В очке её производительность, они хуже чем Turing т.к задержка для wmma комманд слишком высокая
https://timdettmers.com/2023/01/30/which-gpu-for-deep-learning/
Это при том, что у Intel матричный движок в отличие от AMD и Nvidia работает целиком параллельно шейдерному доменуУ интела как у amd в Xe слайсе есть кэшы которые тупо не могут обслужить весь массив ядер при активном использовании ai блоков. Ничего там параллельно работать не может т.к это слишком большое давление на регистровый файл
И да почему я должен платитьТак не плати, сиди дальше на 1080
Не включай ее, играй с обычным растром если РТ тебя не устраивает(пока ты еще можешь это делать). Че ноешь?
Брат, че свой позорный коммент удалил? Стыдно стало?
То что мощности выше, не говорит вообще не о чем
У прошки тоже цифры были кратно выше, только мощности тратились либо на 4к с шахматкой, либо 60фпс(тобишь без конкретного повышения качества графики). Либо вообще никак и на прошке не было дропов ниже 30 как на обычной версии
И тут ситуация будет примерно схожа
Бля ну пдфер в вакууме, хоть сейчас в палату мер и весов ставь
Это насколько нужно быть забитой и антисоциальной хуйней что на прямые пруфы того что ты не прав агрится и называть кого-то клоуном. Ну вот все делаем чтобы не признавать обсер
Притом в защиту своей объективно не верной позиции присылаем скрин с реддита с 1 апвоутов
Другалек. Провожу для тебя ликбез что такое асинхронные вычисления. Это возможность запускать вычислительную очередь паралельно с графической. Реализовано оно сейчас в двух основных графических апи, вулкане и дх12
Соответственно если ты запускаешь две очереди и гпу их не объединяет(как это было с максвеллом), то гпу поддерживает асинхронные вычисления
Ибо суть этой фичи как раз в экономии времени кадра
И NV получила поддержку этой функции как раз с паскаля, это доказывает и любой профилировщик и реальные тесты где активация асинка дает прирост
Чел харош, реально заебался и по полочкам раскидал
В догонку еще вот это скину. Скрин профайлера где на паскале запущена графическая и вычислительная очередь одновременно
НетРеально манямир. Это что тогда?
https://www.reddit.com/r/nvidia/comments/4sunfu/pascal_has_async_compute/
Так у паскаля были асинхронные вычисления, была возможность запускать и вычислительную и графическую очередь одновременно
Собственно с паскаля они и появились
Тени в скайриме от магииКлоун, в скайрима нет теней ни от магии, ни от факела
Ты откровенно пиздишь, о чем и было сказано
Тебе видео скинулм из Зова Припяти,Хуесос, показывай где в этой ветке мне был скинут этот видос
В ЗП такие тени угловатые, без любой контактной жесткости и опять же не от все объектов.
Что ты несёшь в конце?То что твоя фраза "Тебе надо" не имеет никакого смысла ибо написал изначально ты, а не я
Паста высера на пустом месте.Какое у тебя волнение и пальцы по клавишам не попадают что ты два раза сообщение с одним и тем же текстом написал и отправить нажал
Паста эта была чтобы вас идиотов у которых "это мы уже видели" меньше в интернете плодилось. Я тебе прямо и доступно объяснил почему ты написал в хуйню
Зачилься друган
Только Скайрим работал на калькуляторе по нынешним меркам и движок там старое барахлоБля ты так в дэмэдж контрол пытаешься? Хуйня, как это защищает твой изначальный тейк что ещё в скайриме в 2011 году все тени можно было через конфиги выкрутить
Ты откровенно пропизделся и сейчас по жопе пот стекает в попытках оправдаться за свою хуйню.
Ну и да, тебе надо миллион динамических источников?Ебанат бля? ТЫ написал про какие-то чемоданы хуанга и что это всё было написано в скайриме. ТЫ написал, не я, а ты
но что толку, если приходится использовать DLSS и генератор кадровЯ правильно понимаю что прирост мизерный потому-что в твоем манямире эти технологии не нужны?
В реальности гиммикАло дружок, ты пишешь про какой-то там гиммик в посте про игру и разрабов которые уже две игры выпустили с не отключаемым рт
Я бы не имел претензий, если бы включил лучи RT или PT и получил свои 60 кадровБлять ты клоун или че? Какого хуя ты пишешь про мизерный прирост не на основании реальных цифр роста за поколение, а на основании своих маняфантазий и манятребований где все бля тебя обязано работать в 4к60 и желательно нативе?
Да, 6 - 30 раз прирост за 3 поколенияНе, точно фрик. Ты в своем сообщении выше про мизерный прирост писал
Найс вертишься фрик
Беги за 4080Кому бежать то надо?
Дружок, у тебя проблемы с головой раз ты свои комплексы перекладываешь на всех людей разом и борешься с мельницами которые тебе в штаны гадят
фундоментально и они уж точно не дают ту разницу, которую ждешь от 4080 с учетом её цены,Блять ну начни от часов за лям баксов просить не только статусность но и функцию отсоса ну иначе деньги на ветер, че оно такое дорогое?
Кто ждет то кстати? У тебя 4080? Я вот думаю что люди которые ее брали знали что они получат и что смогут с этой картой и каких-то душевных терзаний не испытывают. Ты опять в голову всем залез и свои болячки на чужих экстраполировал?
где-то они только художественный замысел руинят,Какой блять художественный замысел клоун? Ты знаешь какой он там был изначально или че? Овердрайв внедрили сами разрабы и если в этой сцене у персонажа затемнено лицо из-за того что тень там быть должна, а ее там нет но тебе это не нравится
То это значит что ТЕБЕ оно не нравится и ТЕБЯ оно не устраивает, а не ломает задуманный разрабами(которые и внедрили ПТ)художественный замысел который тебе блять как человеку не делавшему эту игру не известен. Играй дальше на своей ps4 которая "отрабатывает каждый флопсик" или не включай не интересные тебе функции на пеке. Все
Включили даже на релизном SkyrimПокажешь?
Спойлерну. Не покажаешь, в скайриме есть движковое ограничение на 4 источника света в рамках одной ячейки ,от которых будут отбрасываться фулл динамические тени.
Ты хуйню несешь и откровенно врешь
Тени кушают крапаль и на RTТы хоть в какие-то игры играл где RТ тени присутствуют? Давай я для тебя фриказоида который нихера не разбирается но хуйню напишет объясню
Основная причина почему у нас нет кучи теней от локальных источников света это то, что нам нужно рисовать отдельные теневые карты для каждого источника и каждого объекта что попыдают под источник
А это огромный удар по пропускной способности ропов и кэша т.к вес этого очень большой. Поэтому от локальных источников мы либо теней не видим вообще, либо их мало, либо их много но реальный источник в кадре всего один
С глобальными тенями проще. Обычно глобальным источником является солнце и благодаря физике света теневых карт мы будем рисовать тупо меньше(а точнее всего одну на все объекты разом). Че мешает рисовать одну карту для локальных? То что движение теней правильным не будет. В случае с глобальным источником все ясно, он один и объектов много
В случае с локальным у нас источник также один, но характер света и соответственно тени для разных объектов уже будет разным
А теперь риторический вопрос. Трассировка тебе как блять поможет? Никак. Да, технически трассировка для теней это самый простой эффект ибо нужно просто пустить лучи от источника до объекта, а дальше на основании удаления закрасить пиксель в нужный цвет черного
Однако таких объектов дохуя, а тебе еще BVH нало для них строить
По итогу RT тени из казалось бы самых простых эффектов переходят в самые сложные(на 3 месте после GI и AO) тупо из-за кол-ва объектов и их полигонажа и по всем ним нужна RT тень
Вот, можешь поискать ее на досугеПоискал, нашел
https://youtu.be/RG6jcY0Yx5U
Че ты доказать то хочешь фрик блять? Что разницу в ПТ(тобишь вещь которая больше всего влияет на непрямой свет) искать надо не под глобальным источником?
И толку?А какой тебе толк то нужен клоун? Чтобы как в эпоху шейдеров 3.0 старые видяхи новые игры вообще не запустили? Технологию внедрили во все апи и сделали де факто стандартом. Че еще тебе надо чтобы душа успокоилась?
Маленьким приростомНу всего-то через поколение мы с 1 луча на пиксель и отражениями только для эмиссивов(Метро, BF5) перешли к трассировке пути(кибер, алан) и повсеместному внедрению РТ во все ААА
Да, маленький прирост блять.
Где все время первые то?Тебе выше всё было приведено
Я привел контраргументыХерню ты привел дружок. Nvidia была первой в GPGPU вычисления с кудой. Nvidia первой внедрила аппаратную трассировку с обходом луч-пиксель и луч-структура. Nvidia первой разработала VRR и внедрила его вместе со своим проприетарным модулем. Nvidia первые начали применять элементы AI сначала в денойзере оптикса, теперь в потребительском сегменте с DLSS.
Назовешь что разработали и воплотили красные?
И это только "железные" вещи. Кол-во технологий разработанных Nvidia которые были стандартизированы либо ушли "в народ" можно перечислять очень долго
Можно лить фанатские красные слезы сколько угодно, но именно Nvidia толкает графическую индустрию своими возможностями, а остальные в догоняющих