Інтегрована відеокарта

Дюрі-бачі

ПТН ПНХ
Реєстрація
30.03.10
Місто
Ужгород
Телефон
OnePlus 6T
Чекаємо гігабайтні кеші на нових процесорах АМД.
:oops: Сурьёзно? Или гипербола?
 

melvin

the melvins honey bucket
Реєстрація
20.11.08
Місто
Киев
Телефон
Xiaomi mi a 3
дефицит места на кристалле
А техпроцесс для чого зменшують. ИМХО 8-10 CU RDNA 2 впихнути можна в інтеграшку і GTX1650 перегнати, але основна проблема то з пам'яттю - оперативка занадто повільна: 40 Гб/сек в розгоні проти 130 Гб/сек у 1650.
Чекаємо гігабайтні кеші на нових процесорах АМД.
А тут тоже не так все просто. Вот эти нанометры считают по длине канала транзистора. Все производители, имеющие свои фабрики, +- работают на одном техпроцесса, на самом деле)). В мире есть только один производитель литографического оборудования, нидерландская фирма как-то там. Потому Нидерланды и являются Нидерландами,а не жопой мира. Разница в самих транзисторах и в архитектурах микропроцессоров, все.
С плотностью транзисторов тоже не все так просто. Вот что такое вычислительное ядро? Это набор логик, все. Само вычислительное ядро тупое, как угол дома. Ему говорят - он делает. Аппаратно это выглядит как определенная последовательность набора транзисторов. Плотность транзисторов - это возможность засунуть большее количество логик на единицу площади. А программно низкоуровнево - это арифметико-логическое устройство(алу). Те, кто кодили на ассемблере знают, что надо представлять в башке три компонента: регистровый файл, алу и память. Не переполнить строку регистрового файла, держать в голове количество бит той или иной инструкции... Там очень долго обьяснять и мне за это деньги не платят, но коротко это так. Проблема, которая есть с x86, заключается в том, что там куча инструкции оставшиеся в наследство и необходимость их существования малопонятна всем кто в теме. Тот же Торвальд, когда проклинает Интел за avx512, прав. Была проблема с x86 в работе с операциями с плавающей точкой, такой вот косячек архитектурный. Avx1, avx2 решили принципиально эту проблему. Нахрен городить огород? Маркетинг. Плотность транзисторов растет и увеличиваются температурные режимы эксплуатации на мусорные инструкции. Плюс к этому еще и то наследие от попередників. Никто ревизию архитектуры делать не хочет ибо очень ресурсозатратно. Легче увеличивать плотность транзисторов и клепать новые наборы инструкции. Усложняя и до того сложное.
Теперь с zen архитектурой. Засунуть видеоядро можно, но ценой l3 кэша. Для чиплетной реализации это сразу сказывается на производительность ибо у них северный мост вынесен на отдельный кристалл. А там находится контроллер памяти. Чем меньше обращаешься к контроллеру памяти,т.е. к ОЗУ, тем лучше. Вот все вот эти вот Milan, threadripper - это масштабируемость, плюс чиплетной реализации. Кристаллы можно масштабировать, это немонокристалльная архитектура. Но есть свой косячек: межядерное взаимодействие. Есть близкие ядра, есть дальние ядра по отношению к северному мосту. Близкие ccd-шники, дальние. Посмотри на рисуночек epyc. Так вот, кристалл по центру - это северный мост. Другие кристаллы - это ccd-шники. Есть кристаллы, которые ближе к северному моста, а есть - дальше от моста. С ядрами тоже самое. У zen очень сложный планировщик задач. И, кстати, вот этот вот планировщик задач, если ошибается, то скидывается весь конвейер. Т.е. ядро просто может простаивать такт. На каждой презентации АМД выходить человек и говорит: мы переработали планировщик задач. Он не просто так это говорит. Сразу увеличивается производительность из-за этого, это далеко уже не в гигагерцах дело. И тут дело с кэшем l3. Нет никаких до 768 мб. Ядра одного ccd не могут обращаться к кэшу l3 другого ccd. Они могут работать только со своим кэшем l3 и ОЗУ, все. Эти дурики просто просуммировали l3 кэша всех ccd-шников Милана. Гениально.
Поставить к стенке и расстрелять всех за обман озабоченной общественности))
 

Дюрі-бачі

ПТН ПНХ
Реєстрація
30.03.10
Місто
Ужгород
Телефон
OnePlus 6T
В цілому згоден, але
1) Транзисторний бюджет росте, питання тільки як його тратити. Інтел он вирішив додавати "Атомні" ядра. Я впевнений, що якщо б була нормальна память, то вже давно дискретними б залишились тільки хай відеокарти (рівня RTX **70+). Але зараз хоч 3090 впихни в процесор - вона буде працювати повільніше за 1650, точніше вона буде 95% часу просто простоювати очікуючи данні з пам'яті. Ще й процесору буде заважати.
2) Інтел ще 6 років тому робили 256Мб кешу, але дорого. Але думаю що з чіплетною компоновкою майбутнє за великими L4 кешами.
 
Зверху