Сравнение карт nvidia: Сравнение видеокарт GeForce RTX и GTX
Содержание
Видеокарта TITAN Xp [в 4 бенчмарках]
NVIDIA
TITAN Xp
- Интерфейс PCIe 3.0 x16
- Частота ядра 1405 MHz
- Объем видеопамяти 12 GB
- Тип памяти GDDR5X
- Частота памяти 11408 MHz
- Максимальное разрешение
Описание
NVIDIA начала продажи TITAN Xp 6 апреля 2017 по рекомендованной цене 1,199$. Это десктопная видеокарта на архитектуре Pascal и техпроцессе 16 нм, в первую очередь рассчитанная на геймеров. На ней установлено 12 Гб памяти GDDR5X на частоте 11.41 ГГц, и вкупе с 384-битным интерфейсом это создает пропускную способность 547.6 Гб/с.
С точки зрения совместимости это двухслотовая карта, подключаемая по интерфейсу PCIe 3.0 x16. Длина референсной версии – 267 мм. Для подключения требуется один кабель 6-pin и один кабель 8-pin, а потребляемая мощность – 250 Вт.
Она обеспечивает хорошую производительность в тестах и играх на уровне
49. 00%
от лидера, которым является NVIDIA GeForce RTX 4090.
GeForce RTX
4090
Сравнить
Общая информация
Сведения о типе (для десктопов или ноутбуков) и архитектуре TITAN Xp, а также о времени начала продаж и стоимости на тот момент.
Место в рейтинге производительности | 28 | |
Соотношение цена-качество | 53.22 | |
Архитектура | Pascal (2016−2021) | |
Графический процессор | GP102 | |
Тип | Десктопная | |
Дата выхода | 6 апреля 2017 (6 лет назад) | |
Цена на момент выхода | 1,199$ | |
Цена сейчас | 311$ (0. 3x) | из 49999 (A100 SXM4) |
Соотношение цена-качество
Отношение производительности к цене. Чем выше, тем лучше.
- 0
- 50
- 100
Характеристики
Общие параметры TITAN Xp: количество шейдеров, частота видеоядра, техпроцесс, скорость текстурирования и вычислений. Они косвенным образом говорят о производительности TITAN Xp, но для точной оценки необходимо рассматривать результаты бенчмарков и игровых тестов.
Количество потоковых процессоров | 3840 | из 20480 (Data Center GPU Max NEXT) |
Частота ядра | 1405 МГц | из 2610 (Radeon RX 6500 XT) |
Частота в режиме Boost | 1582 МГц | из 3599 (Radeon RX 7990 XTX) |
Количество транзисторов | 11,800 млн | из 14400 (GeForce GTX 1080 SLI (мобильная)) |
Технологический процесс | 16 нм | из 4 (GeForce RTX 4080) |
Энергопотребление (TDP) | 250 Вт | из 2400 (Data Center GPU Max Subsystem) |
Скорость текстурирования | 379. 7 | из 969.9 (h200 SXM5 96 GB) |
Производительность с плавающей точкой | 12,150 gflops | из 16384 (Radeon Pro Duo) |
Совместимость и размеры
Параметры, отвечающие за совместимость TITAN Xp с остальными компонентами компьютера. Пригодятся например при выборе конфигурации будущего компьютера или для апгрейда существующего. Для десктопных видеокарт это интерфейс и шина подключения (совместимость с материнской платой), физические размеры видеокарты (совместимость с материнской платой и корпусом), дополнительные разъемы питания (совместимость с блоком питания).
Интерфейс | PCIe 3.0 x16 | |
Длина | 267 мм | |
Толщина | 2 слота | |
Дополнительные разъемы питания | 1x 6-pin + 1x 8-pin |
Оперативная память
Параметры установленной на TITAN Xp памяти — тип, объем, шина, частота и пропускная способность. Для встроенных в процессор видеокарт, не имеющих собственной памяти, используется разделяемая — часть оперативной памяти.
Тип памяти | GDDR5X | |
Максимальный объём памяти | 12 Гб | из 128 (Radeon Instinct MI250X) |
Ширина шины памяти | 384 бит | из 8192 (Radeon Instinct MI250X) |
Частота памяти | 11408 МГц | из 22400 (GeForce RTX 4080) |
Пропускная способность памяти | 547.6 Гб/с | из 14400 (Radeon R7 M260) |
Видеовыходы
Перечисляются имеющиеся на TITAN Xp видеоразъемы. Как правило, этот раздел актуален только для десктопных референсных видеокарт, так как для ноутбучных наличие тех или иных видеовыходов зависит от модели ноутбука.
Видеоразъемы | 1x HDMI, 3x DisplayPort | |
HDMI | + |
Поддержка API
Перечислены поддерживаемые TITAN Xp API, включая их версии.
DirectX | 12 (12_1) | |
Шейдерная модель | 6.4 | |
OpenGL | 4.6 | |
OpenCL | 1.2 | |
Vulkan | 1.2.131 | |
CUDA | 6.1 |
Тесты в бенчмарках
Это результаты тестов TITAN Xp на производительность рендеринга в неигровых бенчмарках. Общий балл выставляется от 0 до 100, где 100 соответствует самой быстрой на данный момент видеокарте.
Общая производительность в тестах
Это наш суммарный рейтинг производительности. Мы регулярно улучшаем наши алгоритмы, но если вы обнаружите какие-то несоответствия, не стесняйтесь высказываться в разделе комментариев, мы обычно быстро устраняем проблемы.
TITAN Xp
49.00
- Passmark
- GeekBench 5 OpenCL
- GeekBench 5 Vulkan
- GeekBench 5 CUDA
Passmark
Это очень распространенный бенчмарк, входящий в состав пакета Passmark PerformanceTest. Он дает видеокарте тщательную оценку, производя четыре отдельных теста для Direct3D версий 9, 10, 11 и 12 (последний по возможности делается в разрешении 4K), и еще несколько тестов, использующих DirectCompute.
Охват бенчмарка: 24%
TITAN Xp
19424
GeekBench 5 OpenCL
Geekbench 5 — широко распространенный бенчмарк для видеокарт, объединяющий 11 различных тестовых сценариев. Все эти сценарии основаны на прямом задействовании вычислительной мощности графического процессора, без использования 3D-рендеринга. Этот вариант использует программный интерфейс OpenCL компании Khronos Group.
Охват бенчмарка: 8%
TITAN Xp
51315
GeekBench 5 Vulkan
Geekbench 5 — широко распространенный бенчмарк для видеокарт, объединяющий 11 различных тестовых сценариев. Все эти сценарии основаны на прямом задействовании вычислительной мощности графического процессора, без использования 3D-рендеринга. Этот вариант использует программный интерфейс Vulkan компаний AMD и Khronos Group.
Охват бенчмарка: 5%
TITAN Xp
85975
GeekBench 5 CUDA
Geekbench 5 — широко распространенный бенчмарк для видеокарт, объединяющий 11 различных тестовых сценариев. Все эти сценарии основаны на прямом задействовании вычислительной мощности графического процессора, без использования 3D-рендеринга. Этот вариант использует программный интерфейс CUDA компании NVIDIA.
Охват бенчмарка: 4%
TITAN Xp
58384
Хэшрейты в майнинге
Производительность TITAN Xp в майнинге криптовалют. Обычно результат измеряется в мхэш/c — количество миллионов решений, генерируемых видеокартой за одну секунду.
Ethereum / ETH (DaggerHashimoto) | 37.6 Mh/s |
TITAN Xp в играх
FPS в популярных играх на TITAN Xp, а также соответствие системным требованиям. Помните, что официальные требования разработчиков не всегда совпадают с данными реальных тестов.
Относительная производительность
Общая производительность TITAN Xp по сравнению с ближайшими конкурентами среди десктопных видеокарт.
NVIDIA RTX 6000 Ada Generation
106.08
AMD Radeon RX 6700 XT
102.14
NVIDIA GeForce RTX 2080 Super
100.82
NVIDIA TITAN Xp
100
NVIDIA RTX A5500
99.06
AMD Radeon RX 6700
98.61
NVIDIA RTX A4000
97.94
Конкурент от AMD
Мы полагаем, что ближайшим конкурентом TITAN Xp от компании AMD является Radeon RX 6700, которая в среднем на 1% медленнее и на 5 позиций ниже в нашем рейтинге.
Radeon RX
6700
Сравнить
Вот несколько ближайших конкурентов TITAN Xp от AMD:
AMD Radeon RX 6750 XT
111.49
NVIDIA RTX 6000 Ada Generation
106.08
AMD Radeon RX 6700 XT
102.14
NVIDIA TITAN Xp
100
AMD Radeon RX 6700
98.61
AMD Radeon RX 6650 XT
91.59
AMD Radeon RX 5700 XT
87.33
Другие видеокарты
Здесь мы рекомендуем несколько видеокарт, более или менее близких по производительности к рассмотренной.
TITAN
V
Сравнить
TITAN V
CEO Edition
Сравнить
Radeon RX
5700 XT 50th Anniversary
Сравнить
Radeon Vega
Frontier Edition
Сравнить
GeForce GTX
TITAN X
Сравнить
Radeon RX
5600 OEM
Сравнить
Рекомендуемые процессоры
По нашей статистике эти процессоры чаще всего используются с TITAN Xp.
Ryzen 9
5900X
2.8%
Core i9
9900K
2.4%
Ryzen 5
3600
2.4%
Ryzen Threadripper
PRO 3995WX
2.4%
Ryzen 5
5500U
2.4%
Ryzen 9
3900X
1.9%
EPYC
7502P
1.9%
Ryzen Threadripper
3970X
1. 4%
EPYC
7702
1.4%
Core i9
9990XE
1.4%
Оценка пользователями
Здесь Вы можете посмотреть оценку видеокарты пользователями, а также поставить свою оценку.
Советы и комментарии
Здесь можно задать вопрос о TITAN Xp, согласиться или не согласиться с нашими оценками, или сообщить об ошибках и неточностях на сайте.
Please enable JavaScript to view the comments powered by Disqus.
Новости по теме «NVIDIA готовит две спецификации RTX 4070» — МИР NVIDIA
Согласно свежим слухам, компания NVIDIA завершила разработку спецификации видеокарты RTX 4070, при этом компания решила создать сразу две версии этой видеокарты.
Компания NVIDIA обновила таблицу релиза видеокарт GeForce RTX 4070 без Ti, и теперь партнёры готовятся выпустить ускорители в апреле. При этом, никаких точных дат нет.
Известно, что запрет на публикацию для СМИ часто меняется. Так произошло и в этот раз. Благодаря чему стало известно, что GPU для этих карт будут массово производиться уже в феврале, а в апреле видеокарта поступит в продажу.
Ожидается, что RTX 4070 получит 5888 шейдерных ядер базовой частотой 1920 МГц и 12 ГБ памяти GDDR6X. Энергопотребление карты должно составить порядка 200 Вт. Ранее Kopite7kimi отмечал, что возможно появление двух версий этого ускорителя, на базе GPU моделей AD104-250 и 251, что потребует различных печатных плат.
слухиGeForce RTX 4070видеокартыNVIDIA
комментировать похожие новости
Guru of 3D
Согласно свежим слухам компания NVIDIA может разрабатывать очередную версию видеокарты RTX 3060, которая станет четвёртой версией на рынке.
По информации Videocardz.com, которая опубликовала твит T4C Fantasy, имеющего доступ к базе данных TechPowerUP, компания NVIDIA может работать над новой видеокартой RTX 3060, которая будет основываться на базе GPU GA104 c 12 ГБ памяти GDDR6X.
NVIDIA GeForce RTX
Сейчас на рынке существует три разные модели RTX 3060. Стандартная модель RTX 3060 12GB GDDR6, основанная на GPU GA106-300; модель с ограничением майнинга RTX 3060 12GB GDDR6 LHR, основанная на GPU GA106-302, и модель RTX 3060 8GB GDDR6 на базе GA106-302.
Использование памяти GDDR6X должно заметно повысить производительность памяти и карты в целом. К примеру, на RTX 3060 Ti пропускная способность памяти на 36% выше, чем у RTX 3060.
Конечно, пока это лишь слухи. Данная карта может появиться в рознице, может быть выпущена для ограниченного числа OEM-заказчиков, а может так и остаться лишь на чертёжной доске.
слухивидеокартыNVIDIAGeForce RTX 3060
комментировать похожие новости
Fudzilla
Видеокарты NVIDIA серии Ada среднего сегмента ожидаются к выходу весной 2023 года, и начать его компания планирует моделью RTX 4060 Ti, которая будет основана на 4 нм процессоре AD106.
Известный инсайдер kopite7kimi опубликовал информацию об ожидаемой спецификации этой видокарты.
Графический процессор AD106 будет заметно меньшим, чем AD104, лежащий в основе RTX 4070. Референсная модель RTX 4060 Ti имеет кодовое имя PG190. Карта получилась небольшого размера, с дополнительным коннектором питания ATX 12VHPWR на 16 контактов, то есть с возможностью дополнительного питания 300 Вт. При этом карта будет иметь вполне традиционное энергопотребление в 160 Вт.
NVIDIA GeForce RTX 3060
Основные спецификации карты включают 4352 ядра CUDA в 34 потоковых процессорах, 34 ядра RT, 136 ядер Tensor, 136 TMU и неизвестное число ROP. Объём кэша L2 GPU составит 32 МБ. В качестве памяти будет использована GDDR6/X с шиной 128 бита, объём которой составит 8 ГБ. Скорость памяти будет стандартной для GDDR6 — 18 Гб/с с общей пропускной способностью 288 ГБ/с. Будет интересно посмотреть, как это повлияет на скорость, ведь пропускная способность у RTX 4060 Ti будет на 2/3 выше, чем у предшественницы RTX 3060 Ti.
слухиGeForce RTX 4060 TiвидеокартыNVIDIA
комментировать похожие новости
TechPowerUp
Две новые видеокарты на базе графического процессора AD104, моделей RTX 4070 и RTX 4060 Ti, поступят в массовое производство в ближайшие недели.
К примеру, ускоритель на основе AD104-251 поступит в производство во второй половине марта, в то время как модель с GPU AD104-250 будет производиться с февраля. Учитывая, что карты RTX 4070 и RTX 4060 Ti основаны на GPU одной серии AD104, а значит, есть большой шанс, что эти карты уже будут продаваться этим летом. Когда именно — неизвестно, однако выставка Computex в конце мая выглядит наилучшим временем.
NVIDIA GeForce RTX 4070 Ti
По слухам, AD104-250 станет первым вариантом NVIDIA для использования в RTX 4070, в то время как AD106-350 ожидается в RTX 4060. В первом случае будет предложено 5888 ядер CUDA, а во втором — 4352 ядра CUDA.
GeForce RTX 40704060 TiAdaвидеокартыNVIDIA
комментировать похожие новости
Guru of 3D
Компания NVIDIA планирует активно развивать поколение видеокарт Ada уже летом 2023 года. Именно тогда должен появиться в продаже средний сегмент.
Ожидается, что в июне мы увидим в продаже ускоритель GeForce RTX 4060. Он будет основан на GPU AD106, изготавливаемом по 4 нм процессу. Что касается производительности, то она ожидается на уровне RTX 3070, но за меньшую цену.
Рендер RTX 4060
Это означает, что RTX 4060 будет весьма быстрой видеокартой для игр класса AAA в разрешении 1440p со сверхвысокими настройками качества и трассировкой лучей. Кроме того, если NVIDIA расширит технологию DLSS 3 с генерацией кадров и на этот ускоритель, то на нём можно ожидать удвоения производительности.
Среди прочих слухов отмечается дополнительное питание в 150—180 Вт и 10% увеличение цены. Таким образом, к моменту выпуска RTX 4060 будет стоить примерно, как стоила RTX 3060 Ti (400 долларов).
слухиGeForce RTX 4060видеокартыNVIDIA
комментировать похожие новости
TechPowerUp
Сайт Videocardz сообщает, что компания NVIDIA на самом деле планирует новые модели существующей 300-й серии видеокарт.
Сообщается, что речь идёт о GeForce RTX 30, и как минимум две модели будут доступны к покупке в ближайшие недели. Это будут видеокарты среднего сегмента, RTX 3060 с 8 ГБ видеопамяти, что на 4 ГБ меньше оригинальной модели. Нынешняя модель продаётся за 350 долларов, так что за версию с 8 ГБ VRAM придётся платить порядка 300 долларов.
NVIDIA GeForce RTX 3060
Кроме этого NVIDIA также готовит RTX 3060 Ti с памятью GDDR6X со скоростью 19 Гб/с, как и у RTX 3070 Ti. Сейчас у этой карты пропускная способность памяти составляет 448 ГБ/с, а у обновлённой — 608 ГБ/с, на 36% быстрее.
Что касается RTX 3070 Ti с GA102, то по ней подтверждений пока нет, однако подобные модели часто выходят на локальных рынках, например, исключительно для Китая.
слухивидеопамятьвидеокартыNVIDIAGeForce RTX 3060 Ti3060
комментировать похожие новости
Videocardz
Согласно последним слухам, новая видеокарта NVIDIA GeForce RTX 4080 получит память с большей скоростью передачи данных.
Очевидно, что серия карт RTX 400 ещё находится в разработке, а потому их спецификации продолжают меняться. На этот раз появились слухи, что готовящаяся видеокарта RTX 4080 получит память GDDR6X с пропускной способностью 23 Гб/с, вместо ожидавшихся 21 Гб/с. При этом также сообщается о снижении энергопотребления с 420 Вт до 340 Вт. Такую информацию распространил известный инсайдер @kopite7kimi.
Остальные спецификации остаются неизменными, а именно GPU AD103, 9728 CUDA-ядер и 16 ГБ видеопамяти с шиной 256 бит.
Кроме того, есть информация, что карта RTX 4090 также будет оснащаться памятью со скоростью 23 Гб/с, однако к моменту релиза ещё многое может измениться.
слухиGeForce RTX 4080видеокартыNVIDIA
комментировать похожие новости
Fudzilla
Ранее уже ходили множество слухов о возможных спецификациях новых видеокарт серии RTXб, но теперь говорят о некоторых корреткировках.
Так, известный инсайдер kopite7kimi сообщил, что готовящаяся RTX 4080 получит 9728 ядер CUDA, что меньше 10240 ядер CUDA, ожидаемых изначально. Также утверждается, что TDP карты составит 420 Вт, она будет основана на GPU AD103-300-A1. Всё это будет собрано на плате PG136/139-SKU360 с 16 ГБ памяти GDDR6X.
Видеокарта NVIDIA RTX
Таким образом, будет снижено на 5% число ядер CUDA. Это вряд ли заметно скажется на производительности, и по-прежнему ожидается, что RTX 4080 будет набирать более 15000 очков в TimeSpy.
Ожидается, что серия карт NVIDIA RTX 40 будет представлена в IV квартале, а начнётся всё с RTX 4090, RTX 4080 и RTX 4070. Однако старта продаж стоит ожидать позднее.
слухиGPUGeForce RTX 4080видеокартыNVIDIA
комментировать похожие новости
KitGuru
Известный инсайдер Kopite7kimi в Twitter опубликовал первый бенчмарк флагманской видеокарты Ada GeForce RTX 4090.
В тесте 3DMark Time Spy Extreme эта видеокарта набрала более 19000 баллов. Для сравнения с топовыми картами Ampere, это на 66% больше, чем у RTX 3090 Ti, и на 82% больше RTX 3090.
NVIDIA RTX 40xx
Однако это лишь синтетический тест, который не раскрывает картину полностью. В других тестах и играх результат может быть иным. Тем не менее, это огромный прирост производительности в разрешении 4K.
Что касается производительности в сфере трассировке лучей, то эта величина остаётся самой большой загадкой. Известно, что карта будет содержать 16384 ядер CUDA, на 52% больше, чем в RTX 3090 Ti. При этом прирост будет обеспечен не только ростом числа ядер, но и ростом частоты и энергопотребления.
Ожидается, что карты на базе GPU c кодовым именем Ada появятся в IV квартале этого года. Правда, по последним слухам, в этом году мы увидим только модель RTX 4090.
слухиGeForce RTX 4090видеокартыNVIDIA
комментировать похожие новости
Videocardz
Сайт Videocardz сообщает о датах планируемого выпуска новой серии видеокарт GeForce RTX 40, а также некоторые особенности их спецификаций.
Так, отмечается, что карты RTX 4090 и RTX 4080 будут иметь намного больше общего, чем ожидалось ранее. Несмотря на то, что они будут основаны на разных GPU: AD102 и AD103, печатная плата будет одинаковой — PG139. Отличаться будут лишь их конструктивные версии: 330 для RTX 4090 и 360 для RTX 4080. Пока не ясно будут ли GPU совместимы по контактам, но уже очевидно, что платы будут одинаковы.
GeForce RTX 40
В настоящее время NVIDIA не объявляла спецификации RTX 4080 и RTX 4070, и тому есть две причины. Во-первых, они основаны на разных GPU, а во-вторых, спецификации ещё не утверждены.
Что касается сроков, то NVIDIA GeForce RTX 4090 теперь ожидается в августе, модель RTX 4080 — в сентябре, а RTX 4070 — октябре. Однако это не конечные даты. На складах у производственных партнёров лежит масса карт серии RTX 30, и, очевидно, последнее что в таких условиях нужно NVIDIA — это начать поставки нового поколения.
слухиGeForce RTX 40904080видеокартыNVIDIA
комментировать похожие новости
Videocardz
Известный инсайдер Kopite7kimi опубликовал свежую информацию, которая гласит, что новое поколение видеокарт NVIDIA будет выпущено в середине июля.
Флагманский ускоритель NVIDIA GeForce RTX 4090 будет содержать 126 стриминговых процессоров, что означает 16128 ядер CUDA. Это заметно меньше ожидавшихся ранее 140—142 мультипроцессоров. При этом известно, что чип AD102 содержит 144 потоковых мультипроцессора, то есть на 2304 ядра меньше, чем возможно. Вполне возможно, что максимальная конфигурация будет доступна в RTX 4090 Ti.
Кроме того, инсайдер рассказал о тепловыделении RTX 4090. По его данным, теперь речь идёт не о 600 Вт, а всего о 450 Вт TDP. Более горячим также должен быть топовый RTX 4090 Ti. Для сравнения, TDP в 450 Вт имеет RTX 3090 Ti. Что касается производительности, то она будет вдвое выше, чем у RTX 3090, которая потребляет 350 Вт.
В дополнение Kopite повторил свои ранние заявления, что RTX 4090 получит 24 ГБ видеопамяти GDDR6X со скоростью 21 Гб/с, что при шине 384 бита будет означать пропускную способность 1 ТБ/с.
Последнее заявление, сделанное инсайдером, касается сроков релиза нового поколения видеокарт NVIDIA. Он сообщает, что GeForce RTX 40 появятся в середине июля. При этом первыми на рынок выйдут производительные решения RTX 4090, 4080 и 4070.
слухиLovelaceGPUGeForce RTX 40904080видеокартыNVIDIAграфические процессоры
комментировать похожие новости
Videocardz
Согласно слухам, новая топовая видеокарта NVIDIA GeForce RTX 4090 будет основана на процессоре AD102, и должна бы содержать 24 ГБ памяти GDDR6X на скорости 24 Гб/с.
Однако согласно свежим слухам, видеокарта GeForce RTX 4090 будет использовать видеопамять с той же пропускной способностью, что применяется сейчас в GeForce RTX 3090 Ti, то есть 21 Гб/с.
Пакет NVIDIA RXT Suprim
При этом будет использована также модификация GPU AD102-300. В результате энергопотребление будет увеличено до 600 Вт, что заметно больше 450—500 Вт, которые потребляет нынешний флагман RTX 3090 Ti.
Очень любопытно будет узнать производительность этого ускорителя, ведь изменения архитектуры, наряду с повышением энергопотребления должны дать резкий скачок в скорости.
слухиLovelaceвидеопамятьвидеокартыNVIDIA
комментировать похожие новости
TweakTown
В ходе CES 2022 компания NVIDIA представила новый графический ускоритель GeForce RTX 3090 Ti, карту, которая быстрее RTX 3090, флагмана современной линейки Ampere.
Компания обещала, что больше сведений о новом продукте будет опубликовано в конце месяца, то есть января. Но вот до сих пор ничего об RTX 3090 Ti не слышно.
На запрос The Verge представитель NVIDIA Джен Андерссон сообщила: «В настоящее время у нас нет больше информации касательно RTX 3090 Ti, но мы выйдем на связь, когда она появится».
Видеокарта NVIDIA GeForce RTX 3090 Ti
Ответ откровенно слабый. Стандартная отписка, к которой часто прибегают пресс-секретари, чтобы покрыть бездействие. Всё это наводит на мысль, что RTX 3090 Ti оказывается провальной.
В январе, вскоре после CES, NVIDIA якобы просила производителей карт прекратить производство RTX 3090 Ti. Блогер и инсайдер на канале Moore’s Law Is Dead (MLID) также сообщал, что по его данным эта карта «отложена на неопределённый срок». Он утверждает, что причиной этому являются проблемы с печатной платой. Энергопотребление карты составляет 450 Вт, и создание такой карты оказалось сложной задачей.
слухиGeForce RTX 3090 TiвидеокартыNVIDIA
комментировать похожие новости
Neowin
Видеокарта NVIDIA GeForce MX550 на основе архитектуры Turing предназначена для тонких мультимедийных ноутбуков. Это очень интересный сегмент, поскольку он обеспечивает производительность, сравнимую с интегрированными в CPU решениями, поднимая вопрос о необходимости дискретной видеокарты в принципе.
На сайте PassMark появился первый тест MX550. Эта карта набрала 5014 баллов в тесте G3D Mark, что практически идентично GPU Vega 8, встроенному в AMD Ryzen 9 5900HS.
Графика в AMD Ryzen 9 5900HS в том же бенчмарке демонстрирует 4968 баллов, что всего на 0,9% меньше, и более чем укладывается в статистическую ошибку. Конечно, PassMark — не самым популярный графический бенчмарк, да и число результатов в нём весьма ограничено. К сравнению предлагается лишь 9 результатов iGPU 5900HS.
Результаты тестирования NVIDIA MX550 в PassMarkСравнение MX550 и Ryzen 9 5900HS в PassMark
Видеокарта MX550 основана на GPU TU117, самом медленном варианте процессора с архитектурой Turing. В нём нет трассировки лучей и DLSS, но вряд ли кто-то захотел бы их использовать, учитывая его базовую производительность. Пока NVIDIA не подтвердила тепловыделение MX550. Скорее всего, больше информации мы получим к моменту её выпуска, который запланирован на «эту весну».
тестированиеслухиVega 8Ryzen 9GPUMX550PassMarkвидеокартыноутбукиTuringNVIDIAбенчмарки
комментировать похожие новости
Videocardz
В Сети появились спецификации новой графической платы NVIDIA GeForce RTX 3090 Ti, которая, как уверяется, получит видеопамять с невероятной пропускной способностью в 1 ТБ/с.
Сообщается, что ускоритель RTX 3090 Ti будет иметь 24 ГБ памяти GDDR6X со скоростью 21 Гб/с. Таким образом, при шине 384 бита общая пропускная способность достигнет 1008 ГБ/с.
Печатная плата видеокарты GeForce RTX 3090 Ti
Что касается GPU, то он будет содержать 84 SM. Всего он предложит 10752 ядра CUDA (против 10496 ядер при 82 SM в RTX 3090). Наряду с ними карта предложит ядра RT нового поколения, ядра Tensor и совершенно новый потоковый мультипроцессинговый блок. Базовая частота GPU будет составлять 1560 МГц, а в режиме Boost она увеличится до 1860 МГц. Тепловыделение карты заявлено на уровне 450 Вт, на 100 Вт выше, чем у RTX 3090.
Разъём дополнительного питания PCIe 5.0
Кроме этого, новая видеокарта GeForce RTX 3090 Ti станет первым графическим решением, совместимым с шиной PCIe Gen 5.0 с единственным 6-контактным разъёмом дополнительного питания, который может обеспечивать до 600 Вт.
слухиGeForce RTX 3090 TiвидеокартыNVIDIA
комментировать похожие новости
Guru of 3D
Компания NVIDIA готовится к выпуску новых графических решений, среди которых и топовая мобильная видеокарта RTX 3080 Ti.
По слухам, выпуск видеокарты состоится в январе, но уже сейчас стали появляться некоторые сведения о ней. Видеокарта GeForce RTX 3080 Ti Mobile предложит самую высокую производительность в семействе Ampere для мобильных платформ. Для этого в ней будет использоваться более быстрая память, чем в RTX 3080, и повышенное тепловыделение. Так, скорость памяти возрастёт с 14 Гб/с до 16 Гб/с, а тепловыделение будет увеличено со 165 Вт у существующей модели до 175 Вт.
NVIDIA RTX Mobility
По слухам, версия Ti получит и увеличенное число ядер CUDA и TMU, однако эти спецификации доподлинно неизвестны. Ожидается, что вместо 6144 ядер CUDA в RTX 3080 версия Ti получит 7424 ядра.
слухиGeForce RTX 3080 Ti MobileвидеокартыноутбукиNVIDIA
комментировать похожие новости
TechPowerUp
Все знают, что NVIDIA готовит бюджетную видеокарту GeForce RTX 3050 на январь, но оказывается, она будет существовать в двух вариантах с разным объёмом видеопамяти и на основе разных GPU.
Согласно свежим слухам будет выпущена версия RTX 3050 на базе GA106-150 с 2560 ядрами CUDA и 8 ГБ видеопамяти, и на базе GA106-140 с 2304 ядрами CUDA и 4 ГБ памяти. Это противоречит предыдущим слухам, гласившим, что GPU будет содержать 3072 ядра CUDA.
NVIDIA GeForce RTX 3050
В настоящий момент удивляет, почему для изготовления этой платы потребовался процессор GA106, ведь GA107 практически полностью соответствует требуемой конфигурации (2560 ядер, шина 128 бит). Ответ может заключаться в необходимости использования некачественных процессоров более высокого уровня, либо в желании компании позднее выпустить версию RTX 3050 Ti. Во втором случае использование одинакового GPU на разных моделях снизит трудозатраты на выпуск видеокарт у производственных партнёров.
Достоверно всё станет известно уже 4 января, когда NVIDIA должна официально представить видеокарту. Релиз же GeForce RTX 3050 должен состоятся 27 января.
слухивидеокартыNVIDIAGeForce RTX 3050
комментировать похожие новости
Videocardz
Как известно, компания NVIDIA на январь готовит обновление своих видеокарт серии RTX 30. В настоящее время, самой дешёвой моделью для настольных систем является RTX 3060, но по слухам, в скором времени NVIDIA расширит модельный ряд, добавив в него RTX 3050.
Сейчас видеокарты RTX 3050 и RTX 3050 Ti существуют только для ноутбуков, таким образом, данная модель впервые появится для настольных ПК.
NVIDIA GeForce RTX 3050
По имеющейся информации, видеокарта RTX 3050 будет основана на GPU GA106-150 с 3072 ядрами CUDA. Подсистема памяти будет представлена 8 ГБ GDDR6 с шириной шины 128 бит. Считается, что настольная NVIDIA RTX 3050 будет быстрее GTX 1660 Super, но медленнее RTX 2060 12 ГБ. Учитывая эти оценки можно сказать, что новый ускоритель NVIDIA предназначен для усиления конкурентных позиций против готовящихся карт AMD RX 6500 XT и Intel Arc Alchemist 128EU.
слухивидеокартыNVIDIAGeForce RTX 3050
комментировать похожие новости
KitGuru
Продолжающийся дефицит процессоров заставляет NVIDIA всё чаще смотреть на прошлые поколения GPU. На этот раз появились слухи, что компания готовится в следующем году в очередной раз перевыпустить видеокарту GeForce RTX 2060.
Компания NVIDIA в январе уже возобновляла выпуск видеокарты RTX 2060. И теперь, на фоне продолжающегося дефицита, фирма готовит обновлённую версию с индексом KX, которая получит ровно те же спецификации, что и существующая модель, за исключением объёма видеопамяти, который будет составлять 12 ГБ.
NVIDIA GeForce RTX 2060
Фирма уже начала информировать свои производственных партнёров об этой карте, которая должна поступить в продажу к концу текущего года. Это даст достаточно времени производственникам наладить выпуск новой модели ко 2022 году.
Очевидно, что решение NVIDIA возобновить RTX 2060 с увеличенным объёмом памяти связано с катастрофической нехваткой RTX 3060, за которую спекулянты просят минимум 650 долларов, что вдвое выше рекомендуемой цены.
слухивидеокартыNVIDIAGeForce RTX 2060
комментировать похожие новости
Kit Guru
Видеокарты NVIDIA GeForce RTX 3060 и RTX 3060 Ti будут опять поставляться ограниченно уже в сентябре. Об этом сообщает китайский магазин IT Home.
Это сообщение наверняка разочарует всех, кто мечтал приобрести новую видеокарту, глядя, как цены на них потихоньку стабилизировались, а объёмы поставок во II квартале выросли до 123 миллионов штук.
Семейство видеокарт NVIDIA RTX 30
Сайт отмечает, что поставки RTX 3060 и RTX 3060 Ti сократятся в сентябре на 50%, по сравнению с тем, что было первые 20 дней августа. Эту информацию также подтверждают представители многих производителей, которые активно обсуждают сложившуюся ситуацию на форумах. Ситуация с ограниченными поставками продлится как минимум до конца сентября, после чего, постепенно, она должна начать улучшаться.
Сайт VideoCardz считает, что проблема не будет ограничена двумя вышеуказанными моделями, а распространится на всё производство карт от NVIDIA и AMD. Причиной всего это дефицита называется очередное сокращение производства видеокарт в Китае из-за новых локдаунов, вызванных COVID-19.
слухирыноквидеокартыAMDNVIDIAGeForce RTX 3060 Ti3060
комментировать похожие новости
Neowin
Новости о подготовке графических процессоров NVIDIA с кодовым именем Ada Lovelace продолжают радовать. Согласно свежей информации, видеокарты на их основе будут потреблять 400—500 Вт энергии и при этом обеспечат прирост производительности, по сравнению с нынешним поколением, в два раза.
Отмечается, что GPU Ada Lovelace обеспечат тот же рывок производительности, который мы наблюдали при переходе от Maxwell к Pascal, и он был фантастическим. Все помнят, сколь хороша была GeForce GTX 980 Ti, однако GeForce GTX 1080 Ti стала большим технологическим прорывом.
NVIDIA Ada Lovelace
Между настоящим моментом и выпуском видеокарт 400-й серии нас ожидает обновление Ampere-серии GeForce RTX 30, которое получит постфикс «SUPER». Это должно произойти до конца текущего года или в самом начале следующего. Что касается видеокарт GeForce RTX 40 с процессором Ada Lovelace, то его стоит ожидать во втором полугодии.
слухиLovelaceвидеокартыNVIDIAграфические процессоры
комментировать похожие новости
TweakTown
Графические процессоры NVIDIA следующего поколения, Ada Lovelace, последние дни находятся у всех на слуху. Похоже, что компания закончила этап проектирования GPU, а значит, настало время для слухов о его характеристиках.
Итак, флагманом следующего потребительского поколения видеокарт NVIDIA станет процессор AD102. Он будет изготавливаться по 5 нм нормам на заводе TSMC. Чип будет содержать 18 432 ядра CUDA. Для сравнения, GA102 в RTX 3090 имеет 10 496 ядер CUDA. Ожидаемая тактовая частота нового GPU составит 2,2 ГГц и выше, что обеспечит вычислительную производительность на уровне 81 терафлопс. Опять же, для сравнения, производительность RTX 3090 составляет 35,5 терафлопс.
GPU NVIDIA
Самым главным новшеством станет использование новой видеопамяти Micron GDDR6X с пропускной способностью 24 Гб/с, что заметно быстрее нынешней памяти в RTX 3090 с пропускной способностью 19,5 Гб/с. Поскольку AD102 имеет шину шириной 384 бита, суммарная пропускная способность составит 1152 ГБ/с, что на 23% больше, чем у флагмана NVIDIA сейчас.
Следующим этапом в подготовке процессора Ada Lovelace станет его опытное производство. Вряд ли до конца года будет готов тестовый образец. Конечный же продукт стоит ожидать в IV квартале 2022 года. Учитывая все изменения можно предположить, что производительность, будущей GeForce RTX 4090, по сравнению с GeForce RTX 3090, вырастет вдвое.
слухиLovelaceвидеокартыNVIDIAGeForce RTX 3090
комментировать похожие новости
TweakTown
Когда речь заходит о рынке ноутбуков, потребители всегда хотят иметь лучшие технологии, но за адекватную цену. Поэтому самыми популярными остаются видеокарты NVIDIA GTX 1050 Ti и GTX 1060. Но скоро всё может измениться благодаря мобильному ускорителю GeForce RTX 3050 Ti.
Эта видеокарта наверняка придётся по душе всем, кто захочет купить игровой ноутбук за относительно небольшие деньги. И вот Videocardz опубликовали скриншот GPU-Z с информацией об этой карте. Как видно, видеокарта имеет пиковую частоту 1485 МГц и содержит 4 ГБ видеопамяти GDDR6. Эту информацию сложно назвать обширной, но можно смело утверждать, что, хотя это и будет одна из самых простых мобильных карт NVIDIA на рынке, она обеспечит достаточную производительность в большинстве игр.
Когда эта видеокарта появится в продаже, пока неизвестно, но обозреватели ожидают, что купить ноутбук с ней можно будет уже летом.
Спецификации GPU-Z
слухивидеокартыноутбукиNVIDIAGeForce RTX 3050 Ti
комментировать похожие новости
Eteknix
В Сети уже появились снимки пока неанонсированного GPU GA102-225. Более того, появились спецификации и даже бенчмарки видеокарты GeForce RTX 3080 Ti, которая и основана на этом процессоре.
Ожидается, что GPU GA102-225 будет содержать 10240 ядер CUDA. На плате он будет работать с 12 ГБ сверхбыстрой памяти GDDR6X. И такая конфигурация обеспечит немыслимую производительность в майнинге ETH — 119 МХ/с. Это даже больше, чем обеспечивают GeForce RTX 3090 Founders Edition и MSI GeForce RTX 3090 SUPRIM X, у которых производительность майнинга находится в диапазоне 95—115 МХ/с.
GPU NVIDIA GA102-225
Протестированный образец RTX 3080 Ti работал с базовой частотой GPU в 1365 МГц и 1665 МГц в режиме Boost, что ниже, чем у GeForce RTX 3080 и GeForce RTX 3090.
Спецификации и производительность видеокарты GeForce RTX 3080 Ti
слухимайнингвидеокартыNVIDIAGeForce RTX 3080 Ti
комментировать похожие новости
TweakTown
В феврале компания NVIDIA анонсировала видеокарту RTX 3060, в которой была заявлена невозможность майнинга криптовалюты. К сожалению, всего через пару недель после её релиза NVIDIA допустила ошибку, и выпустила на свет драйвер лишённый этой блокировки. Теперь же компания ищет способы вернуться к этой идее, для чего готовится выпустить новую модель ускорителя.
По имеющимся слухам NVIDIA работает над новыми GPU с кодовым именем GA106-302, которые придут на смену GA106-300, установленным в RTX 3060. Эти новые чипы получат и новый PCI Device ID, а значит, они не смогут работать со старыми драйверами и ограничение майнинга должно снова заработать.
GeForce RTX 3060
Кроме того, что таким образом удастся решить проблему утекшего разблокированного драйвера, чип также получит и «дальнейшие механизмы» ограничения добычи Ethereum на RTX 3060. Эти же решения будут использованы и в будущем на видеокартах RTX 3080 Ti и RTX 3070 Ti.
Официально NVIDIA пока ничего не заявляет. Если приведённая информация верна, то графический процессор GA106-302 будет всплывать в новостях уже через месяц.
слухимайнингвидеокартыNVIDIAGeForce RTX 3060
комментировать похожие новости
KitGuru
Стоимость кадра
: видеокарты с лучшим соотношением цены и качества прямо сейчас Мы следим за ценами на графические процессоры уже более года, и приятно видеть, что цены все ближе и ближе к рекомендованной производителем розничной цене.
Но, как мы упоминали в этой статье, трудно сказать, насколько это интересно для потенциальных покупателей, учитывая, что большинству этих продуктов уже 18 месяцев, и, вероятно, к концу этого года они будут заменены гораздо более мощными продуктами следующего поколения. аппаратное обеспечение. Опять же, мы считаем, что если бы у геймеров была возможность купить RTX 3070 за 730 долларов или RX 6700 XT за 570 долларов в начале этого года, они бы ухватились за нее. Так что, хотя цены все еще отстой по сравнению с 2019 годом, могло быть и хуже, намного хуже. Если вам нужны доказательства этого, просто вернитесь и ознакомьтесь с нашим обновлением цен на GPU за май 2021 года, когда 3070 был ближе к 1600 долларов (!).
Во всяком случае, для тех из вас, кто сейчас готов покупать и не хочет ждать появления продуктов следующего поколения, потому что, давайте будем честными, цены почти наверняка будут завышены, а доступность будет низкой. день запуска — что вы должны купить сейчас? Для этого мы собрали свежие данные и провели анализ стоимости кадра.
Сегодняшняя цель состоит в том, чтобы протестировать все графические процессоры AMD и Nvidia текущего поколения, чтобы установить производительность FPS и, используя эти данные, провести некоторое сравнение стоимости кадра. Всего имеется 17 графических процессоров текущего поколения (или до 18, если вы включите RX 6400, но у нас пока нет ни одного из них), и мы не думаем, что упускаем что-то действительно ценное.
Поскольку нужно охватить множество графических процессоров, мы протестировали их только в 6 играх, но мы тщательно выбирали названия на основе последних 50 игровых тестов. Названия включают Red Dead Redemption 2, Rainbow Six Siege, Far Cry 6, Hitman 3, Dying Light 2 и Shadow of the Tomb Raider.
Вместо просмотра данных по отдельным играм мы рассчитали среднее геометрическое для шести игр и будем использовать его для расчета стоимости кадра. Причина использования настроек среднего качества почти во всех играх заключалась в том, чтобы позволить моделям начального уровня достичь разумного уровня производительности, а затем на высоких уровнях мы можем посмотреть на данные 4K.
Мы тестировали в разрешениях 1080p, 1440p и 4K на процессоре Ryzen 7 5800X3D с памятью DDR4-3600 CL16 и включенной функцией изменения размера BAR. Мы использовали информацию о ценах, собранную 20 апреля, а это означает, что следует ожидать некоторого движения цен, хотя основная часть данных должна быть достоверной.
При этом наиболее ценной информацией здесь являются данные о частоте кадров. Просто выберите интересующий вас уровень производительности, возьмите текущую цену, на которую вы смотрите, и разделите ее на частоту кадров, чтобы получить стоимость за кадр. Даже если вы находитесь не в Соединенных Штатах, поскольку мы обычно даем рекомендации, основанные на ценах на этом рынке, вы можете проверить цены на соответствующие продукты в вашем регионе и, используя приведенную выше формулу, вы можете легко найти вариант, который дает наибольшую выгоду. смысл для вас.
Лучшее соотношение цены и качества при разрешении 1080p
Лучшим графическим процессором 1080p на данный момент является Radeon RX 6600, стоимость которого в нашем тестировании составляет 2,98 доллара за кадр. Это делает его на 16% дешевле, чем 6500 XT за кадр. Что шокирует в этих данных, так это то, что 6500 XT должен стоить ~ 170 долларов, что соответствует стоимости кадра RX 6600, и это будет делаться с половиной видеопамяти, половиной пропускной способности PCIe, без аппаратного кодирования и полное отсутствие декодирования AV1.
Другими словами, даже несмотря на то, что Radeon 6500 XT приближается к рекомендованной производителем розничной цене, она продолжает оставаться ужасным продуктом, который никогда не должен продаваться по цене выше 150 долларов — на самом деле 100 долларов или меньше гораздо больше подходят для этого класса. продукта. Безумно думать, что этот графический процессор всего несколько месяцев назад продавался по цене более 270 долларов, а некоторые обозреватели рекомендовали его просто потому, что это был самый дешевый новый графический процессор, который вы могли купить.
Radeon RX 6600 также издевается над RTX 3050, поскольку GeForce GPU стоит на 26% больше за кадр. Согласно нашим ценовым данным, он может быть на 10 долларов дешевле, но поскольку он на 20% медленнее, это не так уж и много.
GeForce RTX 3060 Ti работает лучше, несмотря на более высокую стоимость кадра. Это на 10 долларов больше, чем 6700 XT, и всего на 5% медленнее, так что можно утверждать, что такие функции, как DLSS, помогают компенсировать этот отрыв. Для сравнения более дорогих видеокарт давайте перейдем к разрешению 1440p.
Лучшее значение при разрешении 1440p
Разница между Radeon 6700 XT и GeForce RTX 3060 Ti остается примерно такой же при разрешении 1440p, а стоимость графического процессора GeForce примерно на 7% выше за кадр. По мере того, как мы выходим за пределы среднего диапазона и приближаемся к более дорогим моделям, AMD показывает хорошие результаты.
Radeon RX 6800 XT предлагает на 5% больше производительности, чем RTX 3080 с 12 ГБ памяти, что говорит о том, что образец из 6 игр немного более благоприятен для AMD по сравнению с нашим тестом из 50 игр, но мы говорим только о 5 % несоответствия, хотя имейте это в виду.
С точки зрения общей производительности FPS, 6800 XT, RTX 3080, 3080 12 ГБ, 3080 Ti и даже 3090 очень похожи. 3080 Ti и 6800 XT здесь хорошо сочетаются друг с другом, поскольку в нашем тестировании они оба показали в среднем 157 кадров в секунду, но графический процессор Radeon в настоящее время в США на 24% дешевле, что делает его более привлекательным с точки зрения стоимости за кадр.
Лучшее соотношение цены и качества при разрешении 4K
Как мы и ожидали, графические процессоры Nvidia RTX Ampere лучше работают при более высоком разрешении 4K, и теперь 6800 XT находится на одном уровне с 3080 12 ГБ. С более широким набором игр RTX 3080 будет опережать примерно на 5-7%, и мы знаем это, потому что недавно тестировали их, но для этой функции было невозможно протестировать 17 видеокарт в 50 играх.
Данные для моделей графических процессоров среднего и нижнего уровня совпали с тем, что мы видели в наших 50 тестах игр, поэтому мы подозреваем, что более низкие настройки качества — это то, что в этом сценарии немного больше отдает предпочтение моделям AMD высокого класса.
Здесь мы видим полдюжины графических процессоров AMD и Nvidia в диапазоне 90-105 кадров в секунду, включая Radeon RX 6800 XT, 6900 XT, GeForce RTX 3080, 3080 12 ГБ, 3080 Ti и 3090. Самый доступный Опция GeForce — это оригинальная RTX 3080 за 1000 долларов, тогда как 6800 XT стоит 9 долларов. 20. Это небольшая экономия, поэтому, как обычно, все сводится к важности дополнительных функций, а именно производительности трассировки лучей и DLSS.
Где линейка GeForce становится смешной, так это в серии RTX 3090. 3090 за 1700 долларов — глупость, а 3090 Ti за 2000 долларов — такая же глупость. Битва за high-end ведется между 6900 XT и RTX 3080 Ti, обе предлагают аналогичный уровень производительности, а GeForce GPU стоит на 21% дороже.
Еще в феврале мы сравнивали 6900 XT и 3080 12 ГБ в 50 играх, и в то время цена графического процессора GeForce составляла от 1600 до 1800 долларов, а 6900 XT была ближе к 1500-1600 долларов. Модель 3080 12 ГБ стоила от 100 до 200 долларов дороже, как и сегодня. Мы думаем, что трассировка лучей и DLSS позволяют графическому процессору GeForce получить 10-процентную надбавку, но 20% — это слишком круто для нас.
Лучшее соотношение цены и качества при разрешении 1440p (Австралия)
Хотя большая часть нашей аудитории проживает в США, мы подумали, что было бы интересно проверить ценовые тенденции в нескольких других регионах, поэтому давайте начнем с Австралии. Лучшим вариантом здесь является 6600 XT, едва обошедший RX 6600, в основном оба графических процессора серии Radeon 6600 представляют собой аналогичный уровень стоимости. Затем у нас есть 6700 XT, который просто превосходит 6500 XT с точки зрения стоимости, но вы знаете, что мы относимся к стоимости кадра 6500 XT с долей скептицизма, учитывая все проблемы с этим продуктом. Мы также тестируем его с PCIe 4.0, а это означает, что при использовании PCIe 3.0 он будет намного больше.
Графический процессор GeForce с лучшим соотношением цены и качества в Австралии — это RTX 3060 Ti или 3060. 3060 Ti стоит всего на 2% дороже, чем 6700 XT за кадр, поэтому в зависимости от функций, которые вас интересуют, графический процессор GeForce может быть выбор лучшего значения.
Для тех, кто ищет высококлассный графический процессор в Австралии, Radeon 6800 XT, по-видимому, является подходящим вариантом по цене 1350 австралийских долларов, поскольку он на 23% дешевле, чем RTX 3080 Ti при том же уровне производительности. Даже если вы отклонитесь от наших данных о 50 играх, где 3080 12 ГБ и 6800 XT показали одинаковый уровень производительности, 6800 XT будет стоить 9 долларов.за кадр, что на 16% дешевле за кадр, чем у 3080 12 ГБ. Это большая премия за превосходную производительность трассировки лучей и поддержку DLSS, но, конечно, вам решать, стоят ли эти функции того.
Лучшее соотношение цены и качества при разрешении 1440p (Европа)
У нас также есть некоторые данные о ценах в евро, и здесь мы видим значительные изменения ценовых тенденций. Используя цены от Mindfactory, мы видим, что 6500 XT предлагает самую низкую стоимость кадра в 210 евро, но, конечно, RX 6600 значительно лучше, несмотря на то, что стоит на 86% дороже.
Интересно, что RTX 3060 Ti занимает здесь очень хорошие позиции и является лучшим продуктом среднего уровня, предлагая производительность, подобную 6700 XT, со скидкой 10%. RTX 3060 также конкурирует с 6600 XT.
Что касается компонентов высокого класса, AMD показывает хорошие результаты. 6800 XT можно купить за 950 евро, а оригинальная RTX 3080 стоит 1140 евро, что делает ее на целых 36% дороже. Затем, по сравнению с RTX 3080 12 ГБ, мы видим, что графический процессор GeForce получает почти на 50% больше за кадр, и если мы отойдем от данных 50 игр и скажем, что эти два графических процессора совпадают с точки зрения производительности, 12 ГБ 3080 по-прежнему получается на 41% дороже за кадр.
Судя по ценам Mindfactory, вы, несомненно, предпочтете 6800 XT любому графическому процессору серии 3080 или 3090 от Nvidia.
Заключительные примечания
Вот как обстоят дела с графическими процессорами по состоянию на апрель 2022 года. Конечно, цены на данный момент очень изменчивы и могут измениться для некоторых моделей к тому времени, когда вы будете читать это. Мы советуем выяснить, какой уровень производительности вам нужен, а затем сравнить текущие цены на эти продукты.
Цифры здесь служат приблизительным ориентиром, но если вы хотите получить очень точные данные для определенных матчей, обязательно проверьте 50 игровых тестов. На данный момент мы обновили данные для большинства графических процессоров. Единственная видеокарта, которую мы настоятельно рекомендуем вам избегать, — это Radeon RX 6500 XT и, возможно, новая 6400 XT, которую мы вскоре рассмотрим.
Radeon RX 6600 — одна из лучших бюджетных видеокарт, которую вы собираетесь получить прямо сейчас, мы бы не выбрали ничего ниже этого. С другой стороны, RTX 3090 и 3090 Ti также следует избегать, но не потому, что они плохие продукты, а потому, что их цена все еще завышена и не предлагает большой ценности. Мы надеемся, что это руководство поможет тем из вас, кто покупает новую видеокарту прямо сейчас.
Ярлыки для покупок:
- AMD Radeon RX 6700 XT на Amazon
- AMD Radeon RX 6800 XT на Amazon
- AMD Radeon RX 6600 на Amazon
- Nvidia GeForce RTX 3060 на Amazon
- Nvidia GeForce RTX 3070 на Amazon
- Nvidia GeForce RTX 3080 на Amazon
- Nvidia GeForce RTX 3090 на Amazon
Тесты GPU для глубокого обучения 2021
Хотя мы протестировали лишь небольшую часть всех доступных GPU, мы думаем, что рассмотрели все GPU, которые в настоящее время лучше всего подходят для обучения и разработки с помощью глубокого обучения благодаря своим вычислительным возможностям и возможностям памяти, а также их совместимости с современные фреймворки глубокого обучения.
GTX 1080TI
Классический графический процессор NVIDIA для глубокого обучения, выпущенный только в 2017 году, с 11 ГБ памяти DDR5 и 3584 ядрами CUDA был разработан для вычислительных рабочих нагрузок. Он уже давно снят с производства и был просто добавлен в качестве ориентира.
RTX 2080TI
RTX 2080 TI была выпущена в четвертом квартале 2018 года. Она оснащена 5342 ядрами CUDA, организованными в виде 544 тензорных ядер NVIDIA Turing смешанной точности, обеспечивающих 107 тензорных терафлопс производительности ИИ и 11 ГБ сверхбыстрой памяти GDDR6. Память. Производство этого графического процессора было прекращено в сентябре 2020 года, и сейчас он практически недоступен.
Titan RTX
Titan RTX основан на самой большой версии архитектуры Turing™. Titan RTX обеспечивает производительность 130 тензорных терафлопов благодаря 576 тензорным ядрам и 24 ГБ сверхбыстрой памяти GDDR6.
Quadro RTX 6000
Quadro RTX 6000 — это серверная версия популярного Titan RTX с улучшенной вентиляцией нескольких графических процессоров, дополнительными возможностями виртуализации и памятью ECC. Он питается от того же Turing ™ в качестве ядра Titan RTX с 576 тензорными ядрами, обеспечивающими производительность 130 тензорных терафлопов и 24 ГБ сверхбыстрой памяти GDDR6 ECC.
Quadro RTX 8000
Quadro RTX 8000 — старший брат RTX 6000. С тем же процессором GPU, но с удвоенной памятью GPU: 48 ГБ GDDR6 ECC. Фактически, в настоящее время это графический процессор с самой большой доступной памятью графического процессора, который лучше всего подходит для самых требовательных к памяти задач.
RTX 3080
Одна из первых моделей графических процессоров на базе архитектуры NVIDIA Ampere™ с улучшенными ядрами RT и Tensor и новыми потоковыми мультипроцессорами. RTX 3080 оснащен 10 ГБ сверхбыстрой памяти GDDR6X и 8704 ядрами CUDA.
RTX 3080 Ti
Старший брат RTX 3080 с 12 ГБ сверхбыстрой памяти GDDR6X и 10240 ядрами CUDA.
RTX 3090
GeForce RTX™ 3090 относится к классу TITAN графических процессоров NVIDIA Ampere™. Он оснащен 10496 ядрами CUDA, 328 тензорными ядрами третьего поколения и новыми потоковыми мультипроцессорами. Как и Titan RTX, он имеет 24 ГБ памяти GDDR6X.
NVIDIA RTX A6000
NVIDIA RTX A6000 — это обновленная версия Quadro RTX 6000 на базе Ampere. Она оснащена тем же процессором GPU (GA-102), что и RTX 309.0, но со всеми включенными ядрами процессора. Что приводит к 10752 ядрам CUDA и 336 тензорным ядрам третьего поколения. Кроме того, у него вдвое больше памяти графического процессора по сравнению с RTX 3090: 48 ГБ GDDR6 ECC.
Tesla V100
Обладая 640 тензорными ядрами, Tesla V100 стал первым в мире графическим процессором, преодолевшим барьер производительности глубокого обучения в 100 терафлопс (TFLOPS), включая 16 ГБ памяти HBM2 с максимальной пропускной способностью. Он основан на графическом процессоре Volta, который доступен только для серии профессиональных графических процессоров NVIDIA.
NVIDIA A100
Nvidia A100 — флагман поколения процессоров Nvidia Ampere. Благодаря 6912 ядрам CUDA, 432 тензорным ядрам третьего поколения и 40 ГБ памяти HBM2 с максимальной пропускной способностью. Один A100 преодолевает барьер производительности Peta TOPS.
Получение максимальной производительности от Tensorflow
Были приняты некоторые меры, чтобы получить максимальную производительность от Tensorflow для сравнительного анализа.
Размер пакета
Одним из наиболее важных параметров оптимизации рабочей нагрузки для каждого типа графического процессора является использование оптимального размера пакета. Размер пакета указывает, сколько параллельных размножений сети выполняется, результаты каждого размножения усредняются по пакету, а затем результат применяется для корректировки весов сети. лучший размер пакета с точки зрения производительности напрямую связан с объемом доступной памяти графического процессора .
Больший размер пакета повысит параллелизм и улучшит использование ядер графического процессора. Но размер пакета не должен превышать доступную память графического процессора , так как в этом случае должны сработать механизмы подкачки памяти и снизить производительность, иначе приложение просто аварийно завершает работу с исключением «недостаточно памяти».
Большой размер партии в некоторой степени не оказывает отрицательного влияния на результаты обучения, напротив, большой размер партии может иметь положительный эффект для получения более обобщенных результатов. Примером может служить BigGAN, где для достижения наилучших результатов предлагается размер пакета до 2048. Еще одна интересная информация о влиянии размера партии на результаты обучения была опубликована OpenAI.
Tensorflow XLA
Функция производительности Tensorflow, которая была объявлена стабильной некоторое время назад, но по-прежнему отключена по умолчанию, — это XLA (ускоренная линейная алгебра). Он выполняет оптимизацию графа сети, динамически компилируя части сети в определенные ядра, оптимизированные для конкретного устройства. Это может дать выигрыш в производительности от 10% до 30% по сравнению со статическими ядрами Tensorflow для разных типов слоев.
Эту функцию можно включить с помощью простой опции или флага среды, и она напрямую влияет на производительность выполнения. Как включить XLA в своих проектах читайте здесь.
Обучение с плавающей запятой 16 бит / смешанной точности
Что касается заданий логического вывода, то для повышения производительности предоставляется более низкая точность с плавающей запятой и еще более низкое 8- или 4-битное целочисленное разрешение. В большинстве ситуаций обучения 16-битная точность с плавающей запятой также может применяться для задач обучения с незначительной потерей точности обучения и может значительно ускорить выполнение заданий обучения. Применение 16-битной точности с плавающей запятой не так уж тривиально, поскольку модель должна быть настроена для ее использования. Поскольку не все этапы вычислений должны выполняться с более низкой битовой точностью, смешивание различных битовых разрешений для вычислений называется «смешанной точностью».
Полный потенциал обучения смешанной точности будет лучше изучен с помощью Tensor Flow 2.X и, вероятно, станет тенденцией развития для повышения производительности платформы глубокого обучения.
Мы предоставляем тесты для 32-битной и 16-битной точности с плавающей запятой в качестве эталона для демонстрации потенциала.
Тест глубокого обучения
Модель визуального распознавания ResNet50 в версии 1.0 используется для нашего теста. Как классическая сеть глубокого обучения с ее сложной 50-уровневой архитектурой с различными сверточными и остаточными слоями, она по-прежнему является хорошей сетью для сравнения достижимой производительности глубокого обучения. Поскольку он используется во многих бенчмарках, доступна близкая к оптимальной реализация, обеспечивающая максимальную производительность графического процессора и показывающая пределы производительности устройств.
Среда тестирования
Мы использовали наш сервер AIME A4000 для тестирования. Это продуманная среда для запуска нескольких высокопроизводительных графических процессоров, обеспечивающая оптимальное охлаждение и возможность запуска каждого графического процессора в слоте PCIe 4.0 x16, напрямую подключенном к ЦП.
Поколение NVIDIA Ampere поддерживает интерфейс PCIe 4.0, который удваивает скорость передачи данных до 31,5 ГБ/с между ЦП и между графическими процессорами.
Возможность подключения оказывает заметное влияние на производительность глубокого обучения, особенно в конфигурациях с несколькими графическими процессорами.
Кроме того, AIME A4000 обеспечивает сложное охлаждение, необходимое для достижения и поддержания максимальной производительности.
The technical specs to reproduce our benchmarks:
- AIME A4000, Epyc 7402 (24 cores), 128 GB ECC RAM
- Ubuntu 20.04
- NVIDIA driver version 455.45
- CUDA 11.1.74
- CUDNN 8.0.5
- Tensorflow 1.15.4
Скрипты Python, использованные для теста, доступны на Github по адресу: Tensorflow 1. x Benchmark
Результатом наших измерений является среднее изображение в секунду, которое можно обучить при выполнении 100 пакетов с заданным размером пакета.
Поколение NVIDIA Ampere явно лидирует, а A100 рассекретила все остальные модели.
При обучении с плавающей запятой 16-битной точности ускорители вычислений A100 и V100 увеличивают свое преимущество. Но также RTX 3090 может более чем удвоить производительность по сравнению с 32-битными вычислениями с плавающей запятой.
Ускорение графического процессора по сравнению с центральным процессором увеличивается здесь до 167-кратной скорости 32-ядерного процессора, что делает вычисления на графическом процессоре не только возможными, но и обязательными для высокопроизводительных задач глубокого обучения.
Производительность глубокого обучения с несколькими графическими процессорами
Следующий уровень производительности глубокого обучения заключается в распределении рабочих и обучающих нагрузок между несколькими графическими процессорами. AIME A4000 поддерживает до 4 графических процессоров любого типа.
Глубокое обучение хорошо масштабирует на нескольких графических процессорах. Метод выбора для масштабирования нескольких GPU как минимум в 90% случаев — разнести батч по графическим процессорам. Таким образом, эффективный размер пакета представляет собой сумму размера пакета каждого используемого графического процессора.
Таким образом, каждый GPU вычисляет свой пакет для обратного распространения для примененных входных данных среза пакета. Затем результаты каждого графического процессора обмениваются и усредняются, а веса модели корректируются соответствующим образом и должны распределяться обратно на все графические процессоры.
Что касается обмена данными, то для сбора результатов партии и корректировки весов перед запуском следующей партии приходится пик обмена данными. В то время как графические процессоры работают над пакетом, обмен данными между графическими процессорами не происходит или не происходит вообще.
В этом стандартном решении для масштабирования нескольких графических процессоров необходимо убедиться, что все графические процессоры работают с одинаковой скоростью, иначе самый медленный графический процессор будет узким местом , которого должны ждать все графические процессоры! Поэтому смешивание разных типов GPU бесполезно .
С AIME A4000 достигнут хороший коэффициент масштабирования 0,88, поэтому каждый дополнительный графический процессор добавляет около 88% своей возможной производительности к общей производительности
Производительность обучения в перспективе
Чтобы получить более полное представление о том, как измерение количества изображений в секунду преобразуется во время обработки и ожидания при обучении таких сетей, мы рассмотрим реальный вариант обучения такой сети с большим набором данных.
Например, набор данных ImageNet 2017 состоит из 1 431 167 изображений. Для однократной обработки каждого изображения набора данных, так называемой 1 эпохи обучения, в ResNet50 потребуется около:
Конфигурация | поплавок 32 обучение | поплавок 16 тренировочный |
---|---|---|
Процессор (32 ядра) | 27 часов | 27 часов |
Один RTX 2080 TI | 69 минут | 29 минут |
Один RTX 3080 | 53 минуты | 22 минуты |
Один RTX 3080 TI | 45 минут | 21 минута |
Один RTX 3090 | 41 минута | 18 минут |
Один RTX A6000 | 41 минута | 16 минут |
Одиночный NVIDIA A100 | 23 минуты | 8,5 минут |
4 x RTX 2080TI | 19 минут | 8 минут |
4 х Тесла V100 | 15 минут | 4,5 минуты |
4 x RTX 3090 | 11,5 минут | 5 минут |
4 x NVIDIA A100 | 6,5 минут | 3 минуты |
Обычно требуется не менее 50 периодов обучения, чтобы можно было получить результат для оценки после:
Конфигурация | поплавок 32 обучение | поплавок 16 тренировочный |
---|---|---|
Процессор (32 ядра) | 55 дней | 55 дней |
Один RTX 2080 TI | 57 часов | 24 часа |
Один RTX 3080 | 44 часа | 18 часов |
Один RTX 3080 TI | 38 часов | 17 часов |
Один RTX 3090 | 34 часа | 14,5 часов |
Один RTX A6000 | 34 часа | 14,5 часов |
Одиночный NVIDIA A100 | 19 часов | 8 часов |
4 x RTX 2080TI | 16 часов | 6,5 часов |
4 х Тесла V100 | 12 часов | 4 часа |
4 x RTX 3090 | 9,5 часов | 4 часа |
4 x NVIDIA A100 | 5,5 часов | 2,5 часа |
Это показывает, что правильная настройка может изменить продолжительность задачи обучения с недель до одного дня или даже нескольких часов. В большинстве случаев, вероятно, желательно время тренировки, позволяющее проводить тренировку в течение ночи, чтобы получить результаты на следующее утро.
Выводы
Смешанная точность может ускорить тренировку более чем в 2 раза
Особенность, на которую стоит обратить внимание в отношении производительности, — это переключение тренировки с точности с плавающей запятой 32 на тренировку со смешанной точностью. Получение повышения производительности путем настройки программного обеспечения в зависимости от ваших ограничений, вероятно, может быть очень эффективным шагом для удвоения производительности.
Масштабирование с использованием нескольких графических процессоров более чем осуществимо
Масштабирование производительности глубокого обучения с использованием нескольких графических процессоров хорошо масштабируется как минимум до 4 графических процессоров: 2 графических процессора часто могут превосходить следующий более мощный графический процессор с точки зрения цены и производительности.
Это верно, например, при сравнении 2 x RTX 3090 с NVIDIA A100.
Лучший графический процессор для глубокого обучения?
Как и в большинстве случаев, на вопрос нет однозначного ответа. Производительность, безусловно, является наиболее важным аспектом графического процессора, используемого для задач глубокого обучения, но не единственным.
Так что это сильно зависит от ваших требований. Вот наши оценки наиболее перспективных графических процессоров для глубокого обучения:
RTX 3080 TI
Он обеспечивает наибольшую отдачу от затраченных средств. Если вы ищете экономичное решение, установка с несколькими графическими процессорами может занять лидирующие позиции в высшей лиге, при этом затраты на приобретение будут ниже, чем у одного самого высокопроизводительного графического процессора.
Обладая 12 ГБ памяти графического процессора, он имеет явное преимущество перед RTX 3080 без TI и является подходящей заменой RTX 2080 TI. Но с ростом и увеличением требований к размерам моделей глубокого обучения память объемом 12 ГБ, вероятно, также станет узким местом RTX 3080 TI.
RTX 3090
В настоящее время RTX 3090 является реальным шагом вперед по сравнению с RTX 2080 TI. Благодаря своей сложной памяти объемом 24 ГБ и явному увеличению производительности по сравнению с RTX 2080 TI он устанавливает предел для этого поколения графических процессоров для глубокого обучения.
Установка с двумя RTX 3090 может превзойти установку с четырьмя RTX 2080 TI по времени цикла глубокого обучения, с меньшим энергопотреблением и более низкой ценой.
NVIDIA A100
Если требуется максимальная производительность независимо от цены и максимальная плотность производительности, NVIDIA A100 — лучший выбор: она обеспечивает максимальную вычислительную производительность во всех категориях.
Производительность A100 значительно улучшена по сравнению с Tesla V100, что делает соотношение цены и качества более приемлемым.
Кроме того, более низкое энергопотребление 250 Вт по сравнению с 700 Вт установки с двумя RTX 3090 при сопоставимой производительности достигает диапазона, при котором при постоянной полной нагрузке разница в затратах на электроэнергию может стать фактором, который следует учитывать.