Таблица производительности видеокарт мобильных: Ноутбучные графические адаптеры. Таблица бенчмарков
Содержание
Рейтинг мобильных видеокарт — buQi.ru
Представляем рейтинг производительности мобильных видеокарт. В таблице отображены самые важные характеристики видеокарт: объем памяти, версия directx, производительность видеокарты в двух тестах 3Dmark06 и Cinebench R10 OpenGL.
Нажимая на заголовок столбца с нужной характеристикой вы можете отсортировать таблицу видеокарт по возрастанию или убыванию этой характеристики. Например, вы можете отсортировать таблицу по производительности видеокарт в 3Dmark06 и определить самую производительную видеокарту.
Нажав на название видеокарты, откроется страница с подробным описанием видеокарты и результатами тестов 3Dmark01 — 06, 3Dmark Vantage и Cinebench R10 OpenGL.
№ | Видеокарта | Код | Память | DirectX | 3Dmark06 | Cinebench OpenGL |
---|---|---|---|---|---|---|
1 | NVIDIA GeForce GTX 480M SLI | Fermi | 4096 | 11 | 20950 | 5178 |
2 | NVIDIA GeForce GTX 460M SLI | GF106 | 2×1536 | 11 | 18580 | 5340 |
3 | ATI Mobility Radeon HD 5870 Crossfire | Broadway-XT | 2×1024 | 11 | 19080 | 6380 |
4 | NVIDIA GeForce GTX 285M SLI | N10E-GTX | 2×1024 | 10 | 16590 | 4610 |
5 | NVIDIA GeForce GTX 280M SLI | N10E-GTX | 2048 | 10 | 15711 | 5543 |
6 | ATI Mobility Radeon HD 4870 X2 | M98-XT | 2048 | 1″>10.1 | 14413 | 3512 |
7 | NVIDIA GeForce GTX 485M | 11 | ||||
8 | NVIDIA GeForce GTX 480M | Fermi | 2048 | 11 | 15390 | 4900 |
9 | AMD Radeon HD 6970M | 11 | 20150 | |||
10 | NVIDIA GeForce GTX 260M SLI | NB9E-GTX | 2048 | 10 | 13178 | 3987 |
11 | NVIDIA GeForce 9800M GTX SLI | NB9E-GTX | 1024 | 10 | 14142 | 4193 |
12 | NVIDIA Quadro 5000M | Fermi | 2048 | 11 | ||
13 | NVIDIA GeForce GTX 470M | 11 | ||||
14 | ATI Mobility Radeon HD 5870 | Broadway-XT | 1024 | 11 | 12700 | 5830 |
15 | ATI FirePro M7820 | 11 | 12530 | |||
16 | NVIDIA GeForce GTX 460M | GF106 | 1536 | 11 | 12120 | 4033 |
17 | NVIDIA Quadro FX 3800M | N10E-GLM4 | 1024 | 10 | 12680 | 4420 |
18 | NVIDIA GeForce GTX 285M | N10E-GTX1 | 1024 | 10 | 12990 | 4940 |
19 | ATI Mobility Radeon HD 4870 | M98-XT | 1024 | 1″>10.1 | 10650 | 5190 |
20 | NVIDIA GeForce GTX 280M | N10E-GTX | 1024 | 10 | 12560 | 5840 |
21 | NVIDIA GeForce 9800M GT SLI | NB9E-GT2 | 512 | 10 | 14400 | |
22 | NVIDIA GeForce 9800M GTS SLI | NB9E-GT | 512 | 10 | 14050 | |
23 | ATI Mobility Radeon HD 3870 X2 | M88-XT CF | 1″>10.1 | 13430 | 4350 | |
24 | NVIDIA GeForce 8800M GTX SLI | NB8E-GTX | 512 | 10.1 | 11740 | 4920 |
25 | ATI Mobility Radeon HD 3850 X2 | M88 CF | 10.1 | 12820 | ||
26 | NVIDIA Quadro FX 3700M | NB9E-GLM3 | 1024 | 10 | 10840 | 4480 |
27 | ATI Mobility Radeon HD 4860 | M97-XT | 1″>10.1 | |||
28 | ATI FirePro M7740 | RV740 | 1024 | 10.1 | 12110 | 6650 |
29 | ATI Mobility Radeon HD 4850 | M98 | 1024 | 10.1 | 9950 | 5680 |
30 | NVIDIA GeForce GTX 260M | N10E-GT | 1024 | 10 | 10160 | 3960 |
31 | NVIDIA GeForce 9800M GTX | NB9E-GTX | 1024 | 10 | 10290 | 4650 |
32 | NVIDIA Quadro FX 2800M | NB10-GLM3 | 1024 | 10 | 11160 | |
33 | NVIDIA GeForce 9800M GT | NB9E-GT2 | 512 | 10 | 9410 | 4520 |
34 | NVIDIA GeForce 8800M GTX | NB8E-GTX | 512 | 10 | 9180 | 4580 |
35 | NVIDIA Quadro FX 3600M | NB8E-GLM | 512 | 10 | 8130 | 6190 |
36 | ATI Mobility Radeon HD 5850 | Broadway-PRO | 1024 | 11 | 9790 | 5400 |
37 | NVIDIA GeForce GTS 360M | N11E-GS1 | 1024 | 1″>10.1 | 9880 | 3660 |
38 | NVIDIA GeForce GT 555M | N12E-GE-B | 11 | |||
39 | NVIDIA GeForce GT 550M | N12P-GT | 11 | |||
40 | NVIDIA GeForce GT 445M | GF106 | 11 | |||
41 | NVIDIA GeForce GTS 260M | N10E-GS | 1024 | 1″>10.1 | ||
42 | NVIDIA GeForce GTS 160M | N10E-GS1 | 1024 | 10 | 9370 | 3430 |
43 | NVIDIA GeForce 9800M GTS | NB9E-GT | 1024 | 10 | 9500 | |
44 | NVIDIA GeForce 9800M GS | NB9E-GS1 | 1024 | 10 | 8460 | 3690 |
45 | ATI Mobility Radeon HD 5830 | Broadway | 1024 | 11 | 7730 | |
46 | ATI Mobility Radeon HD 4830 | M97 | 1″>10.1 | 8380 | 4250 | |
47 | NVIDIA GeForce GTS 150M | N10E-GE1 | 1024 | 10 | ||
48 | NVIDIA GeForce 8800M GTS | NB8E-GT | 512 | 10 | 8290 | 3160 |
49 | ATI Mobility Radeon HD 5770 | Madison-XT | 11 | |||
50 | AMD Radeon HD 6570M | Capilano | 1024 | 11 | ||
№ | Видеокарта | Код | Память | DirectX | 3Dmark06 | Cinebench OpenGL |
Советы эксперта
- Лучшие смартфоны 2012 года. Советы эксперта
- Лучшие наушники 2012 года. Советы эксперта
- Лучшие флешки 2012 года. Советы эксперта
- Лучшие игровые покупки. Советы эксперта
- Твердотельные накопители данных. Зачем нужны SSD?
- Как выбрать электронную книгу? Советы эксперта
Планшеты
- Lenovo Note8 с 64-битным процессором и поддержкой 4G
- Новый планшет Nokia N1 на базе Android 5.0
- Google Nexus 9 – первые впечатления
- Iconia A1-810: новинка от Acer
- ASUS MeMo Pad уже в продаже
- Amazon Kindle Fire HD 8.9 LTE в AT&T с 5 апреля
Ноутбуки
- Обновление линейки ультрабуков Samsung
- Премиум-пиксели: KIRAbook от Toshiba со сверхчетким дисплеем
- Ноутбук для студентов Latitude 3330 от Dell
- Ноутбук-гибрид от ASUS Taichi 31 c двумя дисплеями
- GeForce 700M для ноутбуков от всех ведущих производителей
- Dell XPS 13 c дисплеем 1080p уже в продаже
Мобильные телефоны
- Vertu Clous De Paris: дорогой подарок к 23 февраля!
- Sony Xperia Z2 и Z3 получат Android 5. 0 Lollipop в ближайшее время
- Стали известны цены на Mi Note и Mi Note Pro
- Золотой Nokia Lumia 930
- Новинка — HTC A12
- Blu Studio 7.0 — 7-дюймовый смартфон из США
NVIDIA представила мобильные видеокарты GeForce RTX 40
В рамках выставки CES 2023 в Лас-Вегасе NVIDIA представила видеокарты GeForce RTX 40 для ноутбуков, теперь архитектура Ada Lovelace будет доступна и на мобильном сегменте. Новые чипы будут использоваться более чем в 170 ноутбуках всех основных производителей, они поднимут планку по эффективности энергопотребления и производительности.
NVIDIA говорит о трехкратном увеличении эффективности по сравнению с предыдущим поколением, а также о четырехкратном повышении производительности в играх AAA, таких как Cyberpunk 2077. Причем даже «младшие» видеокарты смогут обойти предыдущих флагманов. Впрочем, здесь свою роль сыграли такие технологии, как DLSS, что и позволило получить столь высокие цифры. В общей сложности NVIDIA представляет пять видеокарт.
Подписывайтесь на группу Hardwareluxx ВКонтакте и на наш канал в Telegram (@hardwareluxxrussia).
Впервые с моделью 90
Флагманом новой линейки становится видеокарта NVIDIA GeForce RTX 4090 «для ноутбуков», которая обеспечивает игры в разрешении 4K с частотой кадров больше 60 fps. Впервые видеокарта модельным номером 90 используется в ноутбуках, а не только в настольных ПК. GPU предлагает 9.728 потоковых процессоров, по 256-битной шине подключены 16 Гбайт GDDR6.
Мобильная видеокарта GeForce RTX 4090 примерно соответствует настольной GeForce RTX 4080 на чипе AD103, хотя NVIDIA довольно серьезно снизила тактовые частоты. В зависимости от модели, новые мобильные GPU можно конфигурировать в диапазоне от 80 до 150 Вт, частоты Boost меняются от 1.455 до 2.040 МГц. Кроме того, можно включить дополнительный Dynamic Boost, который добавит еще 25 Вт.
Следующая по старшинству – видеокарта GeForce RTX 4080 «для ноутбуков». Ее энергопотребление можно снизить до 60 Вт, но придется пойти на жертвы по потоковым процессорам и памяти. Используются 7.424 ядер CUDA, 12 Гбайт GDDR6 подключены по 192-битной шине. «Младшей» видеокартой в мире мобильных GeForce RTX 40 становится GeForce RTX 4050 «для ноутбуков». Здесь доступны 2.560 потоковых процессоров, а 6 Гбайт видеопамяти GDDR6 подключены по 96-битному интерфейсу. Тепловой пакет можно конфигурировать от 35 до 115 Вт, что позволит выпустить очень экономичные ноутбуки. Благодаря поддержке DLSS 3 видеокарта сможет дать высокую частоту кадров без серьезных компромиссов по качеству картинки. Предшествующая технология здесь тоже давала свои преимущества.
В серединке расположились видеокарты GeForce RTX 4070 и GeForce RTX 4060 «для ноутбуков» с 4.608 и 3.072 потоковыми процессорами, а также 8 Гбайт видеопамяти. Они справятся с играми в разрешении 1440p и частотой кадров 80 fps.
Обзор видеокарт
Модель | Потоковые процессоры | Частота Boost | Память | Интерфейс | TGP |
GeForce RTX 4090 для ноутбуков | 9. 728 | 1.455 — 2.040 МГц | 16 GB GDDR6 | 256 бит | 80 — 150 Вт |
GeForce RTX 4080 для ноутбуков | 7.424 | 1.350 — 2.280 МГц | 12 GB GDDR6 | 192 бит | 60 — 150 Вт |
GeForce RTX 4070 для ноутбуков | 4.608 | 1.230 — 2.175 МГц | 8 GB GDDR6 | 128 бит | 35 — 115 Вт |
GeForce RTX 4060 для ноутбуков | 3.072 | 1.470 — 2.370 МГц | 8 GB GDDR6 | 128 бит | 35 — 115 Вт |
GeForce RTX 4050 для ноутбуков | 2.560 | 1.605 — 2.370 МГц | 6 GB GDDR6 | 96 бит | 35 — 115 Вт |
Первые ноутбуки с видеокартами GeForce RTX 4080 и RTX 4090 выйдут 8 февраля. Модели на «младших» видеокарт появятся в продаже 22 февраля. Цены ноутбуков будут начинаться от $999.
Первые партнеры Acer, Dell и Alienware уже представили свои ноутбуки.
Обновление: После пленарного доклада NVIDIA в Лас-Вегасе можно было посмотреть первые ноутбуки GeForce RTX 40 в работе:
Лучший графический процессор для мобильных смартфонов в 2023 году
Выберите поставщика тестов:
GFXBenchGFXBench 3.0GFXBench 3.13DMarkCenturion Mark
Имя графического процессора
Рейтинг
Оценка 90 003
10-ядерный графический процессор Apple M2
1
891,5
Apple M2 8 -Core GPU
2
839.2
Apple M1 7-Core GPU
3
620
Apple M1 8-Core GPU
4
588
Адрено 740
5
479
Графический процессор Apple A16, 5 ядер
6
458,5
Immortalis-G715 MP11
7
451
Графический процессор Apple A12X Bionic
8
444,7
Графический процессор Apple A15 5- Core
9
427,55
Графический процессор Apple A15, 4 ядра
10
395,75
Adreno 730
11
381
Графический процессор Apple A14 Bionic
12
317,5
Графический процессор Apple A13 Bionic
13
307
Samsung Xclipse 920
14
302
Mali-G710 MP10
15 90 003
281
Mali-G610 MP6
16
272
Adreno 660
17
250,5
Mali-G710 MP7
18
250
Графический процессор Apple A12 Bionic
19
245
Mali -G78 MP22
20
232
Графический процессор Apple A10X Fusion
21
224. 5
Adreno 650
22
206
Mali-G77 MP11
23 900 03
199
Mali-G77 MP9
24
184
Графический процессор Apple A11 Bionic
25
166.9
Adreno 640
26
166
Mali-G78 MP14
27
154
9 0002 Adreno 642
28
153
Mali-G76 MP16
29
151.5
Adreno 630
30
150
Adreno 644
31
147
9000 2 Mali-G72 MP18
32
145
Mali-G78 MP20
33
144
Серия PowerVR 7XT
34
140,15
Adreno 642L
35
133
Графический процессор NVIDIA Tegra X1 Maxwell
36
123
Мали-G76 MP10
37
119.5
Mali-G68 MP5
38
119
Mali-G72 MP12
39
118
Mali-G 57 MP5
40
115
Графический процессор Apple A10 Fusion
41
114,15
Adreno 540
42
111,5
Mali-G57 MP6
43
107,5
Mali-G7 1 MP20
44
105
Mali-G68 MP4
45
102
Mali- G76 MP12
46
96. 5
Adreno 620
47
95
Adreno 619
48
9 0002 91
Adreno 530
49
88
Mali-G52 MP6
50
87
Adreno 618
51
84.5
Mali-G57 MP4
52
84
Mali-T880 MP12
9000 2 53
82
Mali-G76 MP4
54
80
PowerVR GT7600
55
79,95
IMG BXM-8-256
56
74
Mali-G57 MP3 900 03
57
74
Mali-G71 MP8
58
73,5
Адрено 619L
59
72,5
PowerVR GXA6850
60
70,4
Adreno 616
61
65
Mali-G57 MP2
62
63
Графический процессор NVIDIA Tegra K1 Kepler
63
60
Mali-T760 MP8
64
53.5
Adreno 512
65
50
Adreno 430
66
49
PowerVR GM9446
67
45
PowerVR GX6450
68
44,8
Mali-G52 MP2
69
44
Adreno 420
70
41,35
Адрено 612
71
41
Mali-T880 MP4
72
39
Mali-G51 MP4
73
39
Mali-G72 MP3
9 0002 74
38
Адрено 610
75
36
Адрено 509
76
36
Adreno 418
77
34
Mali-T830 MP3
78
34
Intel HD Graphics (Cherry Trail)
79
32
Mali-T760 MP6
80
31
Adreno 510
81
31
Adreno 508
82
30
PowerVR G6430
83
27,9
PowerVR GX6250
84
27,8
Mali-G52 MP1
85
24
Mali-T880 MP2
86
24
Mali-G57 MP1
87 900 03
24
Adreno 330
88
24
PowerVR G6400
89
23. 6
Adreno 506
90
23
Mali-T628 MP6
91
22,8
Mali-G71 MP2
92
22
PowerVR GE8320
93
20
PowerVR GE8322
94
19
Mali-T830 MP2
95
18,5
NVIDIA GeForce Tegra 4
96
17,5
Адрено 505
97
17
Mali-T860 MP2
98
17
Intel HD Graphics (Bay Trail)
99
16
Mal i-T760 MP4
100
16
Из таблицы выше мы можем легко определить, какие модели графических процессоров смартфонов сегодня имеют самую высокую производительность. Как вы, возможно, знаете, графический процессор (GPU) является важнейшим аппаратным компонентом современных смартфонов. Используя хороший графический процессор, вы можете выполнять тяжелые задачи на своем телефоне, особенно с точки зрения рендеринга 3D-моделей.
Проще говоря, графические процессоры необходимы для игр без задержек, особенно для игр с тяжелой 3D-графикой. В отличие от центрального процессора (ЦП), который выполняет различные задачи, единственной задачей графического процессора является обработка графического рендеринга, включая рендеринг как 2D-, так и 3D-изображений в современных мобильных играх.
Использование новейшего графического процессора высшего уровня обеспечивает плавную обработку тяжелых графических задач. Напротив, более старые модели графических процессоров, скорее всего, не смогут обрабатывать тяжелые графические задачи рендеринга, что приведет к плохому взаимодействию с пользователем из-за задержек, заиканий и зависаний.
Однако аппаратное обеспечение графического процессора важно не только для игровых целей. Это важный компонент для многих других многоцелевых задач, таких как мобильный графический дизайн, создание контента, редактирование фото и видео и многое другое.
Чтобы получить наилучшие впечатления от использования современного смартфона, который может выполнять несколько задач, особенно рендеринг 2D/3D-изображений, вы должны выбрать правильный смартфон, который соответствует вашим потребностям.
Эта статья может быть вам полезна, потому что мы собрали данные о графическом процессоре смартфона от нескольких надежных поставщиков тестов и создали таблицу ранжирования на основе результатов каждого теста. Таким образом, пользователи могут легко понять, насколько хороша аппаратная часть графического процессора в таблице рейтинга.
Источники данных
Во-первых, важно отметить, что мы не генерируем данные о баллах сами. Вместо этого мы собираем данные от нескольких надежных поставщиков тестовых инструментов. Для обеспечения точности и надежности данных, которые мы используем, все инструменты сравнительного анализа должны иметь хорошую репутацию, подкрепленную положительными отзывами пользователей, а их данные должны отражать реальное использование.
После тщательного рассмотрения мы выбрали данные из нескольких тестовых инструментов, в том числе:
- GFXBench
- GFXBench 3. 0
- GFXBench 3.1
- 3DMark
- Центурион Марк
Мы хотим прояснить, что мы не связаны ни с одним из этих поставщиков; мы используем их данные только для того, чтобы помочь пользователям понять, насколько хорош графический процессор на их смартфоне. Наша цель — предоставить пользователям достоверную и полезную информацию, чтобы они могли принимать обоснованные решения относительно аппаратного обеспечения графического процессора своего смартфона. Используя контрольные данные от надежных поставщиков, мы надеемся предоставить нашей аудитории точные и заслуживающие доверия рейтинги.
Понимание данных о рангах
Понимание данных о рангах необходимо для принятия обоснованных решений об аппаратном обеспечении графического процессора смартфона. Наша система ранжирования проста: наибольшая оценка в тесте получает меньший рейтинг на диаграмме, что указывает на лучшую производительность.
Однако мы ограничиваем данные ранжирования 100 лучшими для нужд современных пользователей, поскольку 100 лучших обычно включают модели графических процессоров с хорошей производительностью. Для более глубокого понимания того, как работает рейтинговая диаграмма, GPU, попавший в первую десятку, обычно является флагманской моделью GPU для смартфонов и должен работать очень хорошо. Ранги с 11-го по 30-е также являются хорошими моделями графических процессоров, как правило, для смартфонов среднего и высокого класса, и они должны справляться с высокой активностью рендеринга.
Ранги с 31-го по 60-й обычно предназначены для моделей графических процессоров смартфонов среднего уровня. Хотя они должны иметь достаточную производительность для большинства действий по рендерингу, окончательный результат может не сравниться с флагманскими моделями из-за ограниченной производительности оборудования.
Наконец, ранги с 61-го по 100-й обычно относятся к моделям GPU начального и среднего уровня или старым моделям смартфонов. Хотя их производительность может быть аналогична моделям среднего уровня, их аппаратная производительность может быть ограничена для интенсивной обработки изображений.
График обновления данных
Мы понимаем, что наличие актуальных данных важно для принятия пользователями обоснованных решений. Таким образом, мы установили график обновления наших данных о рейтинге графических процессоров.
Как правило, мы обновляем данные рейтинга в первую неделю каждого месяца, гарантируя, что данные актуальны и актуальны. Однако в некоторых случаях нам может понадобиться обновлять данные чаще, особенно если есть новые выпуски графических процессоров, которые еще не отражены в нашей базе данных.
Мы стремимся предоставить пользователям самую свежую информацию как можно скорее, чтобы они могли принять оптимальное решение при выборе смартфона с мощным графическим процессором. Наша команда усердно работает над тем, чтобы наши рейтинги были точными, достоверными и отражали реальные результаты.
Заключение
Используя данные таблицы ранжирования, вы можете определить, какие модели графических процессоров мобильных смартфонов имеют наилучшую производительность. Если вы планируете приобрести новый телефон в будущем, данные таблицы рейтинга помогут вам выбрать лучший телефон, который соответствует вашим потребностям.
Однако имейте в виду, что наилучшее взаимодействие с пользователем зависит не только от аппаратного обеспечения графического процессора. Другие аппаратные компоненты, такие как процессор и оперативная память, также играют решающую роль в определении общей производительности смартфона.
Фактически, эти компоненты тесно связаны друг с другом с точки зрения обеспечения наилучшего взаимодействия с пользователем. Поэтому при выборе смартфона важно учитывать все аппаратные компоненты, чтобы убедиться, что он соответствует вашим требованиям к производительности.
Часто задаваемые вопросы
Какой на сегодняшний день лучший мобильный графический процессор?
По данным GFXBench лучшим мобильным графическим процессором является 10-ядерный графический процессор Apple M2 , поскольку он имеет наивысший балл в доступных рейтинговых списках.
Какое аппаратное обеспечение графического процессора лучше всего подходит для телефонов Android?
По данным GFXBench, лучшее аппаратное обеспечение графического процессора для телефонов Android на сегодняшний день — это Adreno 740 .
Какое аппаратное обеспечение графического процессора лучше всего подходит для Apple iPhone?
По данным GFXBench, лучшим графическим процессором для Apple iPhone является 10-ядерный графический процессор Apple M2 .
Какая модель графического процессора Adreno лучшая?
По данным GFXBench, лучшей моделью графического процессора Adreno является Adreno 740 .
Какая модель Apple GPU лучше всего подходит для iPhone?
Согласно GFXBench, лучшей моделью графического процессора Apple для iPhone является 10-ядерный графический процессор Apple M2 .
Какая модель графического процессора ARM Mali лучшая?
Согласно GFXBench лучшей моделью графического процессора ARM Mali является Mali-G710 MP10 .
Какая модель графического процессора PowerVR лучше?
По данным GFXBench лучшей моделью графического процессора PowerVR является PowerVR Series 7XT .
Понимание мобильного графического процессора
При правильной реализации графический процессор в мобильной системе может повысить производительность. Но это большое «если».
Мобильный графический процессор или графический процессор — это специальный сопроцессор, предназначенный для ускорения графических приложений, пользовательских интерфейсов и 3D-контента на вашем смартфоне, планшете, носимых устройствах и устройствах IoT. Фотореалистичные 3D-игры и «живые» графические пользовательские интерфейсы (GUI) — примеры рабочих нагрузок, разработанных специально для графического процессора.
Несколько лет назад GPU был полезной функцией, встроенной в высококачественные потребительские мобильные продукты, которые нуждались в новейших технологиях, чтобы сохранить свой флагманский статус. Теперь, когда графические дисплеи распространены повсеместно и используются на всех типах подключенных устройств, графический процессор стал необходимой частью спецификаций продуктов для всех процессоров мобильных приложений и MCU/MPU среднего/высокого уровня. Графический процессор также помогает дифференцировать продукты, поэтому компании могут создавать привлекательные визуальные решения для своего целевого приложения.
Графический процессор спроектирован как механизм обработки одной инструкции и нескольких данных (SIMD), созданный для массовых параллельных рабочих нагрузок. Трехмерная графика — один из лучших примеров высокопроизводительной параллельной обработки, поскольку графические процессоры могут обрабатывать миллиарды пикселей/вершин или операций с плавающей запятой (GFLOPS) каждую секунду. В основе GPU лежат один или несколько шейдеров (модулей SIMD), которые обрабатывают независимые вершины, примитивы и фрагменты (пиксели). Шейдеры — это вычислительные элементы, которые выполняют программы 3D-графики для каждой вершины, пикселя или другого примитивного базиса.
Программы вершинных шейдеров изменяют свойства объектов, позволяя управлять положением, движением, освещением вершин и цветом. Программы пиксельных или фрагментных шейдеров вычисляют окончательный цвет пикселей, тени, текстуру объекта, освещение и могут быть запрограммированы на добавление специальных эффектов к сцене с такими дополнениями, как размытие, улучшение краев или фильтрация. Существуют также более новые типы шейдерных программ, включая геометрические, мозаичные и вычислительные шейдеры.
Вычислительные шейдеры, такие как в OpenGL ES 3.1, полезны для расширенного рендеринга графики, когда вы можете смешивать контексты 3D и GPU Compute (GPGPU) для добавления реальных эффектов, таких как обработка физики (естественные движения волн и ветра или яркие взрывы в игре) и глобальное освещение (лучшее освещение и тени за счет вычислений с использованием прямых и непрямых источников/лучей света). Графические процессоры также могут эффективно масштабироваться от одного блока шейдеров до тысяч взаимосвязанных, сгруппированных блоков шейдеров для повышения производительности и параллелизма в зависимости от целевого приложения, начиная от Интернета вещей и мобильных и заканчивая высокопроизводительными вычислениями (HPC) и научными вычислениями. Высокопроизводительные шейдеры могут работать на частоте более 1,2 ГГц и выполнять миллиарды инструкций за цикл для обработки графики, OpenCL, OpenVX (обработка изображений) и многого другого.
На рис. 1 показаны некоторые из основных различий между архитектурами CPU и GPU. Каждая конструкция имеет свои сильные стороны и должна работать в тандеме для достижения наиболее оптимального решения (мощность, пропускная способность, совместное использование ресурсов и т. д.). Лучшие проекты используют гетерогенную системную архитектуру, которая разделяет/назначает рабочие нагрузки каждому процессорному ядру в зависимости от его сильных сторон. Графический процессор также становится важной частью системы, поскольку отрасль движется к оптимизации на уровне платформы, где графический процессор используется для приложений с интенсивными вычислениями, помимо графики. Обратите внимание, что в современных гибридных конструкциях есть другие вычислительные блоки, включая DSP, FPGA и другие ядра для конкретных задач, которые можно использовать вместе с комбинацией CPU-GPU.
Рисунок 1
Представление о конвейере графического процессора
Новые графические процессоры используют «унифицированные» шейдеры для достижения наилучшего управления аппаратными ресурсами в различных типах шейдерных программ для балансировки рабочих нагрузок. Первые версии унифицированных шейдеров сочетали обработку вершин (VS) и пикселей (PS), а последующие версии добавляли поддержку геометрических (GS), тесселяции (TS) и вычислительных (CS) шейдеров по мере развития графических API.
Для унифицированных шейдеров рабочие нагрузки, назначенные каждому шейдеру, могут быть основаны либо на вершинах, либо на пикселях, что позволяет шейдеру мгновенно переключаться между любыми контекстами для поддержания высокого уровня использования шейдера. Это сводит к минимуму узкие места и остановки аппаратных ресурсов в случаях, когда у вас есть изображение с большим количеством вершин или пикселей. В неунифицированных шейдерных архитектурах существуют отдельные фиксированные шейдеры VS и PS. Например, если изображение загружено вершинами, VS может остановить конвейер графического процессора, поскольку он должен завершиться, прежде чем графический процессор сможет продолжить обработку остальной части изображения. Это вызывает пузыри конвейера и неэффективное использование оборудования. На рис. 2 показан случай, когда у вас есть отдельные VS и PS, а не единое ядро шейдера.
Рис. 2
За прошедшие годы шейдеры графических процессоров вышли за рамки графики и стали включать конвейеры общего назначения, которые можно настроить для графики, вычислений, совместной обработки изображений (ISP), встроенного зрения, видео (HEVC и H.264). предварительная/постобработка и т. д.) и другие параллельные приложения. Вот почему вы слышите такие термины, как GPGPU (GPU общего назначения) и GPU Compute, используемые для описания широкого использования графических процессоров за пределами рендеринга графики.
На высоком уровне конвейер мобильных графических процессоров состоит из нескольких ключевых блоков:
Хост-интерфейс и (защищенный) MMU
- Связь с ЦП через интерфейсы ACE-Lite/AXI/AHB.
- Обрабатывает команды ЦП и получает доступ к данным геометрии из буфера кадров или системной памяти.
- Выводит поток вершин, который отправляется на следующий этап (вершинный шейдер).
- Управляет всеми транзакциями графического процессора, включая отправку инструкций/данных шейдерам, выделяет/освобождает ресурсы и обеспечивает безопасность для безопасных транзакций и сжатия данных.
Программируемые унифицированные шейдеры
- Вершинные шейдеры (VS) включают преобразование вершин, освещение и интерполяцию и могут быть простыми (линейными) или сложными (эффекты морфинга).
- Пиксельные/фрагментные шейдеры (PS) вычисляют окончательное значение пикселя с учетом освещения, теней и других атрибутов, включая наложение текстуры.
- Геометрический шейдер (GS) берет примитив (линию, точку или треугольник) и модифицирует, создает (или уничтожает) вершины для повышения уровня детализации объекта. GS позволяет конвейеру графического процессора получать доступ к смежным примитивам, чтобы ими можно было манипулировать как тесно связанной группой для создания реалистичных эффектов, когда соседние вершины взаимодействуют друг с другом для создания эффектов плавного плавного движения (волосы, одежда и т. д.). Комбинация GS/VS/PS обеспечивает более автономную работу графического процессора для внутренней обработки изменений состояния (минимизирует взаимодействие ЦП и графического процессора) за счет добавления арифметической и динамической логики управления потоком для разгрузки операций, которые ранее выполнялись на ЦП. Еще одной ключевой функцией является Stream Out, когда VS/GS может выводить данные непосредственно в память, а доступ к данным может осуществляться автоматически и неоднократно шейдерным блоком или любым другим блоком графического процессора без вмешательства ЦП. Stream Out полезен для рекурсивного рендеринга (повторного использования данных) объектов, требующих многократных проходов, таких как морфинг поверхностей объектов и детальное картирование смещения.
- включают два модуля с фиксированными функциями, называемые шейдерами Hull и Domain в конвейере TS. TS берет криволинейные поверхности (прямоугольные или треугольные) и преобразовывает их в многоугольные представления (сетку/патч) с различным количеством, которое можно изменить в зависимости от требований к качеству. Более высокие значения создают больше деталей, а более низкие значения создают меньше деталей на объекте. Блок тесселяции состоит из трех частей:
- Шейдер корпуса (HS) — это программируемый шейдер, который создает патч геометрии (поверхности) из базового входного патча (четырехугольника, треугольника или линии) и вычисляет данные контрольных точек, которые используются для управления поверхностью. HS также вычисляет коэффициент адаптивной тесселяции, который передается тесселятору, чтобы он знал, как разделить атрибуты поверхности.
- — это фиксированный (настраиваемый) функциональный этап, который разбивает патч на более мелкие объекты (треугольники, линии или точки) на основе коэффициента тесселяции из HS.
- Domain Shader (DS) — это программируемый шейдер, который оценивает поверхность и вычисляет новую позицию вершины для каждой подразделенной точки в выходном патче, который отправляется в GS для дополнительной обработки.
Тесселятор
- Вычислительный шейдер (CS) добавляет вычислительные возможности GPGPU/GPU к графическому конвейеру, поэтому разработчики могут писать код приложения GLSL, который использует этот шейдер и может выполняться за пределами обычного конвейера рендеринга. Данные могут быть разделены внутри между этапами конвейера и контекстами рендеринг-вычислений, поэтому оба могут выполняться параллельно. CS также может использовать те же контексты, статус, униформы, текстуры, текстуры изображений, атомарные счетчики и т. д., что и конвейеры рендеринга OpenGL/OpenGL ES, что упрощает и упрощает программирование и использование вместе с выводом конвейера рендеринга.
Шейдеры тесселяции (TS)
Программируемый растеризатор
- Преобразует объекты из геометрической формы в пиксельную и отбрасывает (удаляет) любые обратные или скрытые поверхности. Существует много уровней механизмов отбраковки, гарантирующих, что скрытые пиксели не обрабатываются, чтобы сэкономить вычислительные циклы, пропускную способность и мощность.
Интерфейс памяти
- Удаляет невидимые или скрытые пиксели с помощью Z-буфера, трафаретных/альфа-тестов перед записью пикселей в буфер кадра.
- На этом этапе выполняется сжатие, включая буферы Z и цветов.
Немедленный режим и графические процессоры с отложенным рендерингом
Существуют две распространенные архитектуры графических процессоров и два метода рендеринга изображения. Оба метода используют один и тот же общий конвейер, описанный ранее, но отличаются механизмом отрисовки. Один метод называется отложенным рендерингом на основе плитки (TBDR), а другой — рендерингом в немедленном режиме (IMR). У обоих есть плюсы и минусы, основанные на их соответствующих вариантах использования.
В 1995 году (до появления смартфонов/планшетов) многие графические компании поддерживали оба метода на рынках ПК и игровых консолей. В группу TBDR входили такие компании, как Intel, Microsoft (Talisman), Matrox, PowerVR и Oak. На стороне IMR были такие имена, как SGI, S3, Nvidia, ATi и 3dfx. Перенесемся в 2014 год — на рынке ПК и игровых консолей не используются архитектуры TBDR. Все архитектуры ПК и консолей, включая PS3/PS4, Xbox 360/One и Wii, основаны на IMR.
Основная причина этого перехода заключалась в присущей IMR силе архитектуры рендеринга объектов, которая могла обрабатывать очень сложные динамичные игры (например, быстрые движения, FPS или гоночные игры, где сцены или точки обзора постоянно меняются от кадра к кадру). рамка). Кроме того, по мере увеличения количества треугольников 3D-контента TBDR не могли идти в ногу, поскольку им приходилось постоянно переполнять свою кэш-память в память кадрового буфера из-за своих архитектурных ограничений. Большее количество треугольников/полигонов позволяет графическому процессору отображать шелковисто-гладкие и детализированные (реалистичные) поверхности вместо блочных изогнутых поверхностей, которые появлялись в старых играх. С добавлением шейдеров тесселяции в IMR рендеринг поверхности, в котором треугольники/многоугольники дополнительно подразделяются, еще больше приближает 3D-графику к реальности.
Современный рынок мобильных устройств точно отражает тенденции рынка ПК и игровых консолей, где технология IMR заменяет TBDR. На рынке TBDR есть две компании, Imagination и ARM, хотя ARM пытается перейти на IMR, поскольку они видят большие преимущества при запуске игр нового поколения на мобильных устройствах. На стороне IMR у вас есть Qualcomm, Vivante, Nvidia, AMD и Intel.
Большим преимуществом использования IMR является то, что разработчики игр/приложений могут повторно использовать и легко переносить свои существующие игровые активы, уже работающие на сложных графических процессорах (или игровых консолях), на мобильные устройства. Поскольку мобильные устройства имеют строгие ограничения по энергопотреблению/температуре и площади кристалла, лучший способ устранить разрыв в производительности и свести к минимуму портирование приложений или значительные изменения кода – использовать архитектуру, аналогичную той, на которой они разрабатываются. IMR дает разработчикам такой выбор в дополнение к получению эквивалентного высококачественного рендеринга качества ПК, и все это упаковано в меньшую площадь кристалла, чем решения TBDR. IMR также повышает пропускную способность внутренней системы и внешней памяти по мере того, как отрасль выходит за рамки интерфейсов прикладного программирования (API) OpenGL ES 3.1 и DirectX 12.
Наконец, архитектуры TBDR оптимизированы для 3D-контента с небольшим количеством треугольников/полигонов и простых пользовательских интерфейсов. Архитектуры IMR превосходны, когда речь идет о динамических пользовательских интерфейсах и детализированном 3D-контенте, которые обеспечивают одинаковый пользовательский опыт и качество игры на ПК и игровых консолях на мобильных устройствах.
Графические API на протяжении многих лет
Ведущий 3D API для мобильных устройств основан на API OpenGL ES от Khronos Group, который используется в большинстве современных смартфонов и планшетов с широким спектром операционных систем, включая Android, iOS и Windows. OpenGL ES основан на настольной версии OpenGL, оптимизированной для мобильных устройств, включая удаление избыточности и редко используемых функций и добавление форматов данных, удобных для мобильных устройств.
Первоначальная версия OpenGL ES 1.1 была основана на оборудовании с фиксированными функциями, а OpenGL ES 2.0 была основана на программируемых вершинных и фрагментных (пиксельных) шейдерах, при этом было удалено преобразование с фиксированными функциями и конвейер фрагментов версии 1. 1. OpenGL ES 3.0 продвигает отрасль еще дальше, добавляя функции, основанные на OpenGL 3.3/4.x, и снижает потребность в расширениях, что упрощает программирование, создавая более жесткие требования к поддерживаемым функциям и уменьшая вариативность реализации. Некоторые функции GLES 3.0 включают запросы окклюзии, MRT, массивы текстур/вершин, создание экземпляров, обратную связь по преобразованию, большую программируемость, совместимость с OpenCL, более высокое качество (32-битные числа с плавающей запятой/целые числа), текстуры NPOT, 3D-текстуры и многое другое.
В марте 2014 года на конференции разработчиков игр компания Khronos выпустила OpenGL ES 3.1 с такими улучшениями, как вычислительные шейдеры (CS), отдельные объекты шейдеров, команды косвенного рисования, улучшенное текстурирование и новые языковые дополнения GLSL. Одновременно с выпуском OpenGL ES 3.1 компания Google также выпустила свой пакет расширений Android L (AEP), для которого требуются функции шейдера геометрии (GS) и тесселяции (TS) в мобильном оборудовании, чтобы обеспечить расширенные 3D-возможности на платформах Android для отражения графики уровня ПК. На рис. 3 показана временная шкала развития OpenGL и OpenGL ES на протяжении многих лет. Переходы и сопоставление для Microsoft DirectX (DX) API показаны на рис. 4. DX9сопоставляется с OpenGL ES 2.0, а DX10/DX11 сопоставляется с OpenGL ES 3.1.
Рисунок 3
Рисунок 4
Графический процессор выходит за рамки графики
За последние несколько лет отраслевые и университетские исследователи обнаружили, что вычислительные ресурсы современных графических процессоров подходят для определенных параллельных вычислений благодаря присущей им параллельной архитектуре. Ускорение вычислений, продемонстрированное на графических процессорах, было быстро признано, и родился еще один сегмент высокопроизводительных вычислений, основанный на огромной вычислительной мощности графических процессоров.
GPU, выходящие за рамки графики, могут называться вычислительными ядрами GPU или GPGPU. Были реализованы различные отраслевые стандарты, такие как OpenCL, HSA, OpenVX и Microsoft DirectCompute, в которых параллелизм задач и инструкций теперь оптимизирован для использования преимуществ различных процессорных ядер. В ближайшем будущем мобильные устройства будут лучше использовать системные ресурсы за счет разгрузки ЦП, DSP или пользовательских ядер и использования графического процессора для достижения максимальной производительности вычислений, плотности вычислений, экономии времени и общего ускорения системы. Наилучшим подходом будет использование гибридной реализации, в которой ЦП и ГП тесно чередуются для достижения целевых показателей производительности и энергопотребления.
Рисунок 5 | В приведенной ниже таблице сравниваются ЦП и ГП при рассмотрении различных факторов, таких как задержка памяти, управление потоками и параллелизм выполнения.
Многие вычислительные задачи, такие как обработка изображений, обработка изображений, аналитика, математические вычисления и другие параллельные алгоритмы, хорошо согласуются с архитектурой GPU SIMD. Вы даже можете запрограммировать графический процессор для использования подхода с несколькими графическими процессорами, при котором вычислительная задача и/или кадр 3D-рендеринга распределяются между графическими процессорами для повышения производительности и пропускной способности. Графический процессор может работать в многоконтекстных режимах для одновременного выполнения 3D и вычислительных потоков. Например, ядра 1 и 2 графического процессора назначены для рендеринга изображений, а ядра 3 и 4 предназначены для функций GPGPU, таких как эффекты частиц (дым/вода/огонь), игровая физика для имитации движения реального мира или естественный пользовательский интерфейс (NUI). ) обработка для поддержки жестов. Другие рынки, на которых внедряется GPGPU, особенно в сегментах встроенного/компьютерного зрения, включают:
- Дополненная реальность: наложение реальной среды на данные, сгенерированные графическим процессором (изображения, данные, 3D-рендеринг и т. д.), которые могут быть введены с различных датчиков, таких как Google Glass. AR может работать с онлайн-потоками (живыми и прямыми) или офлайн-потоками контента.
- Извлечение признаков: жизненно важно для многих алгоритмов зрения, поскольку необходимо создавать «точки интереса» изображения и дескрипторы, чтобы графический процессор знал, что обрабатывать. SURF (Speeded Up Robust Features) и SIFT — примеры алгоритмов, которые можно эффективно распараллелить на графическом процессоре. Распознавание объектов и распознавание знаков являются формами этого приложения.
- Обработка облака точек: включает извлечение признаков для создания 3D-изображений для обнаружения фигур и сегментации объектов в загроможденном изображении. Использование может включать добавление дополненной реальности к картам просмотра улиц.
- Усовершенствованные системы помощи водителю (ADAS): несколько функций безопасности постоянно рассчитываются в режиме реального времени, включая обнаружение линии / помощь в полосе движения (преобразование Хафа, алгоритмы Собеля / Кэнни), обнаружение пешеходов (гистограмма ориентированных градиентов или HOGS), устранение искажений изображения , обнаружение слепых зон и другие.
- Безопасность и наблюдение: включает в себя распознавание лиц, которое проходит через локализацию ориентиров лица (классификаторы признаков Хаара), извлечение и классификацию черт лица, а также распознавание объектов.
- Обработка движения: естественные пользовательские интерфейсы, такие как распознавание жестов рук, которое отделяет руку от фона (например, преобразование цветового пространства в цветовое пространство HSV), а затем выполняет структурный анализ руки для обработки движения.
- Обработка видео: совместная обработка видео HEVC с использованием шейдерных программ и высокоскоростных вычислений с целыми и плавающими числами.
- Обработка изображений: объединение GPGPU с процессорами сигналов изображения (ISP) для оптимизированного конвейера обработки изображений.
- Слияние датчиков: объединяет обработку изображений с данными других датчиков (например, LIDAR) для создания трехмерной пространственной карты с глубиной. Похожая концепция, используемая в графике, — это трассировка лучей, когда вы испускаете луч и прослеживаете его путь через изображение, а также вычисляете все пересечения и отскоки луча от объекта для создания реалистичного трехмерного изображения.