Таблица производительности видеокарт мобильных: Ноутбучные графические адаптеры. Таблица бенчмарков

Рейтинг мобильных видеокарт — buQi.ru

Представляем рейтинг производительности мобильных видеокарт. В таблице отображены самые важные характеристики видеокарт: объем памяти, версия directx, производительность видеокарты в двух тестах 3Dmark06 и Cinebench R10 OpenGL.

Нажимая на заголовок столбца с нужной характеристикой вы можете отсортировать таблицу видеокарт по возрастанию или убыванию этой характеристики. Например, вы можете отсортировать таблицу по производительности видеокарт в 3Dmark06 и определить самую производительную видеокарту.

Нажав на название видеокарты, откроется страница с подробным описанием видеокарты и результатами тестов 3Dmark01 — 06, 3Dmark Vantage и Cinebench R10 OpenGL.

ВидеокартаКодПамятьDirectX3Dmark06Cinebench OpenGL
1NVIDIA GeForce GTX 480M SLIFermi409611

20950

5178

2NVIDIA GeForce GTX 460M SLIGF1062×153611

18580

5340

3ATI Mobility Radeon HD 5870 CrossfireBroadway-XT2×102411

19080

6380

4NVIDIA GeForce GTX 285M SLIN10E-GTX2×102410

16590

4610

5NVIDIA GeForce GTX 280M SLIN10E-GTX204810

15711

5543

6ATI Mobility Radeon HD 4870 X2M98-XT2048 1″>10.1

14413

3512

7NVIDIA GeForce GTX 485M11
8NVIDIA GeForce GTX 480MFermi204811

15390

4900

9AMD Radeon HD 6970M11

20150

10NVIDIA GeForce GTX 260M SLINB9E-GTX204810

13178

3987

11NVIDIA GeForce 9800M GTX SLINB9E-GTX102410

14142

4193

12NVIDIA Quadro 5000MFermi204811
13NVIDIA GeForce GTX 470M11
14ATI Mobility Radeon HD 5870Broadway-XT102411

12700

5830

15ATI FirePro M782011

12530

16NVIDIA GeForce GTX 460MGF106153611

12120

4033

17NVIDIA Quadro FX 3800MN10E-GLM4102410

12680

4420

18NVIDIA GeForce GTX 285MN10E-GTX1102410

12990

4940

19ATI Mobility Radeon HD 4870M98-XT1024 1″>10.1

10650

5190

20NVIDIA GeForce GTX 280MN10E-GTX102410

12560

5840

21NVIDIA GeForce 9800M GT SLINB9E-GT251210

14400

22NVIDIA GeForce 9800M GTS SLINB9E-GT51210

14050

23ATI Mobility Radeon HD 3870 X2M88-XT CF 1″>10.1

13430

4350

24NVIDIA GeForce 8800M GTX SLINB8E-GTX51210.1

11740

4920

25ATI Mobility Radeon HD 3850 X2M88 CF10.1

12820

26NVIDIA Quadro FX 3700MNB9E-GLM3102410

10840

4480

27ATI Mobility Radeon HD 4860M97-XT 1″>10.1
28ATI FirePro M7740RV740102410.1

12110

6650

29ATI Mobility Radeon HD 4850M98102410.1

9950

5680

30NVIDIA GeForce GTX 260MN10E-GT102410

10160

3960

31NVIDIA GeForce 9800M GTXNB9E-GTX102410

10290

4650

32NVIDIA Quadro FX 2800MNB10-GLM3102410

11160

33NVIDIA GeForce 9800M GTNB9E-GT251210

9410

4520

34NVIDIA GeForce 8800M GTXNB8E-GTX51210

9180

4580

35NVIDIA Quadro FX 3600MNB8E-GLM51210

8130

6190

36ATI Mobility Radeon HD 5850Broadway-PRO102411

9790

5400

37NVIDIA GeForce GTS 360MN11E-GS11024 1″>10.1

9880

3660

38NVIDIA GeForce GT 555MN12E-GE-B11
39NVIDIA GeForce GT 550MN12P-GT11
40NVIDIA GeForce GT 445MGF10611
41NVIDIA GeForce GTS 260MN10E-GS1024 1″>10.1
42NVIDIA GeForce GTS 160MN10E-GS1102410

9370

3430

43NVIDIA GeForce 9800M GTSNB9E-GT102410

9500

44NVIDIA GeForce 9800M GSNB9E-GS1102410

8460

3690

45ATI Mobility Radeon HD 5830Broadway102411

7730

46ATI Mobility Radeon HD 4830M97 1″>10.1

8380

4250

47NVIDIA GeForce GTS 150MN10E-GE1102410
48NVIDIA GeForce 8800M GTSNB8E-GT51210

8290

3160

49ATI Mobility Radeon HD 5770Madison-XT11
50AMD Radeon HD 6570MCapilano102411
ВидеокартаКодПамятьDirectX3Dmark06Cinebench OpenGL

Советы эксперта

  • Лучшие смартфоны 2012 года. Советы эксперта

  • Лучшие наушники 2012 года. Советы эксперта
  • Лучшие флешки 2012 года. Советы эксперта
  • Лучшие игровые покупки. Советы эксперта
  • Твердотельные накопители данных. Зачем нужны SSD?
  • Как выбрать электронную книгу? Советы эксперта

Планшеты

  • Lenovo Note8 с 64-битным процессором и поддержкой 4G

  • Новый планшет Nokia N1 на базе Android 5.0
  • Google Nexus 9 – первые впечатления
  • Iconia A1-810: новинка от Acer
  • ASUS MeMo Pad уже в продаже
  • Amazon Kindle Fire HD 8.9 LTE в AT&T с 5 апреля

Ноутбуки

  • Обновление линейки ультрабуков Samsung

  • Премиум-пиксели: KIRAbook от Toshiba со сверхчетким дисплеем
  • Ноутбук для студентов Latitude 3330 от Dell
  • Ноутбук-гибрид от ASUS Taichi 31 c двумя дисплеями
  • GeForce 700M для ноутбуков от всех ведущих производителей
  • Dell XPS 13 c дисплеем 1080p уже в продаже

Мобильные телефоны

  • Vertu Clous De Paris: дорогой подарок к 23 февраля!

  • Sony Xperia Z2 и Z3 получат Android 5. 0 Lollipop в ближайшее время
  • Стали известны цены на Mi Note и Mi Note Pro
  • Золотой Nokia Lumia 930
  • Новинка — HTC A12
  • Blu Studio 7.0 — 7-дюймовый смартфон из США

NVIDIA представила мобильные видеокарты GeForce RTX 40

В рамках выставки CES 2023 в Лас-Вегасе NVIDIA представила видеокарты GeForce RTX 40 для ноутбуков, теперь архитектура Ada Lovelace будет доступна и на мобильном сегменте. Новые чипы будут использоваться более чем в 170 ноутбуках всех основных производителей, они поднимут планку по эффективности энергопотребления и производительности.

NVIDIA говорит о трехкратном увеличении эффективности по сравнению с предыдущим поколением, а также о четырехкратном повышении производительности в играх AAA, таких как Cyberpunk 2077. Причем даже «младшие» видеокарты смогут обойти предыдущих флагманов. Впрочем, здесь свою роль сыграли такие технологии, как DLSS, что и позволило получить столь высокие цифры. В общей сложности NVIDIA представляет пять видеокарт.

Подписывайтесь на группу Hardwareluxx ВКонтакте и на наш канал в Telegram (@hardwareluxxrussia).

Впервые с моделью 90

Флагманом новой линейки становится видеокарта NVIDIA GeForce RTX 4090 «для ноутбуков», которая обеспечивает игры в разрешении 4K с частотой кадров больше 60 fps. Впервые видеокарта модельным номером 90 используется в ноутбуках, а не только в настольных ПК. GPU предлагает 9.728 потоковых процессоров, по 256-битной шине подключены 16 Гбайт GDDR6.

Мобильная видеокарта GeForce RTX 4090 примерно соответствует настольной GeForce RTX 4080 на чипе AD103, хотя NVIDIA довольно серьезно снизила тактовые частоты. В зависимости от модели, новые мобильные GPU можно конфигурировать в диапазоне от 80 до 150 Вт, частоты Boost меняются от 1.455 до 2.040 МГц. Кроме того, можно включить дополнительный Dynamic Boost, который добавит еще 25 Вт.

Следующая по старшинству – видеокарта GeForce RTX 4080 «для ноутбуков». Ее энергопотребление можно снизить до 60 Вт, но придется пойти на жертвы по потоковым процессорам и памяти. Используются 7.424 ядер CUDA, 12 Гбайт GDDR6 подключены по 192-битной шине. «Младшей» видеокартой в мире мобильных GeForce RTX 40 становится GeForce RTX 4050 «для ноутбуков». Здесь доступны 2.560 потоковых процессоров, а 6 Гбайт видеопамяти GDDR6 подключены по 96-битному интерфейсу. Тепловой пакет можно конфигурировать от 35 до 115 Вт, что позволит выпустить очень экономичные ноутбуки. Благодаря поддержке DLSS 3 видеокарта сможет дать высокую частоту кадров без серьезных компромиссов по качеству картинки. Предшествующая технология здесь тоже давала свои преимущества.

В серединке расположились видеокарты GeForce RTX 4070 и GeForce RTX 4060 «для ноутбуков» с 4.608 и 3.072 потоковыми процессорами, а также 8 Гбайт видеопамяти. Они справятся с играми в разрешении 1440p и частотой кадров 80 fps.

Обзор видеокарт







Сравнение GPU
Модель Потоковые процессоры Частота Boost Память Интерфейс TGP
GeForce RTX 4090 для ноутбуков9. 7281.455 — 2.040 МГц16 GB GDDR6256 бит80 — 150 Вт
GeForce RTX 4080 для ноутбуков7.4241.350 — 2.280 МГц12 GB GDDR6192 бит60 — 150 Вт
GeForce RTX 4070 для ноутбуков4.6081.230 — 2.175 МГц8 GB GDDR6128 бит35 — 115 Вт
GeForce RTX 4060 для ноутбуков3.0721.470 — 2.370 МГц8 GB GDDR6128 бит35 — 115 Вт
GeForce RTX 4050 для ноутбуков2.5601.605 — 2.370 МГц6 GB GDDR696 бит35 — 115 Вт

Первые ноутбуки с видеокартами GeForce RTX 4080 и RTX 4090 выйдут 8 февраля. Модели на «младших» видеокарт появятся в продаже 22 февраля. Цены ноутбуков будут начинаться от $999.

Первые партнеры Acer, Dell и Alienware уже представили свои ноутбуки.

Обновление: После пленарного доклада NVIDIA в Лас-Вегасе можно было посмотреть первые ноутбуки GeForce RTX 40 в работе:

Лучший графический процессор для мобильных смартфонов в 2023 году

Выберите поставщика тестов:

GFXBenchGFXBench 3.0GFXBench 3.13DMarkCenturion Mark

Имя графического процессора

Рейтинг

Оценка 90 003

10-ядерный графический процессор Apple M2

1

891,5

Apple M2 8 -Core GPU

2

839.2

Apple M1 7-Core GPU

3

620

Apple M1 8-Core GPU

4

588

Адрено 740

5

479

Графический процессор Apple A16, 5 ядер

6

458,5

Immortalis-G715 MP11

7

451

Графический процессор Apple A12X Bionic

8

444,7

Графический процессор Apple A15 5- Core

9

427,55

Графический процессор Apple A15, 4 ядра

10

395,75

Adreno 730

11

381

Графический процессор Apple A14 Bionic

12

317,5

Графический процессор Apple A13 Bionic

13

307

Samsung Xclipse 920

14

302

Mali-G710 MP10

15 90 003

281

Mali-G610 MP6

16

272

Adreno 660

17

250,5

Mali-G710 MP7

18

250

Графический процессор Apple A12 Bionic

19

245

Mali -G78 MP22

20

232

Графический процессор Apple A10X Fusion

21

224. 5

Adreno 650

22

206

Mali-G77 MP11

23 900 03

199

Mali-G77 MP9

24

184

Графический процессор Apple A11 Bionic

25

166.9

Adreno 640

26

166

Mali-G78 MP14

27

154

9 0002 Adreno 642

28

153

Mali-G76 MP16

29

151.5

Adreno 630

30

150

Adreno 644

31

147

9000 2 Mali-G72 MP18

32

145

Mali-G78 MP20

33

144

Серия PowerVR 7XT

34

140,15

Adreno 642L

35

133

Графический процессор NVIDIA Tegra X1 Maxwell

36

123

Мали-G76 MP10

37

119.5

Mali-G68 MP5

38

119

Mali-G72 MP12

39

118

Mali-G 57 MP5

40

115

Графический процессор Apple A10 Fusion

41

114,15

Adreno 540

42

111,5

Mali-G57 MP6

43

107,5

Mali-G7 1 MP20

44

105

Mali-G68 MP4

45

102

Mali- G76 MP12

46

96. 5

Adreno 620

47

95

Adreno 619

48

9 0002 91

Adreno 530

49

88

Mali-G52 MP6

50

87

Adreno 618

51

84.5

Mali-G57 MP4

52

84

Mali-T880 MP12

9000 2 53

82

Mali-G76 MP4

54

80

PowerVR GT7600

55

79,95

IMG BXM-8-256

56

74

Mali-G57 MP3 900 03

57

74

Mali-G71 MP8

58

73,5

Адрено 619L

59

72,5

PowerVR GXA6850

60

70,4

Adreno 616

61

65

Mali-G57 MP2

62

63

Графический процессор NVIDIA Tegra K1 Kepler

63

60

Mali-T760 MP8

64

53.5

Adreno 512

65

50

Adreno 430

66

49

PowerVR GM9446

67

45

PowerVR GX6450

68

44,8

Mali-G52 MP2

69

44

Adreno 420

70

41,35

Адрено 612

71

41

Mali-T880 MP4

72

39

Mali-G51 MP4

73

39

Mali-G72 MP3

9 0002 74

38

Адрено 610

75

36

Адрено 509

76

36

Adreno 418

77

34

Mali-T830 MP3

78

34

Intel HD Graphics (Cherry Trail)

79

32

Mali-T760 MP6

80

31

Adreno 510

81

31

Adreno 508

82

30

PowerVR G6430

83

27,9

PowerVR GX6250

84

27,8

Mali-G52 MP1

85

24

Mali-T880 MP2

86

24

Mali-G57 MP1

87 900 03

24

Adreno 330

88

24

PowerVR G6400

89

23. 6

Adreno 506

90

23

Mali-T628 MP6

91

22,8

Mali-G71 MP2

92

22

PowerVR GE8320

93

20

PowerVR GE8322

94

19

Mali-T830 MP2

95

18,5

NVIDIA GeForce Tegra 4

96

17,5

Адрено 505

97

17

Mali-T860 MP2

98

17

Intel HD Graphics (Bay Trail)

99

16

Mal i-T760 MP4

100

16

Из таблицы выше мы можем легко определить, какие модели графических процессоров смартфонов сегодня имеют самую высокую производительность. Как вы, возможно, знаете, графический процессор (GPU) является важнейшим аппаратным компонентом современных смартфонов. Используя хороший графический процессор, вы можете выполнять тяжелые задачи на своем телефоне, особенно с точки зрения рендеринга 3D-моделей.

Проще говоря, графические процессоры необходимы для игр без задержек, особенно для игр с тяжелой 3D-графикой. В отличие от центрального процессора (ЦП), который выполняет различные задачи, единственной задачей графического процессора является обработка графического рендеринга, включая рендеринг как 2D-, так и 3D-изображений в современных мобильных играх.

Использование новейшего графического процессора высшего уровня обеспечивает плавную обработку тяжелых графических задач. Напротив, более старые модели графических процессоров, скорее всего, не смогут обрабатывать тяжелые графические задачи рендеринга, что приведет к плохому взаимодействию с пользователем из-за задержек, заиканий и зависаний.

Однако аппаратное обеспечение графического процессора важно не только для игровых целей. Это важный компонент для многих других многоцелевых задач, таких как мобильный графический дизайн, создание контента, редактирование фото и видео и многое другое.

Чтобы получить наилучшие впечатления от использования современного смартфона, который может выполнять несколько задач, особенно рендеринг 2D/3D-изображений, вы должны выбрать правильный смартфон, который соответствует вашим потребностям.

Эта статья может быть вам полезна, потому что мы собрали данные о графическом процессоре смартфона от нескольких надежных поставщиков тестов и создали таблицу ранжирования на основе результатов каждого теста. Таким образом, пользователи могут легко понять, насколько хороша аппаратная часть графического процессора в таблице рейтинга.

Источники данных

Во-первых, важно отметить, что мы не генерируем данные о баллах сами. Вместо этого мы собираем данные от нескольких надежных поставщиков тестовых инструментов. Для обеспечения точности и надежности данных, которые мы используем, все инструменты сравнительного анализа должны иметь хорошую репутацию, подкрепленную положительными отзывами пользователей, а их данные должны отражать реальное использование.

После тщательного рассмотрения мы выбрали данные из нескольких тестовых инструментов, в том числе:

  • GFXBench
  • GFXBench 3. 0
  • GFXBench 3.1
  • 3DMark
  • Центурион Марк

Мы хотим прояснить, что мы не связаны ни с одним из этих поставщиков; мы используем их данные только для того, чтобы помочь пользователям понять, насколько хорош графический процессор на их смартфоне. Наша цель — предоставить пользователям достоверную и полезную информацию, чтобы они могли принимать обоснованные решения относительно аппаратного обеспечения графического процессора своего смартфона. Используя контрольные данные от надежных поставщиков, мы надеемся предоставить нашей аудитории точные и заслуживающие доверия рейтинги.

Понимание данных о рангах

Понимание данных о рангах необходимо для принятия обоснованных решений об аппаратном обеспечении графического процессора смартфона. Наша система ранжирования проста: наибольшая оценка в тесте получает меньший рейтинг на диаграмме, что указывает на лучшую производительность.

Однако мы ограничиваем данные ранжирования 100 лучшими для нужд современных пользователей, поскольку 100 лучших обычно включают модели графических процессоров с хорошей производительностью. Для более глубокого понимания того, как работает рейтинговая диаграмма, GPU, попавший в первую десятку, обычно является флагманской моделью GPU для смартфонов и должен работать очень хорошо. Ранги с 11-го по 30-е также являются хорошими моделями графических процессоров, как правило, для смартфонов среднего и высокого класса, и они должны справляться с высокой активностью рендеринга.

Ранги с 31-го по 60-й обычно предназначены для моделей графических процессоров смартфонов среднего уровня. Хотя они должны иметь достаточную производительность для большинства действий по рендерингу, окончательный результат может не сравниться с флагманскими моделями из-за ограниченной производительности оборудования.

Наконец, ранги с 61-го по 100-й обычно относятся к моделям GPU начального и среднего уровня или старым моделям смартфонов. Хотя их производительность может быть аналогична моделям среднего уровня, их аппаратная производительность может быть ограничена для интенсивной обработки изображений.

График обновления данных

Мы понимаем, что наличие актуальных данных важно для принятия пользователями обоснованных решений. Таким образом, мы установили график обновления наших данных о рейтинге графических процессоров.

Как правило, мы обновляем данные рейтинга в первую неделю каждого месяца, гарантируя, что данные актуальны и актуальны. Однако в некоторых случаях нам может понадобиться обновлять данные чаще, особенно если есть новые выпуски графических процессоров, которые еще не отражены в нашей базе данных.

Мы стремимся предоставить пользователям самую свежую информацию как можно скорее, чтобы они могли принять оптимальное решение при выборе смартфона с мощным графическим процессором. Наша команда усердно работает над тем, чтобы наши рейтинги были точными, достоверными и отражали реальные результаты.

Заключение

Используя данные таблицы ранжирования, вы можете определить, какие модели графических процессоров мобильных смартфонов имеют наилучшую производительность. Если вы планируете приобрести новый телефон в будущем, данные таблицы рейтинга помогут вам выбрать лучший телефон, который соответствует вашим потребностям.

Однако имейте в виду, что наилучшее взаимодействие с пользователем зависит не только от аппаратного обеспечения графического процессора. Другие аппаратные компоненты, такие как процессор и оперативная память, также играют решающую роль в определении общей производительности смартфона.

Фактически, эти компоненты тесно связаны друг с другом с точки зрения обеспечения наилучшего взаимодействия с пользователем. Поэтому при выборе смартфона важно учитывать все аппаратные компоненты, чтобы убедиться, что он соответствует вашим требованиям к производительности.

Часто задаваемые вопросы

Какой на сегодняшний день лучший мобильный графический процессор?

По данным GFXBench лучшим мобильным графическим процессором является 10-ядерный графический процессор Apple M2 , поскольку он имеет наивысший балл в доступных рейтинговых списках.

Какое аппаратное обеспечение графического процессора лучше всего подходит для телефонов Android?

По данным GFXBench, лучшее аппаратное обеспечение графического процессора для телефонов Android на сегодняшний день — это Adreno 740 .

Какое аппаратное обеспечение графического процессора лучше всего подходит для Apple iPhone?

По данным GFXBench, лучшим графическим процессором для Apple iPhone является 10-ядерный графический процессор Apple M2 .

Какая модель графического процессора Adreno лучшая?

По данным GFXBench, лучшей моделью графического процессора Adreno является Adreno 740 .

Какая модель Apple GPU лучше всего подходит для iPhone?

Согласно GFXBench, лучшей моделью графического процессора Apple для iPhone является 10-ядерный графический процессор Apple M2 .

Какая модель графического процессора ARM Mali лучшая?

Согласно GFXBench лучшей моделью графического процессора ARM Mali является Mali-G710 MP10 .

Какая модель графического процессора PowerVR лучше?

По данным GFXBench лучшей моделью графического процессора PowerVR является PowerVR Series 7XT .

Понимание мобильного графического процессора

При правильной реализации графический процессор в мобильной системе может повысить производительность. Но это большое «если».

Мобильный графический процессор или графический процессор — это специальный сопроцессор, предназначенный для ускорения графических приложений, пользовательских интерфейсов и 3D-контента на вашем смартфоне, планшете, носимых устройствах и устройствах IoT. Фотореалистичные 3D-игры и «живые» графические пользовательские интерфейсы (GUI) — примеры рабочих нагрузок, разработанных специально для графического процессора.

Несколько лет назад GPU был полезной функцией, встроенной в высококачественные потребительские мобильные продукты, которые нуждались в новейших технологиях, чтобы сохранить свой флагманский статус. Теперь, когда графические дисплеи распространены повсеместно и используются на всех типах подключенных устройств, графический процессор стал необходимой частью спецификаций продуктов для всех процессоров мобильных приложений и MCU/MPU среднего/высокого уровня. Графический процессор также помогает дифференцировать продукты, поэтому компании могут создавать привлекательные визуальные решения для своего целевого приложения.

Графический процессор спроектирован как механизм обработки одной инструкции и нескольких данных (SIMD), созданный для массовых параллельных рабочих нагрузок. Трехмерная графика — один из лучших примеров высокопроизводительной параллельной обработки, поскольку графические процессоры могут обрабатывать миллиарды пикселей/вершин или операций с плавающей запятой (GFLOPS) каждую секунду. В основе GPU лежат один или несколько шейдеров (модулей SIMD), которые обрабатывают независимые вершины, примитивы и фрагменты (пиксели). Шейдеры — это вычислительные элементы, которые выполняют программы 3D-графики для каждой вершины, пикселя или другого примитивного базиса.

Программы вершинных шейдеров изменяют свойства объектов, позволяя управлять положением, движением, освещением вершин и цветом. Программы пиксельных или фрагментных шейдеров вычисляют окончательный цвет пикселей, тени, текстуру объекта, освещение и могут быть запрограммированы на добавление специальных эффектов к сцене с такими дополнениями, как размытие, улучшение краев или фильтрация. Существуют также более новые типы шейдерных программ, включая геометрические, мозаичные и вычислительные шейдеры.

Вычислительные шейдеры, такие как в OpenGL ES 3.1, полезны для расширенного рендеринга графики, когда вы можете смешивать контексты 3D и GPU Compute (GPGPU) для добавления реальных эффектов, таких как обработка физики (естественные движения волн и ветра или яркие взрывы в игре) и глобальное освещение (лучшее освещение и тени за счет вычислений с использованием прямых и непрямых источников/лучей света). Графические процессоры также могут эффективно масштабироваться от одного блока шейдеров до тысяч взаимосвязанных, сгруппированных блоков шейдеров для повышения производительности и параллелизма в зависимости от целевого приложения, начиная от Интернета вещей и мобильных и заканчивая высокопроизводительными вычислениями (HPC) и научными вычислениями. Высокопроизводительные шейдеры могут работать на частоте более 1,2 ГГц и выполнять миллиарды инструкций за цикл для обработки графики, OpenCL, OpenVX (обработка изображений) и многого другого.

На рис. 1 показаны некоторые из основных различий между архитектурами CPU и GPU. Каждая конструкция имеет свои сильные стороны и должна работать в тандеме для достижения наиболее оптимального решения (мощность, пропускная способность, совместное использование ресурсов и т. д.). Лучшие проекты используют гетерогенную системную архитектуру, которая разделяет/назначает рабочие нагрузки каждому процессорному ядру в зависимости от его сильных сторон. Графический процессор также становится важной частью системы, поскольку отрасль движется к оптимизации на уровне платформы, где графический процессор используется для приложений с интенсивными вычислениями, помимо графики. Обратите внимание, что в современных гибридных конструкциях есть другие вычислительные блоки, включая DSP, FPGA и другие ядра для конкретных задач, которые можно использовать вместе с комбинацией CPU-GPU.

Рисунок 1

Представление о конвейере графического процессора

Новые графические процессоры используют «унифицированные» шейдеры для достижения наилучшего управления аппаратными ресурсами в различных типах шейдерных программ для балансировки рабочих нагрузок. Первые версии унифицированных шейдеров сочетали обработку вершин (VS) и пикселей (PS), а последующие версии добавляли поддержку геометрических (GS), тесселяции (TS) и вычислительных (CS) шейдеров по мере развития графических API.

Для унифицированных шейдеров рабочие нагрузки, назначенные каждому шейдеру, могут быть основаны либо на вершинах, либо на пикселях, что позволяет шейдеру мгновенно переключаться между любыми контекстами для поддержания высокого уровня использования шейдера. Это сводит к минимуму узкие места и остановки аппаратных ресурсов в случаях, когда у вас есть изображение с большим количеством вершин или пикселей. В неунифицированных шейдерных архитектурах существуют отдельные фиксированные шейдеры VS и PS. Например, если изображение загружено вершинами, VS может остановить конвейер графического процессора, поскольку он должен завершиться, прежде чем графический процессор сможет продолжить обработку остальной части изображения. Это вызывает пузыри конвейера и неэффективное использование оборудования. На рис. 2 показан случай, когда у вас есть отдельные VS и PS, а не единое ядро ​​шейдера.

Рис. 2

За прошедшие годы шейдеры графических процессоров вышли за рамки графики и стали включать конвейеры общего назначения, которые можно настроить для графики, вычислений, совместной обработки изображений (ISP), встроенного зрения, видео (HEVC и H.264). предварительная/постобработка и т. д.) и другие параллельные приложения. Вот почему вы слышите такие термины, как GPGPU (GPU общего назначения) и GPU Compute, используемые для описания широкого использования графических процессоров за пределами рендеринга графики.

На высоком уровне конвейер мобильных графических процессоров состоит из нескольких ключевых блоков:

Хост-интерфейс и (защищенный) MMU

  • Связь с ЦП через интерфейсы ACE-Lite/AXI/AHB.
  • Обрабатывает команды ЦП и получает доступ к данным геометрии из буфера кадров или системной памяти.
  • Выводит поток вершин, который отправляется на следующий этап (вершинный шейдер).
  • Управляет всеми транзакциями графического процессора, включая отправку инструкций/данных шейдерам, выделяет/освобождает ресурсы и обеспечивает безопасность для безопасных транзакций и сжатия данных.

Программируемые унифицированные шейдеры

  • Вершинные шейдеры (VS) включают преобразование вершин, освещение и интерполяцию и могут быть простыми (линейными) или сложными (эффекты морфинга).
  • Пиксельные/фрагментные шейдеры (PS) вычисляют окончательное значение пикселя с учетом освещения, теней и других атрибутов, включая наложение текстуры.
  • Геометрический шейдер (GS) берет примитив (линию, точку или треугольник) и модифицирует, создает (или уничтожает) вершины для повышения уровня детализации объекта. GS позволяет конвейеру графического процессора получать доступ к смежным примитивам, чтобы ими можно было манипулировать как тесно связанной группой для создания реалистичных эффектов, когда соседние вершины взаимодействуют друг с другом для создания эффектов плавного плавного движения (волосы, одежда и т. д.). Комбинация GS/VS/PS обеспечивает более автономную работу графического процессора для внутренней обработки изменений состояния (минимизирует взаимодействие ЦП и графического процессора) за счет добавления арифметической и динамической логики управления потоком для разгрузки операций, которые ранее выполнялись на ЦП. Еще одной ключевой функцией является Stream Out, когда VS/GS может выводить данные непосредственно в память, а доступ к данным может осуществляться автоматически и неоднократно шейдерным блоком или любым другим блоком графического процессора без вмешательства ЦП. Stream Out полезен для рекурсивного рендеринга (повторного использования данных) объектов, требующих многократных проходов, таких как морфинг поверхностей объектов и детальное картирование смещения.
  • Шейдеры тесселяции (TS)

  • включают два модуля с фиксированными функциями, называемые шейдерами Hull и Domain в конвейере TS. TS берет криволинейные поверхности (прямоугольные или треугольные) и преобразовывает их в многоугольные представления (сетку/патч) с различным количеством, которое можно изменить в зависимости от требований к качеству. Более высокие значения создают больше деталей, а более низкие значения создают меньше деталей на объекте. Блок тесселяции состоит из трех частей:
    • Шейдер корпуса (HS) — это программируемый шейдер, который создает патч геометрии (поверхности) из базового входного патча (четырехугольника, треугольника или линии) и вычисляет данные контрольных точек, которые используются для управления поверхностью. HS также вычисляет коэффициент адаптивной тесселяции, который передается тесселятору, чтобы он знал, как разделить атрибуты поверхности.
    • Тесселятор

    • — это фиксированный (настраиваемый) функциональный этап, который разбивает патч на более мелкие объекты (треугольники, линии или точки) на основе коэффициента тесселяции из HS.
    • Domain Shader (DS) — это программируемый шейдер, который оценивает поверхность и вычисляет новую позицию вершины для каждой подразделенной точки в выходном патче, который отправляется в GS для дополнительной обработки.
  • Вычислительный шейдер (CS) добавляет вычислительные возможности GPGPU/GPU к графическому конвейеру, поэтому разработчики могут писать код приложения GLSL, который использует этот шейдер и может выполняться за пределами обычного конвейера рендеринга. Данные могут быть разделены внутри между этапами конвейера и контекстами рендеринг-вычислений, поэтому оба могут выполняться параллельно. CS также может использовать те же контексты, статус, униформы, текстуры, текстуры изображений, атомарные счетчики и т. д., что и конвейеры рендеринга OpenGL/OpenGL ES, что упрощает и упрощает программирование и использование вместе с выводом конвейера рендеринга.

Программируемый растеризатор

  • Преобразует объекты из геометрической формы в пиксельную и отбрасывает (удаляет) любые обратные или скрытые поверхности. Существует много уровней механизмов отбраковки, гарантирующих, что скрытые пиксели не обрабатываются, чтобы сэкономить вычислительные циклы, пропускную способность и мощность.

Интерфейс памяти

  • Удаляет невидимые или скрытые пиксели с помощью Z-буфера, трафаретных/альфа-тестов перед записью пикселей в буфер кадра.
  • На этом этапе выполняется сжатие, включая буферы Z и цветов.

Немедленный режим и графические процессоры с отложенным рендерингом

Существуют две распространенные архитектуры графических процессоров и два метода рендеринга изображения. Оба метода используют один и тот же общий конвейер, описанный ранее, но отличаются механизмом отрисовки. Один метод называется отложенным рендерингом на основе плитки (TBDR), а другой — рендерингом в немедленном режиме (IMR). У обоих есть плюсы и минусы, основанные на их соответствующих вариантах использования.

В 1995 году (до появления смартфонов/планшетов) многие графические компании поддерживали оба метода на рынках ПК и игровых консолей. В группу TBDR входили такие компании, как Intel, Microsoft (Talisman), Matrox, PowerVR и Oak. На стороне IMR были такие имена, как SGI, S3, Nvidia, ATi и 3dfx. Перенесемся в 2014 год — на рынке ПК и игровых консолей не используются архитектуры TBDR. Все архитектуры ПК и консолей, включая PS3/PS4, Xbox 360/One и Wii, основаны на IMR.

Основная причина этого перехода заключалась в присущей IMR силе архитектуры рендеринга объектов, которая могла обрабатывать очень сложные динамичные игры (например, быстрые движения, FPS или гоночные игры, где сцены или точки обзора постоянно меняются от кадра к кадру). рамка). Кроме того, по мере увеличения количества треугольников 3D-контента TBDR не могли идти в ногу, поскольку им приходилось постоянно переполнять свою кэш-память в память кадрового буфера из-за своих архитектурных ограничений. Большее количество треугольников/полигонов позволяет графическому процессору отображать шелковисто-гладкие и детализированные (реалистичные) поверхности вместо блочных изогнутых поверхностей, которые появлялись в старых играх. С добавлением шейдеров тесселяции в IMR рендеринг поверхности, в котором треугольники/многоугольники дополнительно подразделяются, еще больше приближает 3D-графику к реальности.

Современный рынок мобильных устройств точно отражает тенденции рынка ПК и игровых консолей, где технология IMR заменяет TBDR. На рынке TBDR есть две компании, Imagination и ARM, хотя ARM пытается перейти на IMR, поскольку они видят большие преимущества при запуске игр нового поколения на мобильных устройствах. На стороне IMR у вас есть Qualcomm, Vivante, Nvidia, AMD и Intel.

Большим преимуществом использования IMR является то, что разработчики игр/приложений могут повторно использовать и легко переносить свои существующие игровые активы, уже работающие на сложных графических процессорах (или игровых консолях), на мобильные устройства. Поскольку мобильные устройства имеют строгие ограничения по энергопотреблению/температуре и площади кристалла, лучший способ устранить разрыв в производительности и свести к минимуму портирование приложений или значительные изменения кода – использовать архитектуру, аналогичную той, на которой они разрабатываются. IMR дает разработчикам такой выбор в дополнение к получению эквивалентного высококачественного рендеринга качества ПК, и все это упаковано в меньшую площадь кристалла, чем решения TBDR. IMR также повышает пропускную способность внутренней системы и внешней памяти по мере того, как отрасль выходит за рамки интерфейсов прикладного программирования (API) OpenGL ES 3.1 и DirectX 12.

Наконец, архитектуры TBDR оптимизированы для 3D-контента с небольшим количеством треугольников/полигонов и простых пользовательских интерфейсов. Архитектуры IMR превосходны, когда речь идет о динамических пользовательских интерфейсах и детализированном 3D-контенте, которые обеспечивают одинаковый пользовательский опыт и качество игры на ПК и игровых консолях на мобильных устройствах.

Графические API на протяжении многих лет

Ведущий 3D API для мобильных устройств основан на API OpenGL ES от Khronos Group, который используется в большинстве современных смартфонов и планшетов с широким спектром операционных систем, включая Android, iOS и Windows. OpenGL ES основан на настольной версии OpenGL, оптимизированной для мобильных устройств, включая удаление избыточности и редко используемых функций и добавление форматов данных, удобных для мобильных устройств.

Первоначальная версия OpenGL ES 1.1 была основана на оборудовании с фиксированными функциями, а OpenGL ES 2.0 была основана на программируемых вершинных и фрагментных (пиксельных) шейдерах, при этом было удалено преобразование с фиксированными функциями и конвейер фрагментов версии 1. 1. OpenGL ES 3.0 продвигает отрасль еще дальше, добавляя функции, основанные на OpenGL 3.3/4.x, и снижает потребность в расширениях, что упрощает программирование, создавая более жесткие требования к поддерживаемым функциям и уменьшая вариативность реализации. Некоторые функции GLES 3.0 включают запросы окклюзии, MRT, массивы текстур/вершин, создание экземпляров, обратную связь по преобразованию, большую программируемость, совместимость с OpenCL, более высокое качество (32-битные числа с плавающей запятой/целые числа), текстуры NPOT, 3D-текстуры и многое другое.

В марте 2014 года на конференции разработчиков игр компания Khronos выпустила OpenGL ES 3.1 с такими улучшениями, как вычислительные шейдеры (CS), отдельные объекты шейдеров, команды косвенного рисования, улучшенное текстурирование и новые языковые дополнения GLSL. Одновременно с выпуском OpenGL ES 3.1 компания Google также выпустила свой пакет расширений Android L (AEP), для которого требуются функции шейдера геометрии (GS) и тесселяции (TS) в мобильном оборудовании, чтобы обеспечить расширенные 3D-возможности на платформах Android для отражения графики уровня ПК. На рис. 3 показана временная шкала развития OpenGL и OpenGL ES на протяжении многих лет. Переходы и сопоставление для Microsoft DirectX (DX) API показаны на рис. 4. DX9сопоставляется с OpenGL ES 2.0, а DX10/DX11 сопоставляется с OpenGL ES 3.1.

Рисунок 3

Рисунок 4

Графический процессор выходит за рамки графики

За последние несколько лет отраслевые и университетские исследователи обнаружили, что вычислительные ресурсы современных графических процессоров подходят для определенных параллельных вычислений благодаря присущей им параллельной архитектуре. Ускорение вычислений, продемонстрированное на графических процессорах, было быстро признано, и родился еще один сегмент высокопроизводительных вычислений, основанный на огромной вычислительной мощности графических процессоров.

GPU, выходящие за рамки графики, могут называться вычислительными ядрами GPU или GPGPU. Были реализованы различные отраслевые стандарты, такие как OpenCL, HSA, OpenVX и Microsoft DirectCompute, в которых параллелизм задач и инструкций теперь оптимизирован для использования преимуществ различных процессорных ядер. В ближайшем будущем мобильные устройства будут лучше использовать системные ресурсы за счет разгрузки ЦП, DSP или пользовательских ядер и использования графического процессора для достижения максимальной производительности вычислений, плотности вычислений, экономии времени и общего ускорения системы. Наилучшим подходом будет использование гибридной реализации, в которой ЦП и ГП тесно чередуются для достижения целевых показателей производительности и энергопотребления.

Рисунок 5 | В приведенной ниже таблице сравниваются ЦП и ГП при рассмотрении различных факторов, таких как задержка памяти, управление потоками и параллелизм выполнения.

Многие вычислительные задачи, такие как обработка изображений, обработка изображений, аналитика, математические вычисления и другие параллельные алгоритмы, хорошо согласуются с архитектурой GPU SIMD. Вы даже можете запрограммировать графический процессор для использования подхода с несколькими графическими процессорами, при котором вычислительная задача и/или кадр 3D-рендеринга распределяются между графическими процессорами для повышения производительности и пропускной способности. Графический процессор может работать в многоконтекстных режимах для одновременного выполнения 3D и вычислительных потоков. Например, ядра 1 и 2 графического процессора назначены для рендеринга изображений, а ядра 3 и 4 предназначены для функций GPGPU, таких как эффекты частиц (дым/вода/огонь), игровая физика для имитации движения реального мира или естественный пользовательский интерфейс (NUI). ) обработка для поддержки жестов. Другие рынки, на которых внедряется GPGPU, особенно в сегментах встроенного/компьютерного зрения, включают:

  • Дополненная реальность: наложение реальной среды на данные, сгенерированные графическим процессором (изображения, данные, 3D-рендеринг и т. д.), которые могут быть введены с различных датчиков, таких как Google Glass. AR может работать с онлайн-потоками (живыми и прямыми) или офлайн-потоками контента.
  • Извлечение признаков: жизненно важно для многих алгоритмов зрения, поскольку необходимо создавать «точки интереса» изображения и дескрипторы, чтобы графический процессор знал, что обрабатывать. SURF (Speeded Up Robust Features) и SIFT — примеры алгоритмов, которые можно эффективно распараллелить на графическом процессоре. Распознавание объектов и распознавание знаков являются формами этого приложения.
  • Обработка облака точек: включает извлечение признаков для создания 3D-изображений для обнаружения фигур и сегментации объектов в загроможденном изображении. Использование может включать добавление дополненной реальности к картам просмотра улиц.
  • Усовершенствованные системы помощи водителю (ADAS): несколько функций безопасности постоянно рассчитываются в режиме реального времени, включая обнаружение линии / помощь в полосе движения (преобразование Хафа, алгоритмы Собеля / Кэнни), обнаружение пешеходов (гистограмма ориентированных градиентов или HOGS), устранение искажений изображения , обнаружение слепых зон и другие.
  • Безопасность и наблюдение: включает в себя распознавание лиц, которое проходит через локализацию ориентиров лица (классификаторы признаков Хаара), извлечение и классификацию черт лица, а также распознавание объектов.
  • Обработка движения: естественные пользовательские интерфейсы, такие как распознавание жестов рук, которое отделяет руку от фона (например, преобразование цветового пространства в цветовое пространство HSV), а затем выполняет структурный анализ руки для обработки движения.
  • Обработка видео: совместная обработка видео HEVC с использованием шейдерных программ и высокоскоростных вычислений с целыми и плавающими числами.
  • Обработка изображений: объединение GPGPU с процессорами сигналов изображения (ISP) для оптимизированного конвейера обработки изображений.
  • Слияние датчиков: объединяет обработку изображений с данными других датчиков (например, LIDAR) для создания трехмерной пространственной карты с глубиной. Похожая концепция, используемая в графике, — это трассировка лучей, когда вы испускаете луч и прослеживаете его путь через изображение, а также вычисляете все пересечения и отскоки луча от объекта для создания реалистичного трехмерного изображения.

Читайте также: