Рейтинг видеокарт по производительности 2018 таблица nvidia: Рейтинг видеокарт 2018, самые производительные (Тест + Таблица)

Содержание

Лучшие Видеокарты для Майнинга 2018 Таблица

Лучшая видеокарта для майнинга 2018 года, какая она? В этой статье мы расскажем о лучших GPU для майнинга Bitcoin, Ethereum и т.д.

Вероятнее всего, вы уже слышали о Bitcoin, Ethereum и других криптовалютах, которые многие считают цифровыми валютами будущего, поскольку они представляют собой действительно перспективный способ заработка денег.
Суть криптовалют вроде Bitcoin или Ethereum сводится к тому, что они генерируются, и их можно переводить между индивидуумами, не полагаясь на централизованные органы вроде традиционных банков.
Радует факт того, что для «добычи» криптовалюты вы можете использовать обычный персональный компьютер. Многие виды цифровых валют, включая и Ethereum, используют технологии хеширования, сложность которых обеспечивается ограниченной скоростью доступа к памяти. Именно поэтому для эффективного майнинга вам потребуется персональный компьютер с видеокартой высокого уровня с большим объемом видеопамяти.
Таким образом, выбирая лучшую видеокарту для майнинга, следует принимать во внимание объем памяти, а также ее стоимость и уровень потребления электроэнергии. Графический процессор для майнинга поначалу не будет приносить желаемое количество криптовалюты, если только у вас не найдется кругленькой суммы на покупку нескольких видеокарт.
Вероятнее всего вы захотите минимизировать свои первоначальные эксплуатационные расходы, при этом обеспечив получение максимальной прибыли. Именно поэтому мы и составили данный рейтинг лучших видеокарт, обладающих всеми необходимыми для майнинга криптовалюты требованиями.

1.Nvidia GeForce GTX 1070

Низкое потребление энергии, высокий уровень хэшрейта

  • Отличное соотношение потребления энергии и хэшрейта (показателя количества операций хэширования, который майнер способен выполнить за определенный промежуток времени)
  • Большой объем памяти
  • Высокая стоимость устройства

Видеокарта GTX 1070 от компании Nvidia – это не только отличное решение для геймеров, но еще и великолепный графический процессор для майнинга. Все потому, что видеокарта обеспечивает высокий уровень хэшрейта (около 30 мегахеш/сек) при небольшом количестве потребляемой электроэнергии. Важно помнить, что чем больше энергии требует графический процессор, тем дороже обходится его эксплуатация, что не может не сказываться на размерах окончательной прибыли. Как и многие другие новые видеокарты Nvidia, модель 1070 имеет достаточно высокую стоимость, поэтому вначале придется потратиться. Однако если вы серьезно и долгосрочной перспективе решили заняться майнингом криптовалют, GTX 1070 можно считать едва ли не самой лучшей видеокартой для майнинга, доступной сегодня.

Ключевые особенности
Тактовая частота графического ядра1,506МГц
Объем видеопамяти8Гб типа GDDR5
Быстродействие памяти8 Гбит/с
Разъемы питания1 x 6-pin
Потребление энергии150 Ватт
Стандартные разъемы3 x DisplayPort 1. 4, 1 x HDMI 2.0, DL-DVI
Цена$480

2.AMD Radeon RX 580

Самая востребованная видеокарта для майнинга от компании AMD

  • Отличный ценник
  • Хорошая система охлаждения
  • Сложно найти в наличии из-за популярности у майнеров

AMD Radeon RX 580 можно по праву считать одной из самых лучших видеокарт, предназначенных для майнинга. Она даже стала, в некотором роде, жертвой собственной «крутости», поскольку ее невероятно сложно найти в наличии у продавцов. Однако популярность этой видеокарты небезосновательна: она обеспечивает отличный уровень хэшрейта – 29 мегахэш/сек, при этом сохраняя низкое энергопотребление. Кроме всего прочего, цена данной модели ниже, чем у видеокарты GTX 1070. Если вы не побоитесь немного порыться в настройках, то обязательно останетесь довольны майнинговой производительностью данной карты.

Ключевые особенности
Тактовая частота графического ядра1,257МГц
Объем видеопамяти8Гб типа GDDR5
Быстродействие памяти8 Гбит/с
Разъемы питания1 x 8-pin, 1 x 6-pin
Потребление энергии185 Ватт
Стандартные разъемы1 DisplayPort 1.4, 1 x HDMI 2.0
Цена$260

3.

AMD RX 480

Относительно старая видеокарта, но с отличными возможностями для майнинга

  • Низкая стоимость
  • Отличная производительность майнинга
  • Дефицитная модель

Если желаете заплатить низкую цену за приобщение к миру майнинга, видеокарта AMD RX 480 станет отличным вариантом. Низкая стоимость объясняется тем, что данная модель считается относительно устаревшей в сравнении с AMD Radeon RX 580 (если вам удастся ее найти). Да, AMD RX 480 – это еще одна дефицитная видеокарта, благодаря своим возможностям по добыче криптовалюты. Вместе с этим, 8Гб видеопамяти типа GDDR5 позволяет видеокарте достигать уровня хешрейта до 28 мегахэш/сек, опять-таки, не потребляя огромного количества электроэнергии. Кроме этого, если вы бы хотели приобрести еще более дешевую видеокарту для майнинга, доступны конфигурации данной модели с объемом видеопамяти 4Гб.

Ключевые особенности
Тактовая частота графического ядра1,120МГц
Объем видеопамяти8Гб типа GDDR5
Быстродействие памяти8 Гбит/с
Разъемы питания1 x 8-pin, 1 x 6-pin
Потребление энергии150 Ватт
Стандартные разъемы1 DisplayPort 1.4, 1 x HDMI 2.0
Цена$370

4.

AMD Radeon RX Vega 56

Видеокарта с графической производительностью выше пределов своих возможностей

  • Отличная производительность для майнинга
  • Высокий уровень энергопотребления
  • Немного греется при работе

AMD Radeon RX Vega 56 является одной из самых хорошоукомплектованных графических карт, доступных на рынке на сегодняшний день. Тесты производительности подтверждают, что данная модель работает быстрее, чем видеокарта Nvidia GTX 1070. Благодаря повальной увлеченности майнингом биткоинов, графический процессор AMD Radeon RX Vega 56 станет выгодным вложением. Опять-таки, вполне вероятно, что данную модель не так просто найти, а уровень ее энергопотребления говорит о том, что видеокарта окажется дорогостоящим удовольствием в условиях ее круглосуточного использования в целях майнинга. Впрочем, майнинговые возможности AMD Radeon RX Vega 56 сложно переоценить, поэтому, если вам удастся ее найти, определенно, стоит подумать о ее приобретении.

Ключевые особенности
Тактовая частота графического ядра1,156МГц
Объем видеопамяти8Гб типа HBM2
Быстродействие памяти800МГц
Разъемы питания2 x 8-pin
Потребление энергии210 Ватт
Стандартные разъемы3 x DisplayPort 1.4, 1 x HDMI 2.0
Цена$500

5.

Nvidia GTX 1080 Ti

Великолепная, но дорогая, видеокарта для майнинга

  • Невероятная мощность
  • БОтличный уровень хэшрейта
  • Высокая стоимость самой карты и ее эксплуатации

Nvidia GTX 1080 Ti остается одной из самых мощных видеокарт в мире. В частности, данная модель является лучшим вариантом для 4К игр. Впрочем, графический процессор Nvidia GTX 1080 Ti также станет отличным выбором в качестве видеокарты для добычи криптовалюты. Однако есть несколько нюансов, которые не позволили данной видеокарте оказаться выше в этом рейтинге. Во-первых, GTX 1080 Ti имеет достаточно высокий ценник. Также уровень потребления электроэнергии видеокарты выше других в нашем рейтинге. Это значит, что на то, чтобы «отбить» свои первоначальные вложения, вам понадобится больше времени. Если вы готовы потратиться на данную видеокарту (или вы также планируете использовать ее, чтобы играть в игры), результаты вас не разочаруют. При более углубленной настройке вы сможете добиться показателей хэшрейта на уровне 32 мегахэш/сек.

Ключевые особенности
Тактовая частота графического ядра1,480МГц
Объем видеопамяти11Гб типа GDDR5X
Быстродействие памяти11 ГГц
Разъемы питания1 x 6-pin; 1 x 8-pin
Потребление энергии250 Ватт
Стандартные разъемы3 x DisplayPort 1.4, 1 x HDMI 2.0
Цена$730

Тенденции соотношения цены и производительности графических процессоров

Мы хотели бы поблагодарить Алиссу Вэнс, Эшвина Ачарью, Джессику Тейлор и команду Epoch за полезные отзывы и комментарии.

Резюме

Используя набор данных из 470 моделей графических процессоров (GPU), выпущенных в период с 2006 по 2021 год, мы обнаружили, что количество операций с плавающей запятой в секунду на доллар (далее FLOP/с на доллар) удваивается каждые ~2,5 года. Для лучших графических процессоров в любой момент времени мы обнаруживаем более медленную скорость улучшения (FLOP/с на доллар удваивается каждые 2,9 секунды).5 лет), в то время как для моделей графических процессоров, обычно используемых в исследованиях машинного обучения, мы обнаруживаем более высокую скорость улучшения (FLOP/s на доллар удваивается каждые 2,07 года). Повышение цены и производительности графического процессора, как правило, было немного медленнее, чем 2-летнее время удвоения, связанное с законом Мура, намного медленнее, чем то, что подразумевается законом Хуанга, но значительно быстрее, чем обычно обнаруживалось в предыдущей работе по тенденциям соотношения цены и производительности графического процессора. Мы стремимся предоставить более точную характеристику тенденций соотношения цены и производительности графических процессоров на основе большего количества данных более высокого качества, которые более устойчивы к оправданным изменениям в анализе, чем предыдущие исследования. 1

Рисунок 1. Графики FLOP/s и FLOP/s на доллар для нашего набора данных и соответствующих тенденций из существующей литературы

Тренд 2 раза 10 раз Скорость роста Метрическая система

Наш набор данных
(n=470)

2,46 года
[2,24, 2,72]

8,17 лет
[7,45, 9.04]

0,122 OOM/год
[0,134, 0,111]

FLOP/с за доллар

ML GPU
(n=26)

2,07 года
[1,54, 3,13]

6,86 лет
[5. 12, 10.39]

0,146 OOM/год
[0,195, 0,096]

FLOP/с за доллар

Лучшие графические процессоры
(n=57)

2,95 года
[2,54, 3,52]

9,81 лет
[8,45, 11,71]

0,102 OOM/год
[0,118, 0,085]

FLOP/с за доллар

Наши данные FP16 (n=91)

2,30 года
[1,69, 3,62]

7,64 года
[5,60, 12,03]

0,131 OOM/год
[0,179, 0,083]

FLOP/с за доллар

Закон Мура

2 года

6,64 года

0,151 OOM/год

Флоп/с

Закон Хуана

1,08 года

3,58 года

0,279 OOM/год

Флоп/с

История ЦП (воздействие ИИ, 2019 г. )

2,32 года

7,7 лет

0,130 OOM/год

FLOP/с за доллар

Бергаль, 2019 г.

4,4 года

14,7 лет

0,068 OOM/год

FLOP/с за доллар

Таблица 1. Сводка наших выводов о тенденциях цены и производительности графических процессоров и соответствующих тенденциях в существующей литературе с 95% доверительные интервалы в квадратных скобках.

Введение

Графические процессоры

являются доминирующей вычислительной платформой для ускорения рабочих нагрузок машинного обучения (ML), и большинство (если не все) крупнейших моделей за последние пять лет обучались на графических процессорах или другом оборудовании специального назначения, таком как блоки тензорной обработки (TPU). Улучшение соотношения цены и качества базового оборудования привело к быстрому росту количества обучающих программ машинного обучения (Sevilla et al., 2022) и, таким образом, в значительной степени способствовало недавнему прогрессу в области искусственного интеллекта.

Скорость улучшения графических процессоров анализировалась ранее. Например, Su et al., 2017 обнаруживает скорость удвоения FLOP/с графического процессора с 2006 по 2017 год за 2,4 года. Sun et al., 2019 анализирует более 4 000 моделей графических процессоров и обнаруживает, что FLOP/с на ватт удваивается примерно каждые три-четыре года. Напротив, некоторые предполагают, что повышение производительности графического процессора происходит быстрее, чем экспоненциальное улучшение, связанное с другими микропроцессорами, такими как центральные процессоры (для которых время удвоения обычно составляет от 2 до 3 лет, см. AI Impacts, 2019).). Примечательным среди них является так называемый закон Хуанга, предложенный генеральным директором NVIDIA Дженсеном Хуангом, согласно которому графические процессоры улучшаются «в 25 раз каждые 5 лет» (Mims, 2020), что эквивалентно удвоению производительности примерно на 1,1 года.

Существует предыдущая работа, специально посвященная анализу соотношения цены и производительности для процессоров и графических процессоров (обобщение приведено в таблице 1). Предыдущие оценки темпов улучшения сильно различаются (например, время, необходимое для увеличения соотношения цены и качества в 10 раз, колеблется от ~ 6 до ~ 15 лет, в зависимости от точности вычислений — см. Таблицу 2). Из-за высокой дисперсии предыдущих подходов и использования ими меньших наборов данных мы не уверены в существующих оценках. 2

долларов США

$

долларов США

№ по каталогу Тип процессора Метрическая система 2 раза 10 раз Скорость роста
Бергаль, 2019 ГП FLOP/s на $ в FP32, FP16 и FP16, объединенных умножить-сложить 4,4 года (FP32)
3,0 года (FP16)
1,8 года (предохранитель FP16)
14,7 лет (FP32)
10,0 лет (FP16)
6,1 лет (FP16 с предохранителем)
0,068 OOM/год (FP32)
0,100 OOM/год (FP16)
0,164 OOM/год (FP16 объединенный)
Медианная группа, 2018 ГП FLOP/s на $ в FP32 1,5 года 5,0 лет 0,200 OOM/год
Мюльхаузер и Рибер, 2014 Разное млн операций в секунду/ 1,6 года 5,2 года 0,192 OOM/год
Сандберг и Бостром, 2008 г. на базе процессора MIPS/$ и FLOP/s за 1,7 года (MIPS)
2,3 (FLOP/с)
5,6 лет (MIPS)
7,7 лет (FLOP/с)
0,179 OOM/год (MIPS)
0,130 OOM/год (FLOP/с)
Нордхаус, 2001 на базе процессора млн операций в секунду/ 1,6 года 5,3 года 0,189 OOM/год
Таблица 2. Улучшения соотношения цены и качества, обнаруженные в предыдущей работе. См. также AI Impacts 2015 для получения более подробного обзора предыдущих оценок.

Мы стремимся расширить существующую работу тремя основными вкладами:

  1. Используя больший набор данных о моделях графических процессоров, чем тот, который был проанализирован в предыдущих исследованиях, включая более свежие модели графических процессоров, мы получаем более точные оценки скорости улучшения соотношения цены и производительности для графических процессоров, чем это существует в настоящее время 3
  2. Мы анализируем несколько ключевых подтенденций улучшения соотношения цены и производительности графических процессоров, таких как тенденции соотношения цены и производительности для высокопроизводительных графических процессоров и для графических процессоров, обычно используемых для машинного обучения
  3. .

  4. Мы рассматриваем тенденции в перспективе, сравнивая их с предыдущими оценками, законами Мура и Хуанга, предыдущими анализами и общедоступными прогнозами производительности графических процессоров

Набор данных

Мы объединили два существующих набора данных по соотношению цены и производительности GPU. Один набор данных принадлежит Median Group и содержит данные о 223 графических процессорах Nvidia и AMD (Median Group, 2018). Второй набор данных взят у Sun et al., 2019., который содержит данные о цене и производительности для 413 графических процессоров, выпущенных Nvidia, Intel и AMD.

Рисунок 2. Графики FLOP/s и FLOP/s на доллар для наборов данных Median Group и Sun et al., 2019 г.

Мы объединили оба набора данных и удалили повторяющиеся наблюдения, т. е. модели GPU, которые содержались в обоих наборах данных. Кроме того, мы удалили разные версии одного и того же продукта, если только они не имели разных спецификаций. 4

Мы также решили отказаться от наблюдений до 2006 года по двум основным причинам: 1) неясно, можем ли мы осмысленно сравнивать их уровни производительности, поскольку эти модели предшествуют инновациям, позволяющим выполнять вычисления общего назначения на графических процессорах, и 2) мы не смогли проверить точность данных, просмотрев соответствующие сведения о производительности в технических описаниях моделей. Более подробное обсуждение см. в Приложении A.

Наконец, мы заметили, что существует подмножество из 20 графических процессоров, для которых 16-битная производительность примерно в 60 раз хуже, чем их производительность в 32-битном формате, в то время как для всех остальных графических процессоров 16-битная производительность по крайней мере не уступает 32-битной производительности. Мы отказались от этих 16-битных показателей производительности, которые, по нашему мнению, могли быть ошибочными.

Таким образом, окончательный набор данных содержит 470 графических процессоров AMD, Intel и Nvidia, выпущенных в период с 2006 по 2021 год. В остальной части отчета мы будем называть этот объединенный набор данных «нашим набором данных». Повсюду значения FLOP/s имеют 32-битную (полную) точность.

Рисунок 3. Графики FLOP/s и FLOP/s на доллар для набора данных, использованного в нашем анализе

Эмпирический анализ

Далее мы анализируем тенденции соотношения цены и производительности, измеряемые в FLOP/с на доллар, а также общую производительность в FLOP/с для графических процессоров в нашем наборе данных. В нашем анализе рассматриваются ключевые подмножества, такие как графические процессоры, обычно используемые в исследованиях машинного обучения, а также наиболее производительные графические процессоры. 5  

Эмпирический тренд в сравнении с другими прогнозами

Чтобы представить наши результаты в контексте, мы сравнили их с другими предполагаемыми тенденциями производительности графических процессоров (цена), найденными в других источниках. это

  • Закон Мура, согласно которому плотность транзисторов удваивается каждые два года. Для сравнения, мы считаем, что это означает, что количество FLOP/s также удваивается каждые два года
  • .

  • Закон Хуанга, который описывает скорость повышения производительности графических процессоров. Несмотря на то, что существует несколько интерпретаций закона Хуанга, мы выбрали ту, которая отражает первоначальную формулировку Хуанга, а именно «улучшение в 25 раз каждые 5 лет»
  • .

  • Исторические тенденции соотношения цены и производительности ЦП, которые, как было установлено, увеличиваются в 10 раз каждые 7,7 лет с 1940 (Воздействие ИИ, 2019 г. )
  • Прогноз, сделанный в Cotra 2020 2,5-летнего времени удвоения соотношения цены и производительности вычислений, связанных с обучением машинному обучению 6
  • Предыдущие оценки соотношения цены и производительности GPU, найденные Бергалом, 2019 г.

Мы признаем, что некоторые из этих тенденций не совсем сопоставимы с количеством FLOP/с на доллар (закон Мура относится к плотности цепей, закон Хуанга относится к теоретическому повышению производительности, а прогнозы Cotra 2020 относятся к FLOP/с на доллар 9).0009 7 ). Цель этих сравнений состоит в том, чтобы дать приблизительное представление о том, как наши оценочные тенденции соотносятся с соответствующими эмпирическими тенденциями и прогнозами.

Если не указано иное, мы будем представлять результаты для FLOP/s за доллар. Это связано с тем, что мы а) думаем, что FLOP/s на доллар является более актуальной тенденцией, как утверждалось ранее, и b) потому что между трендами FLOP/s и FLOP/s на доллар не так уж много различий. Подробное сравнение см. в Приложении B.

Рисунок 4. FLOP/с на доллар для нашего набора данных и соответствующих тенденций, найденных в других источниках

Мы обнаружили, что линейная регрессия по всем нашим данным показывает время удвоения 2,46 года (95% ДИ: от 2,24 до 2,72 года). Это очень хорошо соответствует наклону 2,5, используемому в Cotra 2020. Мы также видим, что закон Хуанга не подходит для всей тенденции и сильно завышен.

Тенденции точности для плавающих форматов

Вычисления половинной точности (FP16) и вычисления смешанной точности (обычно FP16 и FP32) в настоящее время широко используются для глубокого обучения. В нашем наборе данных у нас было 91, для которых у нас были как цена, так и показатели производительности FP16. 8  

Рисунок 5. FLOP/с на доллар для производительности FP32 и FP16

Мы обнаружили, что время удвоения цены и качества в FP16 составило 2,32 года (95% ДИ: 1,69 года, 3,62 года). Это незначительно отличалось от наклона времени удвоения соотношения цена-качество в FP32, что позволяет предположить, что улучшения соотношения цена-качество в FP16 и FP32, вероятно, будут схожими. Это противоречит выводам Бергала, 2019 г., который находит 1,8-летнее время удвоения для FP16 FMA. 9 В дальнейшем мы решили сосредоточиться на соотношении цена-качество в FP32, поскольку мы не находим статистически значимой разницы между двумя тенденциями, и поэтому мы решили анализировать модели, по которым у нас есть больше всего данных.

Тенденции графических процессоров, используемых в ML

Подавляющее большинство всего обучения машинному обучению выполняется на очень небольшом количестве различных моделей графических процессоров. Из предыдущей публикации, в которой мы рассмотрели 75 статей, в которых представлены основные модели машинного обучения, мы собрали в общей сложности 42 различные модели графических процессоров, которые обычно используются для обучения систем машинного обучения. Всего мы нашли 26 из этих 42 графических процессоров в нашем наборе данных по графическим процессорам.

Мы обнаружили, что соотношение цены и производительности графических процессоров, используемых в ML, улучшается быстрее, чем у типичного графического процессора. Мы обнаружили, что FLOP/с на доллар для GPU ML удваивается каждые 2,07 года (95% ДИ: от 1,54 до 3,13 года) по сравнению с 2,46 года для всех GPU. Это незначительно отличается от кривой времени удвоения соотношения цены и производительности для всех графических процессоров.

Рисунок 6. FLOP/с на доллар для нашего набора данных и отдельно для моделей графических процессоров, обычно используемых в исследованиях машинного обучения, по сравнению с соответствующими тенденциями, обнаруженными в других местах

Кроме того, новейшие графические процессоры ML, как правило, входят в число графических процессоров с высоким соотношением цены и производительности, в то время как более старые являются более средними.

Более того, если посмотреть через призму FLOP/s, становится еще яснее, что в последних экспериментах по машинному обучению используются самые мощные графические процессоры. Мы считаем, что это показывает возросшую важность графических процессоров для современного машинного обучения. И снова графические процессоры с машинным обучением демонстрируют более крутой наклон, чем общая тенденция (время удвоения 2,00 года по сравнению с 2,31 года для всех графических процессоров).

Наша более высокая оценка скорости улучшения производительности среди графических процессоров, используемых для исследований ML, может быть объяснена тем, что соответствующие лаборатории тратят больше ресурсов на закупку лучших графических процессоров с течением времени. Если бы это было так, это отражало бы просто изменение инвестиционных решений соответствующих исследовательских лабораторий, а не более высокую, чем обычно, скорость улучшения базового оборудования среди соответствующих графических процессоров, подходящих для рабочих нагрузок машинного обучения. Учитывая это, а также поскольку наши оценки для всех графических процессоров статистически значимо не различаются, мы ожидаем, что время удвоения ~2,5 года будет более надежной оценкой базовой скорости улучшения соотношения цены и производительности оборудования.

Тенденция самых производительных графических процессоров

Как мы видели в предыдущем разделе, последние модели машинного обучения, как правило, обучаются на самых современных графических процессорах. Таким образом, наблюдение за тенденцией наиболее производительных графических процессоров может быть хорошим индикатором возможностей машинного обучения в будущем. Обратите внимание, что это не означает, что мы думаем, что производительность графического процессора будет расти линейно. Мы опубликуем более подробные мысли о прогнозах на основе этих данных во второй части.

Здесь мы выбираем подмножество графических процессоров, у которых были самые высокие значения FLOP/s на доллар в течение каждого месяца. Для этого подмножества моделей мы находим время удвоения 2,9.5 лет (95% ДИ: от 2,54 до 3,52 года), что статистически значимо больше, чем обычное время удвоения.

Рисунок 7. FLOP/с на доллар для нашего набора данных и отдельно для самых производительных графических процессоров по сравнению с соответствующими тенденциями, обнаруженными в других источниках

Все тренды (таблица и рисунок)

Чтобы сравнить все тенденции, которые мы выделили выше, и те, которые вы можете найти в приложении, мы собрали все тенденции и для каждой указали соответствующее время, необходимое для увеличения в 2 и 10 раз.

Тренд Оригинальная презентация 2 раза 10 раз Скорость роста Артикул
Закон Мура 2 раза каждые 2 года 2 года 6,64 года 0,151 OOM/год Флоп/с
Закон Хуанга 25 раз каждые 5 лет 1,08 года 3,58 года 0,279 OOM/год Флоп/с
Отчет о биологических якорях (Cotra, 2020) 2 раза каждые 2,5 года 2,5 года 8,30 лет 0,120 OOM/год FLOP/с за доллар
История ЦП (AI Impacts, 2019) 10 раз каждые 7,7 года 2,32 года 7,7 лет 0,130 OOM/год FLOP/с за доллар
Медианная группа, 2018 2 раза каждые 1,5 года 1,5 года 5,0 лет 0,200 OOM/год FLOP/с за доллар
Наши данные (n=470) 2,46 года [2,24, 2,72] 8,17 лет [7,45, 9,04] 0,122 OOM/год
[0,134, 0,111]
FLOP/с за доллар
Наши данные (n=470) 2,31 года [2,14, 2,51] 7,68 лет [7,12, 8,33] 0,130 OOM/год
[0,140, ​​0,120]
Флоп/с
Наши данные FP16 (n=91) 2,30 года [1,69, 3,62] 7,64 года [5,60, 12,03] 0,131 Ом/год
[0,179, 0,083]
FLOP/с за доллар
Наши данные FP16 (n=91) 2,91 года [1,94, 5,83] 9,68 лет [6,45, 19,35] 0,103 OOM/год
[0,155, 0,052]
Флоп/с
ML GPU (n=26) 2,07 года [1,54, 3,13] 6,86 лет [5,12, 10,39] 0,146 OOM/год
[0,195, 0,096]
FLOP/с за доллар
ML GPU (n=26) 2,00 года [1,69, 2,43] 6,63 года [5,63, 8,07] 0,151 OOM/год
[0,178, 0,124]
Флоп/с
Лучшие графические процессоры (n=57) 2,95 года [2,54, 3,52] 9,81 лет [8,45, 11,71] 0,102 OOM/год
[0,118, 0,085]
FLOP/с за доллар
Лучшие графические процессоры (n=57) 2,69 года [2,40, 3,30] 8,92 года [7,99, 10,95] 0,112 OOM/год
[0,125, 0,091]
Флоп/с
Таблица 3. Сводка наших выводов о тенденциях соотношения цены и производительности графических процессоров и соответствующих тенденциях в существующей литературе. 95% доверительные интервалы показаны в квадратных скобках.

Рисунок 8. FLOP/s на доллар для нашего набора данных и различных подгрупп по сравнению с соответствующими тенденциями, обнаруженными в других источниках

Заключение

Мы обнаружили, что тенденция всех данных показывает время удвоения 2,46 года, тенденция, предполагаемая графическими процессорами, используемыми в ML, показывает время удвоения 2,07 года, а тенденция, предполагаемая лучшими графическими процессорами каждого месяца, показывает время удвоения 2,95. Мы считаем, что время удвоения менее 2 лет или более 3 лет маловероятно, учитывая данные. Кроме того, мы считаем, что часть тенденции в области графических процессоров ML может быть объяснена тем, что ML отдает приоритет лучшим графическим процессорам, а не фактическим аппаратным достижениям. Поэтому мы считаем, что время удвоения в 2 года слишком агрессивно, и ~ 2,5 года точно описывает время удвоения соотношения цены и производительности для графических процессоров за последние 15 лет.

Приложение A. Удаление данных до 2006 года

В итоге нам показалось, что аргументы в пользу сохранения данных были слабее, чем в пользу их удаления. Короче говоря, очень неясно, измеряются ли данные до 2006 года сопоставимым способом и действительно ли графические процессоры до 2006 года сопоставимы с графическими процессорами после 2006 года.

Аргументы за включение данных до 2006 года:

  1. Медианная группа предоставила данные и каким-то образом получила оценку FLOP/s

Аргументов против включения данных до 2006 г.:

  1. Данные на графике выглядят подозрительно
  2. Алисса Вэнс указала в комментарии, что графические процессоры общего назначения не разрабатывались до 2005 года, а cuda не существовала до 2007 года. Это означает, что мы говорим о каких-то очень разных графических процессорах, которые имеют мало общего с графическими процессорами, о которых мы говорим сегодня.
  3. Измерение «теоретической производительности» недоступно для большинства графических процессоров до 2006 года. Поэтому неясно, как эти данные были первоначально собраны.
    1. Список графических процессоров до 2006 года:
      1. GeForce 2 GTS Pro (без FLOP/с)
      2. GeForce 3 (без FLOP/с)
      3. GeForce 3 Ti500 (без FLOP/с)
      4. GeForce 3 Ti200 (без FLOP/с)
      5. GeForce FX 5200 (без FLOP/с)
      6. GeForce FX 5200 Ultra (без FLOP/с)
      7. GeForce FX 5600 Ultra (без FLOP/с)
      8. GeForce FX 5800 (без FLOP/с)
      9. GeForce FX 5800 Ultra (без FLOP/с)
      10. GeForce FX 5900 / 5900 XT / 5900 ZT (без FLOP/с)
      11. GeForce FX 5700 Ultra (без FLOP/с)
      12. GeForce FX 5950 Ultra (без FLOP/с)
      13. GeForce FX 5900 Ultra (без FLOP/с)
      14. GeForce 6200 TurboCache 64-TC/256 МБ (без FLOP/с)
      15. Графический процессор ATI Xbox 360, 90 нм (ДА, FLOP/s)
    2. Похоже, что после 2006 года карты модели GPU имеют производительность FP32 FLOP/s. Вот несколько образцов
      1. GeForce 7900 GX2 (2006 г., без FLOP/с)
      2. GeForce 8800 GTX (2006, ДА FLOP/s)
      3. GeForce 8800 GTS 640 (2006, ДА FLOP/s)
      4. GeForce 8600 GT (2007 г., ДА FLOP/s)
      5. GeForce 8500 GT (2007, ДА FLOP/s)
      6. Radeon HD 2900 XT (2007 г., ДА FLOP/s)
      7. После этого тренд продолжается

Приложение B. Проверка устойчивости для FLOP/s

В нашем наборе данных мы смотрим только на графические процессоры, для которых у нас есть FLOP/s и информация о цене, поскольку нас интересуют производительность и цена. Однако существует гораздо больше графических процессоров, у которых есть информация о производительности, чем о тех, для которых у нас есть и производительность, и цена. Мы находим 1848 точек данных, для которых у нас есть данные FLOP/s. Чтобы убедиться, что нет эффекта отбора, мы также анализируем тренд «только FLOP/s».

Рисунок 9. Эмпирические значения FLOP/s для всех графических процессоров, для которых у нас есть информация о FLOP/s для

Мы находим, что это в значительной степени точно совпадает с тем, что мы видим из нашей предыдущей выборки, и поэтому делаем предварительный вывод, что нет причин отбрасывать наши предыдущие результаты. Мы также видим, что графические процессоры, для которых у нас есть данные о ценах, как правило, имеют более высокие значения FLOP/s. Мы предполагаем, что более мощные графические процессоры используются чаще и, следовательно, имеют более высокую доступность ценовой информации.

Больше графиков FLOP/s

Для всех графиков, используемых в статье, также есть версия, в которой мы рассматриваем только информацию о FLOP/s. Обратите внимание, что это не данные «просто-FLOP/s» из предыдущего раздела. Скорее это тот же набор данных, что и в основном тексте, но мы не делили его по цене.

Рисунок 10. Эмпирические FLOP/s для нашего набора данных

Рисунок 11. Эмпирические FLOP/s для нашего набора данных с подмножеством графических процессоров, используемых для машинного обучения.

Рисунок 12. Эмпирический показатель FLOP/s для графических процессоров с самым высоким значением FLOP/s за каждый месяц

Рисунок 13. Эмпирические значения FLOP/s для графических процессоров с лучшими FLOP и графическими процессорами ML вместе взятых

Рисунок 14. Эмпирические значения FLOP/s для FP16 и FP32

Мы не включили их в основной текст, потому что они показывают очень похожие наклоны, как FLOP/s на доллар, и мы считаем, что FLOP/s на доллар является более важным показателем.


  1. Эта работа не пытается спрогнозировать будущее соотношение цены и качества графических процессоров, а просто оценивает недавнюю историческую тенденцию. В будущей работе мы намерены исследовать, какие тенденции соотношения цены и производительности графических процессоров информируют нас об историческом росте расходов на оборудование в машинном обучении и будущих крупных учебных курсах по машинному обучению.

  2. Кроме того, мы обнаружили ошибки в оценках по результатам предыдущего расследования, проведенного Median Group (2018 г.), на которые мы указали им, и которые они с тех пор исправили. ↩

  3. К сожалению, мы не можем опубликовать наши данные, но код, который сгенерировал все цифры, можно найти здесь. ↩

  4. Например, считайте NVIDIA Tesla K40c и NVIDIA Tesla K40d одними и теми же моделями, поскольку они имеют практически идентичные характеристики. ↩

  5. Мы уделяем основное внимание этим показателям, поскольку нас в основном интересуют вопросы, связанные с объемом вычислений, которые могут быть развернуты для крупных экспериментов с ИИ. Хотя есть и другие показатели, которые могут представлять интерес (например, энергоэффективность), мы не рассматриваем их здесь, поскольку они имеют менее прямое отношение к вопросам, мотивирующим нашу работу, и потому что они были проанализированы в предыдущих работах, в частности, в Sun et al. , 2019.. ↩

  6. Это наша интерпретация раздела 4 ее проекта отчета, где она пишет: «Я также предполагаю, что эффективный FLOP/с на доллар удваивается примерно каждые 2,5 года примерно в 2025 году. Это медленнее, чем закон Мура (который устанавливает время удвоения ~ 1-2 года и достаточно хорошо описывает рост до середины 2000-х годов), но быстрее, чем рост эффективных FLOP/с на доллар с ~ 2008 по 2018 год (a время удвоения ~3-4 года)” ↩

  7. FLOP на доллар в Cotra 2020 – это общий объем вычислений, которые можно выполнить на доллар. ↩

  8. Мы также сначала рассмотрели производительность FP64, но решили не включать анализ, поскольку производительность FP64 кажется намного ниже, чем производительность FP32 для новых графических процессоров. Мы интерпретируем это как то, что производители графических процессоров отказываются от приоритета FP64 в пользу FP32 и FP16.

  9. Мы подозреваем, что это связано с тем, что их подход включает анализ движущихся оптимумов, что в их случае включает анализ 9точки данных, которые, по нашему мнению, недостаточны для уверенности в их точечной оценке. ↩

Тесты Nvidia GeForce GTX 1080: хорошо для 4K, отлично для 1440p с высокой частотой кадров

GeForce GTX 1080 была первой картой Nvidia поколения Pascal, появившейся на рынке, предлагая значительный прирост производительности по сравнению с предыдущей эпохой Maxwell, а также множество новых функций и технологий. Сегодня она остается одной из самых мощных видеокарт для компьютерных игр с высокими разрешениями, особенно 1440p и 4K, а также хорошо справляется с мониторами с высокой частотой обновления и виртуальной реальностью.

Тем не менее, старый король графических процессоров действительно стоит больше, чем GTX 1070 Ti — если вы сможете найти любую карту в рознице спустя столько времени после запуска — и GTX 1080 Ti, RTX 2080 и RTX 2080 Ti предлагают более высокую производительность. RTX 2070, возможно, является ближайшим современным конкурентом GTX 1080, учитывая, что новая видеокарта Turing предлагает функции RTX и DLSS и немного более высокий уровень производительности — и все это по более низкой цене во многих регионах.

Мы рассмотрим результаты тестов девяти недавних игр, чтобы дать вам хорошее представление о том, какую производительность следует ожидать, когда GTX 1080 работает в паре с подходящим процессором при очень высоких или сверхвысоких графических настройках. Мы не рекомендуем ничего быстрее, чем GTX 1070, для игр с разрешением 1080p, так как ЦП становится узким местом, и вы оставляете производительность графического процессора на столе. Но если вы играете в 1080p с GTX 1080 на дисплее с высокой частотой обновления, мы рекомендуем вам использовать его с Intel Core i7 8700K или лучше, чтобы получить максимально возможную частоту кадров.

Какие графические процессоры стоит покупать? Мы отобрали лучшие из доступных графических карт, обновляя их новейшими графическими картами по мере их выпуска. Помимо чемпиона по общей производительности, мы назовем видеокарту с лучшим соотношением цены и качества и лучшую дешевую видеокарту, чтобы ориентироваться при следующем обновлении.

В этом обзоре тестов мы сравним GTX 1080 с новыми RTX 2070, RTX 2080 и старой GTX 1080 Ti; мы также добавим топовый графический процессор AMD Vega 64. Ближе к концу страницы мы также покажем вам, как GTX 1080 сравнивается с прошлыми поколениями карт Nvidia и всей серией Nvidia GeForce 10, включая младшие модели, чтобы вы могли лучше понять отображаемую здесь мощность.

Наши тесты GTX 1080 основаны на версии Founders Edition, изображенной здесь. Версии сторонних производителей с более массивными кулерами часто оснащены заводским разгоном, который может повысить производительность примерно на пять-семь процентов.

ядер графического процессора Повышенная частота терафлопс Память Пропускная способность памяти
GTX 1080 2560 1733 МГц 8,9 8 ГБ 320 ГБ/с
GTX 1080 Ти 3584 1582 МГц 11,3 11 ГБ 484 ГБ/с
RTX 2070 2304 1620 МГц 7,5 8 ГБ 448 ГБ/с
RTX 2080 2944 1710 МГц 10,1 8 ГБ 448 ГБ/с
Вега 64 4096 1546 МГц 12,7 8 ГБ 484 ГБ/с

В каждом тесте игры используется наша собственная система, состоящая из видеоролика YouTube с синхронизированной телеметрией ниже. Нажмите на видео, чтобы начать воспроизведение, и вы сможете посмотреть, как каждая карта обрабатывает сцену в режиме реального времени. Вы можете добавлять или удалять различные карты из сравнения, а также переключаться между разрешениями 1440p и 4K в соответствии с вашими потребностями. (В настоящее время это доступно только в настольной версии Eurogamer; приносим извинения пользователям мобильных устройств.)

Например, если у вас есть монитор 4K, вы можете выбрать только результаты 4K, тогда как если бы у вас уже была GTX 1080 и вы думали о мониторе, вы могли бы увидеть, как производительность отличается между 1440p и 4K. Помимо статистики в реальном времени, внизу есть сводка о том, как каждая карта ведет себя в среднем на протяжении всей сцены.

Помимо средней частоты кадров, вы также можете наводить курсор мыши на разные карты графика, чтобы увидеть лучшие и худшие результаты — лучший один процент, лучшие пять процентов, худшие пять процентов, худший один процент — что может быть полезно, чтобы увидеть, как карты справляются с самыми простыми или самыми сложными частями каждой сцены. Помимо просмотра частоты кадров для каждого из этих показателей, вы также можете щелкнуть гистограмму, чтобы переключиться между частотой кадров и относительной производительностью — и последняя может оказаться более полезной при сравнении производительности.

Эта система сравнительного анализа уникальна для Digital Foundry и предлагает столько данных, сколько вам нужно. Для получения дополнительной информации вы можете увидеть, как работает система бенчмаркинга Digital Foundry, прямо здесь. Теперь, когда мы рассмотрели преамбулу, давайте запустим несколько тестов!

Кредо Убийцы Одиссея

Начнем с Assassin’s Creed Odyssey, самой последней игры, созданной на движке Ubisoft AnvilNext 2.0. Широкие перспективы в игре сложны даже при разрешении 1080p: GTX 1080 едва достигает среднего результата в 60 кадров в секунду, что значительно опережает Vega 64, которая борется, но значительно отстает от GTX 1080 Ti, RTX 2070 и RTX 2080. RTX 2070. RTX 2080 — самая быстрая карта в отрасли, опережающая почти на 30% при том же разрешении. В разрешении 4K GTX 1080 по-прежнему выдает кинематографическую среднюю скорость 30 кадров в секунду, а Vega 64 находится недалеко от нее.

AC Odyssey: сверхвысокий, TAA

Включите JavaScript, чтобы использовать наши инструменты сравнения.

Кредо Убийцы Единство

Далее у нас идет Assassin’s Creed Unity, игра 2014 года, демонстрирующая величие и хаос Парижа эпохи революции. GTX 1080 на 15% опережает лучшую карту AMD, Vega 64, в разрешении 1440p. Тем не менее, GTX 1080 Ti демонстрирует свое превосходство: результат на 19% выше, чем у GTX 1080, и на 14% выше, чем у RTX 2070. В разрешении 4K GTX 1080 обеспечивает 35 кадров в секунду, что позволяет предположить, что для достаточно плавного воспроизведения может потребоваться дисплей G-Sync. Также обратите внимание на большую разницу в производительности с AMD — аппаратное обеспечение Radeon борется всякий раз, когда визуализируется игровой эффект глубины резкости.

AC Unity: сверхвысокий, FXAA

Включите JavaScript, чтобы использовать наши инструменты сравнения.

Поле битвы 1

Следующим в нашем алфавитном туре по современным видеоиграм идет Battlefield 1 2016 года. В игре отсутствует встроенная функция тестирования, поэтому мы используем сцену вождения танка, в которой присутствует небольшое количество взрывов с близкого расстояния, которые на мгновение снижают производительность танка. Это означает, что скачки времени кадра можно смело игнорировать, но это все же дает нам хорошее представление о производительности, которую вы можете ожидать. Vega 64 едва ли опережает GTX 1080, примерно на два процента в разрешении 1440p и 4K. Несмотря на это, 61 кадр в секунду, которые GTX 1080 получает в 4K, полностью воспроизводим и соответствует производительности RTX 2070. Если вам интересны результаты Battlefield 5, ожидайте получить около двух третей частоты кадров в новом названии, то есть около 40 кадров в секунду в 4K.

Поле битвы 1: Ультра, TAA

Включите JavaScript, чтобы использовать наши инструменты сравнения.

Кризис 3

Crysis 3 2013 года — наш самый старый тест, но далеко не самый простой. Когда мы проходим бенчмарк в каждом разрешении, GTX 1080 опережает Vega 64 примерно на 13%. Тем не менее, только GTX 1080 Ti и RTX 2080 могут обеспечить результат около 60 кадров в секунду при 4K со средней частотой кадров всего 54 кадра в секунду. Для графического процессора, способного безупречно запускать Crysis в Ultra HD, вам нужно обратиться к флагманской карте Nvidia RTX 2080 Ti, которая достигает средней скорости 68 кадров в секунду.

Crysis 3: очень высокий, SMAA T2X

Включите JavaScript, чтобы использовать наши инструменты сравнения.

Фар Край 5

Использование в

Far Cry 5 быстрой математики (удвоенная скорость FP16) позволяет оборудованию AMD работать лучше, чем обычно, а Vega 64 связывает GTX 1080 при разрешении 1080p и едва опережает его при более высоких разрешениях. На территории Nvidia GTX 1080 уступает более новой RTX 2070 во всех разрешениях, а RTX 2080 берет верх над общей производительностью.

Far Cry 5: Ультра, TAA

Включите JavaScript, чтобы использовать наши инструменты сравнения.

Ghost Recon Wildlands

Теперь мы подошли к самому сложному (и самому последнему) разделу нашего набора тестов. Ghost Recon Wildlands предлагает экстремальную рабочую нагрузку в своих настройках Ultra, и вы можете видеть, что даже GTX 1080 Ti с трудом достигает 60 кадров в секунду при 1440p. GTX 1080 на 18% отстает от 1080 Ti при разрешении 1440p, но на несколько кадров опережает Vega 64. При разрешении 4K производительность GTX 1080 снижается до консольного уровня — всего 30 кадров в секунду. Мы рекомендуем отключить некоторые настройки, если вы играете в разрешении 4K, или инвестировать в монитор G-Sync, чтобы сгладить любые колебания частоты кадров.

Ghost Recon Wildlands: Ультра, TAA

Включите JavaScript, чтобы использовать наши инструменты сравнения.

Восстание расхитительницы гробниц

Героиня боевиков Лара Крофт продолжила историю своего происхождения в игре Rise of the Tomb Raider 2016 года, в меню настроек которой есть крутой встроенный тест из трех частей. Здесь мы используем путь рендеринга DX12, и игра работает немного лучше на оборудовании Nvidia: GTX 1080 опережает Vega 64 на два процента при разрешении 1440p и всего на один процент при разрешении 4K. При частоте почти 50 кадров в секунду в игру вполне можно играть в разрешении 4K, не жертвуя слишком многими настройками детализации.

Rise of the Tomb Raider: Очень высокий, SMAA

Включите JavaScript, чтобы использовать наши инструменты сравнения.

Тень расхитительницы гробниц

GTX 1080 сталкивается с более сложной задачей в 2018 году, следующей за Shadow of the Tomb Raider, с трудом обеспечивая 34 кадра в секунду при разрешении 4K. Это немного медленнее, чем у топовой видеокарты AMD, и почти на 20% отстает от GTX 1080 Ti. Новые карты RTX также впечатляют здесь в разрешении 4K: результаты на 10% и 25% выше, чем у GTX 1080.

Shadow of the Tomb Raider: Highest, TAA

Включите JavaScript, чтобы использовать наши инструменты сравнения.

Ведьмак 3

Наш предпоследний тест — игра The Witcher 3 2015 года, одна из самых популярных игр своего времени. GTX 1080 опережает Vega 64 в разрешении 1080p, но две карты примерно эквивалентны в разрешении 4K, хотя карта AMD демонстрирует некоторое замедление, которого нет у ее аналога GeForce. GTX 1080 Ti открывает убедительный 44-процентный отрыв от GTX 1080 в разрешении 4K и выигрывает группу.

Ведьмак 3: Ультра, Пост-АА, Без причесок

Включите JavaScript, чтобы использовать наши инструменты сравнения.

Wolfenstein 2: Новый Колосс

Из-за несовместимости между этой игрой и нашим программным обеспечением для захвата видео производительность Vega 64 недоступна в Wolfenstein. Тем не менее, это дает нам возможность добавить RTX 2060, которая демонстрирует интересное сравнение с GTX 1080 в этой новой игре. Все измерения здесь сделаны с отключенной технологией затенения с переменным рейтингом, и даже без нее RTX 2060 быстрее, чем GTX 1080, во всех разрешениях, кроме 4K. VRS в самых агрессивных настройках также обеспечивает 15% дополнительной производительности на RTX 2060, что чертовски впечатляет.

Wolfenstein 2 Вулкан: Убер, TSSAA 8X

Включите JavaScript, чтобы использовать наши инструменты сравнения.

Сравнение поколений

В этом специальном тесте мы сравниваем GTX 1080 со своими историческими предшественниками, вплоть до серии 700, дебютировавшей в 2013 году. Стоит отметить, что мы заменили обычные элементы управления разрешением справа от видео элементами управления поколениями, что позволяет вам сравнивать внутри или между включенными здесь картами Pascal, Maxwell и Kepler.

Assassin’s Creed Unity: 1080p, сверхвысокое, FXAA

Включите JavaScript, чтобы использовать наши инструменты сравнения.

Сравнение поколений

Закончим сравнением всей линейки Nvidia Pascal, где GTX 1080 по производительности ближе к GTX 1070 Ti, чем к GTX 1080 Ti.

Assassin’s Creed Unity: 1080p, сверхвысокое, FXAA

Включите JavaScript, чтобы использовать наши инструменты сравнения.

Читайте также: