Таблица сравнений видеокарт: Сравнение всех видеокарт NVIDIA GeForce
Содержание
Таблица-сравнение видеокарт — презентация онлайн
Похожие презентации:
3D печать и 3D принтер
Видеокарта. Виды видеокарт
Анализ компании Apple
Трансформаторы тока и напряжения
Транзисторы
Устройство стиральной машины LG. Электрика
Конструкции распределительных устройств. (Лекция 15)
Электробезопасность. Правила технической эксплуатации электроустановок
Магнитные пускатели и контакторы
Работа на радиостанциях КВ и УКВ диапазонов. Антенны военных радиостанций. (Тема 5.1)
1. Таблица-сравнение видеокарт
ФОНЮШКИН Ф
ДЛЯ ОРДЕНА
2. Зеленый лагерь
За представителей взяты самые
распространенные референсные карты или
середина модельного ряда
ибо если брать все тут будет около тысячи
слайдов
3. Riva 128
Nvidia оснащала RIVA 128 4мя мегабайтами новой на тот
момент SGRAM-памяти,
соединенной с графическим
процессором 128-битной
шиной на частоте 100 МГц. Её
пропускная способность
составляла 1,6 ГБ/с
Аналог Ati : Rage pro 8mb
Рекомендуемый процессор :
Pentium I – II
Amd K6-2 450мгц
Год 1995
Частоты
Ядро: 100 Память: 100
4. Riva TnT
Nvidia оснащала RIVA TnT 16ю мегабайтами SDRAMпамяти, соединенной с
графическим процессором
128-битной шиной на частоте
100 МГц. Её пропускная
способность составляла 1,76
ГБ/с
Аналог Ati : Rage Pro
Рекомендуемый процессор:
Pentium II-III 500мгц
Amd k6-2
Год 1997
Частоты
Ядро: 90 Память: 110
5. Riva TnT2
Nvidia оснащала RIVA
TnT2 32-я мегабайтами
SDRAM-памяти,
соединенной с
графическим
процессором 128-битной
шиной на частоте 150 МГц.
Её пропускная
способность составляла
2.4 ГБ/с
Аналог Ati : Rage 128 Pro
Рекомендуемый
процессор:
Pentium III 600мгц
Amd k6-3
Год 1998
Частоты
Ядро: 125 Память: 150
6. Geforce 256
Nvidia оснащала эти
карты 32-я мегабайтами
DDR-памяти,
соединенной с
графическим
процессором 256-битной
шиной на частоте 200
МГц. Её пропускная
способность составляла
6.4ГБ/с
Аналог Ati : Rage 128 Pro
Рекомендуемый
процессор:
Pentium III 750мгц
Amd k6-3
Год 1999
Частоты
Ядро: 200 Память: 300
7. Geforce 2 mx400
Nvidia оснащала эти карты
64-я мегабайтами DDRпамяти, соединенной с
графическим
процессором 64-битной
шиной на частоте 200 МГц.
Её пропускная
способность составляла
2.9ГБ/с
Аналог Ati : Rage 128 Pro
Рекомендуемый
процессор:
Pentium III 750мгц
Amd Athlon
Год 2000
Частоты
Ядро: 200 Память: 366
8. GeForce3
Nvidia оснащала эти карты
128-ю мегабайтами DDRпамяти, соединенной с
графическим
процессором 128-битной
шиной на частоте 200 МГц.
Её пропускная
способность составляла
7.3ГБ/с
Аналог Ati : Radeon 7500
Рекомендуемый
процессор:
Pentium III 850мгц
Amd Athlon
Год 2001
Частоты
Ядро: 290 Память: 460
9. GeForce4 MX 480
Nvidia оснащала эти карты
128-ю мегабайтами DDRпамяти, соединенной с
графическим
процессором 128-битной
шиной на частоте 200 МГц.
Её пропускная способность
составляла 8.1ГБ/с
Аналог Ati : Radeon 9500
Рекомендуемый
процессор:
Pentium IV 1700мгц
Amd AthlonXP
Год 2002
Частоты
Ядро: 275 Память: 512
10. GeForce FX 5600
Nvidia оснащала эти карты
256-ю мегабайтами DDRпамяти, соединенной с
графическим
процессором 128-битной
шиной на частоте 200 МГц.
Её пропускная
способность составляла
8.8ГБ/с
Аналог Ati : Radeon 9600
Рекомендуемый
процессор:
Pentium IV 2400мгц
Amd AthlonXP
Год 2003-2004
Частоты
Ядро: 325 Память: 550
11. Введенные понятия
GTX- Топовые модели. Начались с 7й серии и существуют до
сих пор
GTO- Топовые модели но с пониженными частотами.
Появился c 7й серии и просуществовали до девятой
GTS- Предтоповые модели. Были только в 8й 100й и 200й
сериях
GSO- Средние модели с повышенными частотами.
Существовали только в 9й серии
GT- Средние и средне-начальные модели. Появились с 6й
серии существуют до сих пор
GS- Начальные модели. Существовали с 7 по 8 серии
12. GeForce 6600
Nvidia оснащала эти
карты 256-ю
мегабайтами GDDRпамяти, соединенной с
графическим
процессором 128битной шиной на частоте
200 МГц. Её пропускная
способность составляла
8.8ГБ/с
Аналог Ati : Radeon X550
Рекомендуемый
процессор:
Pentium IV 2800мгц
Amd Athlon64
Год 2005
Частоты
Ядро: 300 Память: 550
13. GeForce 7600
Вендоры оснащала эти
карты 256-ю
мегабайтами GDDR3памяти, соединенной с
графическим
процессором 128-битной
шиной на частоте 200
МГц. Её пропускная
способность составляла
22.4ГБ/с
Аналог Ati : Radeon X1550
Рекомендуемый
процессор:
Core 2 Duo 2000мгц
Amd Athlon64x2
Год 2005-2007
Частоты
Ядро: 560 Память: 1400
14. GeForce 8600
Вендоры оснащала эти
карты 256-ю мегабайтами
GDDR3-памяти или 512ю
GDDR2 , соединенной с
графическим процессором
128-битной шиной на частоте
200 МГц. Её пропускная
способность составляла
22.4ГБ/с
Аналог Ati : Radeon X1800xt
Рекомендуемый процессор:
Core 2 Duo 2600мгц
Amd Athlon64x2
Год 2006-2007
Частоты
Ядро: 540 Память: 1400/700
15. GeForce 9600
Вендоры оснащала эти карты
512-ю мегабайтами GDDR3,
соединенной с графическим
процессором 256-битной
шиной на частоте 200 МГц. Её
пропускная способность
составляла 57.6ГБ/с
Аналог Ati : Radeon HD2900
Рекомендуемый процессор:
Core 2 Duo 2800мгц
Amd Athlon64x2
Год 2008
Частоты
Ядро: 650 Память: 900
16. GeForce GTS 150 AKA. Редкая oem железка
Вендоры оснащала эти карты
512-ю мегабайтами GDDR3,
соединенной с графическим
процессором 256-битной шиной
на частоте 200 МГц. Её
пропускная способность
составляла 57.6ГБ/с
Аналог Ati : Radeon HD2900
Рекомендуемый процессор:
Core 2 Duo 2800мгц
Amd Athlon64x2
Год 2009
Это переименованная GTX9800+
которая станет GTS250
Частоты
Ядро: 650 Память: 900
17.
GTX 260
Вендоры оснащала эти карты
1024-ю мегабайтами GDDR3,
соединенной с графическим
процессором 448-битной
шиной на частоте 200 МГц. Её
пропускная способность
составляла 111.9ГБ/с
Аналог Ati : Radeon HD3870
Рекомендуемый процессор:
Core 2 Duo 2800мгц
Amd Athlon64x2
Год 2009
Частоты
Ядро: 576 Память: 1000
18. GT 340
Они были..я их видел даже
Инфы по ним нет
Чисто OEM железки
19. GTX 460
Вендоры оснащала эти
карты 1024-ю
мегабайтами GDDR5,
соединенной с
графическим
процессором 256-битной
шиной на частоте 200
МГц. Её пропускная
способность составляла
115.2ГБ/с
Аналог Ati : Radeon
HD6870
Рекомендуемый
процессор:
Core 2 quad 2800мгц
Amd Phenom x3
Год 2010
Частоты
Ядро: 675 Память: 3600
20. GTX 560
Вендоры оснащала эти
карты 1024-ю мегабайтами
GDDR5, соединенной с
графическим
процессором 256-битной
шиной на частоте 200 МГц.
Её пропускная способность
составляла 128.2ГБ/с
Аналог Ati : Radeon HD7870
Рекомендуемый
процессор:
Core 2 quad 2800мгц
Amd Phenom x4
Год 2011
Частоты
Ядро: 810 Память: 4008
21. GTX 660
Вендоры оснащала эти карты
2048-ю мегабайтами GDDR5,
соединенной с графическим
процессором 192-битной шиной
на частоте 200 МГц. Её
пропускная способность
составляла 144.2ГБ/с
Аналог Ati : Radeon R9 270
Рекомендуемый процессор:
Core 2 quad 2800мгц
Amd Phenom x4
Год 2012
Частоты
Ядро: 1033 Память:6008
22. GTX 760
Вендоры оснащала эти
карты 2048-ю мегабайтами
GDDR5, соединенной с
графическим процессором
256-битной шиной на частоте
200 МГц. Её пропускная
способность составляла
154.2ГБ/с
Аналог Ati : Radeon R7 370
Рекомендуемый процессор:
Core i5 2800мгц
Amd fx6300
Год 2013
Частоты
Ядро: 1033 Память:6008
23. GTX 860 ноутбучная
Оснащена 2048-ю
мегабайтами GDDR5,
соединенной с графическим
процессором 256-битной
шиной на частоте 200 МГц. Её
пропускная способность
составляла 154.2ГБ/с
Аналог Ati : Рекомендуемый
процессор:
Core i5 2800мгц
Год 2014
Частоты
Ядро: 1029 Память:5008
24. GTX 960
Вендоры оснащала эти
карты 2048-ю или 4096ю
мегабайтами GDDR5,
соединенной с
графическим
процессором 128-битной
шиной на частоте 200
МГц. Её пропускная
способность составляла
112.2ГБ/с
Аналог Ati : Radeon R9 380
Рекомендуемый
процессор:
Core i5 2800мгц
Amd fx6300
Год 2014
Частоты
Ядро: 1126 Память:7008
25. GTX 1060
Вендоры оснащала эти карты
3048-ю или 6192мя
мегабайтами GDDR5,
соединенной с графическим
процессором 192-битной
шиной на частоте 200 МГц. Её
пропускная способность
составляла 192.2ГБ/с
Аналог Ati : Radeon RX570
Рекомендуемый процессор:
Core i5 3200мгц
Amd fx8600
Год 2016
Частоты
Ядро: 1708 Память: 8000
English
Русский
Правила
Таблица сравнения видеокарт | MiningClub.
info
WoolyPooly
Бывалый
#1
Приветствую всех майнеров, которых заинтересовала данная статья!
В ней я хочу поделиться таблицей, которую мы разработали для облегчения сравнения видеокарт.
Покопавшись на просторах гугла мы не нашли ничего подобного, поэтому пришли к выводу, что нужно незамедлительно ее делать.
Ниже, на скриншоте, вы можете увидеть пример того, что получилось.
На данный момент в таблицу уже добавлены почти все линейки видеокарт от Nvidia и AMD. С появлением новых карты мы будем сразу добавлять их в таблицу.
На скриншоте выше вы можете видеть какие параметры мы выбрали для сравнения.
Также в таблице вы увидите сравнение карт на разных алгоритмах, но только на тех, которые есть у нас на пуле на данный момент.
По нашему мнению этого более чем достаточно. Надеюсь, что работа была проделана не зря и она послужит всем в помощь!
Ссылка на таблицу
Прошу не судить строго! Всегда будем рады толковому совету.
Всем хорошего майнинга!
P.S Нажав на карту, вы можете перейти на ее страницу и увидеть разгон для каждой из монет.
Честный майнинг пул WoolyPooly | Fee 0.9%| Комиссию при выводе оплачивает пул |
Майните — ETH, ETC, ERGO, RVN, CFX, Cortex, ALPH и др.| Сервера по всему миру |
buny
Друг форума
#2
502 по ссылке. Короче — не работает ничего.
Лучше недополученная прибыль, чем зафиксированные убытки. (с)
Окончательную правду русскому человеку всегда сообщают матом. (с)
WoolyPooly
Бывалый
#3
buny сказал(а):
502 по ссылке. Короче — не работает ничего.
Нажмите, чтобы раскрыть…
Странно, у меня без проблем переходит.
Честный майнинг пул WoolyPooly | Fee 0. 9%| Комиссию при выводе оплачивает пул |
Майните — ETH, ETC, ERGO, RVN, CFX, Cortex, ALPH и др.| Сервера по всему миру |
ngushchin2
Друг форума
#4
тоже не заходит
buny
Друг форума
#5
WoolyPooly сказал(а):
Странно, у меня без проблем переходит.
Нажмите, чтобы раскрыть…
не все сейчас в калифорнии.
IP | 188.114.96.7 |
Хост: | 188.114.96.7 |
Город: | Не определен |
Страна: | United States |
IP диапазон: | 188.114.96.0 — 188.114.99.255 |
CIDR: | 188.114.96.0/22 |
Лучше недополученная прибыль, чем зафиксированные убытки. (с)
Окончательную правду русскому человеку всегда сообщают матом. (с)
WoolyPooly
Бывалый
#6
ngushchin2 сказал(а):
тоже не заходит
Нажмите, чтобы раскрыть. ..
Попробуйте еще раз, все работает!
Честный майнинг пул WoolyPooly | Fee 0.9%| Комиссию при выводе оплачивает пул |
Майните — ETH, ETC, ERGO, RVN, CFX, Cortex, ALPH и др.| Сервера по всему миру |
Элтон Джон
Свой человек
#7
Абсолютно бесполезная штука
2MINERS.COM — unofficial head of social media marketing
( ︶︿︶)_╭∩╮
Lucius_centurio
Бывалый
#8
табличка говно, вот хорошая https://hashrate. no/
1650 SUPER
WoolyPooly
Бывалый
#9
Lucius_centurio сказал(а):
табличка говно, вот хорошая https://hashrate.no/
Нажмите, чтобы раскрыть…
Сравнил, красное с холодным)
Это таблица не о разгоне, а о сравнение видеокарт, чего точно не найти на hashrate.no
Честный майнинг пул WoolyPooly | Fee 0. 9%| Комиссию при выводе оплачивает пул |
Майните — ETH, ETC, ERGO, RVN, CFX, Cortex, ALPH и др.| Сервера по всему миру |
Lucius_centurio
Бывалый
#10
WoolyPooly сказал(а):
Сравнил, красное с холодным)
Это таблица не о разгоне, а о сравнение видеокарт, чего точно не найти на hashrate.noНажмите, чтобы раскрыть…
как шмайнер, ответственно заявляю: табличка вули пули мне не понадобиться, а вот хешрейт но добавил в закладки — реальные хеши, потребление, разгон, лучшая доходность, то что нам глупым и лениым шмайнерам нужно
1650 SUPER
buny
Друг форума
#11
Lucius_centurio сказал(а):
как шмайнер, ответственно заявляю: табличка вули пули мне не понадобиться, а вот хешрейт но добавил в закладки — реальные хеши, потребление, разгон, лучшая доходность, то что нам глупым и лениым шмайнерам нужно
Нажмите, чтобы раскрыть. ..
чё, реально имеешь такой выбор?
Лучше недополученная прибыль, чем зафиксированные убытки. (с)
Окончательную правду русскому человеку всегда сообщают матом. (с)
Danunafik
Бывалый
#12
Элтон Джон сказал(а):
Абсолютно бесполезная штука
Нажмите, чтобы раскрыть…
Lucius_centurio сказал(а):
табличка говно, вот хорошая https://hashrate. no/
Нажмите, чтобы раскрыть…
Lucius_centurio сказал(а):
как шмайнер, ответственно заявляю: табличка вули пули мне не понадобиться
Нажмите, чтобы раскрыть…
Русскоговорящие всегда готовы приободрить и поддержать товарища в его начинаниях. Поэтому у нас и нет ни одной фирмы нормальной.
Дифиченты заполонили планету.
Lucius_centurio
Бывалый
#13
buny сказал(а):
чё, реально имеешь такой выбор?
Нажмите, чтобы раскрыть. ..
свободы воли не существует, сказку эту рептилоиды придумали, что бы сделать из православных людей геев!!!
1650 SUPER
ngushchin2
Друг форума
#14
Danunafik сказал(а):
Русскоговорящие всегда готовы приободрить и поддержать товарища в его начинаниях. Поэтому у нас и нет ни одной фирмы нормальной.
Нажмите, чтобы раскрыть…
скажи паляныця
Lucius_centurio
Бывалый
#15
Danunafik сказал(а):
Русскоговорящие всегда готовы приободрить и поддержать товарища в его начинаниях. Поэтому у нас и нет ни одной фирмы нормальной.
Нажмите, чтобы раскрыть…
в том и смысл, показал норм продукт удобный, возьмите за основу и сделайте еще удобнее, велосипед не нужно изобретать, а «фирмы» есть
1650 SUPER
Danunafik
Бывалый
#16
ngushchin2 сказал(а):
паляныця
Нажмите, чтобы раскрыть…
Пильменница
Дифиченты заполонили планету.
WoolyPooly
Бывалый
#17
Элтон Джон сказал(а):
Абсолютно бесполезная штука
Нажмите, чтобы раскрыть…
К счастью, полезнее чем ваши пустые слова в этой теме.
Честный майнинг пул WoolyPooly | Fee 0.9%| Комиссию при выводе оплачивает пул |
Майните — ETH, ETC, ERGO, RVN, CFX, Cortex, ALPH и др.| Сервера по всему миру |
Mordor
Бывалый
#18
Danunafik сказал(а):
Русскоговорящие всегда готовы приободрить и поддержать товарища в его начинаниях. Поэтому у нас и нет ни одной фирмы нормальной.
Нажмите, чтобы раскрыть…
а как же https://e4pool.com/ ?
Aimbot
Бывалый
#19
WoolyPooly сказал(а):
Покопавшись на просторах гугла мы не нашли ничего подобного, поэтому пришли к выводу, что нужно незамедлительно ее делать.
Нажмите, чтобы раскрыть…
Да ладно?
Еще более информативно + разгон + дуал монеты. И без рекламы пула.
Сборка ригов / настройка / консультации / любая помощь. Решу любой ваш вопрос. Пишите в телеграмм: @qwerty_mi_01
alexei201201
Знающий
#20
самая лучшая карта 3070 не лхр, кто что ни говорил бы
Таблица производительности GPU ASUS
ang=»ru»>
Таблица производительности графического процессора ASUS
Выбор видеокарты
1080P
2К
4К
AMD/RXVEGA64
AMD / RXVEGA56
AMD/RX580
AMD/RX570
AMD/RX560
AMD/RX550
Драм / R7240
NVIDIA/GTX1080TI
NVIDIA/GTX1080
NVIDIA/GTX1070TI
NVIDIA/GTX1070
NVIDIA/GTX1060
NVIDIA/GTX1050TI
NVIDIA/GTX1050
NVIDIA/GTX1030
Перезагрузить
3D MARK Fire Strike
Rise of the Tomb Raider
Fortnite
Температура графического процессора
234567
ROG-STRIX-RXVEGA64-O8G-GAMING
1256 МГц / 7000 МГц / 2048 SP / 256 бит / GDDR5 4 ГБ
16890
ROG-STRIX-RXVEGA64-O8G-GAMING
1256 МГц / 7000 МГц / 2048 SP / 256 бит / GDDR5 4 ГБ
2345,67
ROG-STRIX-RXVEGA64-O8G-GAMING
1256 МГц / 7000 МГц / 2048 SP / 256 бит / GDDR5 4 ГБ
124,25
ROG-STRIX-RXVEGA64-O8G-GAMING
1256 МГц / 7000 МГц / 2048 SP / 256 бит / GDDR5 4 ГБ
101
ROG-STRIX-RXVEGA64-O8G-GAMING
1256 МГц / 7000 МГц / 2048 SP / 256 бит / GDDR5 4 ГБ
98
ROG-STRIX-RXVEGA64-O8G-GAMING
1256 МГц / 7000 МГц / 2048 SP / 256 бит / GDDR5 4 ГБ
81°С
ROG-STRIX-RXVEGA64-O8G-GAMING
1256 МГц / 7000 МГц / 2048 SP / 256 бит / GDDR5 4 ГБ
90°С
ROG-Strix-RXVEGA64-O8G-GAMING
1256 МГц / 7000 МГц / 2048 SP / 256 BIT / GDDR5 4GB
234567
ROG-Strix-RXVEGA64-O8G-GAMIN GDDR5 4GB
16890
ROG-Strix-RXVEGA64-O8G-GAMING
1256 МГц / 7000 МГц / 2048 SP / 256 BIT / GDDR5 4GB
2345. 67
ROG-strix-rXVEGA64-o 2048 SP / 256 бит / GDDR5 4 ГБ
124,25
ROG-Strix-RXVEGA64-O8G-GAMING
1256 МГц / 7000 МГц / 2048 SP / 256 BIT / GDDR5 4GB
101
ROG-Strix-RXVEGA64-O8G-GAMIN GDDR5 4GB
98
ROG-Strix-RXVEGA64-O8G-GAMING
1256 МГц / 7000 МГц / 2048 SP / 256 BIT / GDDR5 4GB
81 ° C
ROG-Rog-RXVEGA64-GAMININ 7000 МГц / 2048 SP / 256 бит / GDDR5 4 ГБ
90°C
ROG-STRIX-RXVEGA64-O8G-GAMING
1256 МГц / 7000 МГц / 2048 SP / 256 бит / GDDR5 4 ГБ
Лучшие видеокарты для машинного обучения
Аппаратное обеспечение
Ускорьте обучение и выполняйте итерации быстрее предпочтительнее использовать видеокарту для обработки, а не центральный процессор. Даже очень простой графический процессор превзойдет центральный процессор, когда дело доходит до нейронных сетей.
Но какой GPU купить? Выбор огромен, и он может очень быстро запутаться и стать дорогим. Поэтому я постараюсь направить вас по соответствующим факторам, которые следует учитывать, чтобы вы могли сделать осознанный выбор, исходя из вашего бюджета и конкретных требований к моделированию.
ЦП (центральный процессор) — это рабочая лошадка вашего компьютера, и, что немаловажно, он очень гибкий. Он может работать с инструкциями из широкого спектра программ и оборудования и может обрабатывать их очень быстро. Чтобы преуспеть в этой многозадачной среде, ЦП имеет небольшое количество гибких и быстрых процессоров (также называемых ядрами).
GPU (графический процессор) немного более специализирован и не так гибок, когда дело доходит до многозадачности. Он предназначен для выполнения множества сложных математических вычислений параллельно , что увеличивает пропускную способность. Это достигается за счет большего количества простых ядер, иногда тысяч, так что многие вычисления могут выполняться одновременно.
Изображение Ahmed Gad с сайта Pixabay
Это требование параллельного выполнения нескольких вычислений идеально подходит для:
- рендеринг графики — движущиеся графические объекты нуждаются в постоянном расчете траекторий, а это требует большого количества постоянно повторяющихся параллельных математических вычислений.
- машинное и глубокое обучение — большие объемы матричных/тензорных вычислений, которые с помощью графического процессора могут выполняться параллельно.
- математические вычисления любого типа, которые можно разделить для параллельного выполнения.
Я думаю, что лучший обзор, который я видел, находится в собственном блоге Nvidia:
Таблица составлена автором, вдохновлено nvidia.com
Блок тензорной обработки (TPU)
С бумом ИИ и машинного/глубокого обучения появилось еще больше специализированных процессорных ядер, называемых тензорными ядрами. Они быстрее и эффективнее при выполнении тензорных/матричных вычислений. Именно то, что вам нужно для математики, связанной с машинным/глубоким обучением.
Несмотря на то, что существуют выделенные TPU, некоторые из последних графических процессоров также включают несколько ядер Tensor, как вы увидите позже в этой статье.
Это будет довольно короткий раздел, так как ответ на этот вопрос определенно: Nvidia
Вы можете использовать графические процессоры AMD для машинного/глубокого обучения, но на момент написания графические процессоры Nvidia имеют гораздо более высокую совместимость, и обычно лучше интегрированы в такие инструменты, как TensorFlow и PyTorch.
По своему опыту я знаю, что попытка использовать графический процессор AMD с TensorFlow требует использования дополнительных инструментов (ROCm), которые, как правило, немного неудобны и иногда оставляют вас с не совсем актуальной версией TensorFlow/PyTorch, только так вы можете заставить карту работать.
Эта ситуация может улучшиться в будущем, но если вы хотите получить беспроблемный опыт, лучше пока использовать Nvidia.
Выбор графического процессора, соответствующего вашему бюджету, а также способного выполнять нужные вам задачи машинного обучения, в основном сводится к балансу четырех основных факторов:
- Сколько оперативной памяти имеет графический процессор?
- Сколько ядер CUDA и/или Tensor имеет GPU?
- Чип какой архитектуры используется в карте?
- Каковы ваши требования к потребляемой мощности (если таковые имеются)?
В последующих подразделах будет рассмотрена каждая из этих областей, и мы надеемся, что вы лучше поймете, что для вас важно.
ОЗУ графического процессора
Ответ на этот вопрос: чем больше, тем лучше! Очень полезно, я знаю…
Все зависит от того, что вы моделируете, и от того, насколько велики эти модели. Например, если вы имеете дело с изображениями, видео или аудио, то по определению вы будете иметь дело с довольно большим объемом данных, и оперативная память графического процессора будет чрезвычайно важным фактором.
Всегда есть способы обойти нехватку памяти (например, уменьшить размер пакета). Тем не менее, вы хотите ограничить количество времени, которое вы должны тратить на возню с кодом только для того, чтобы обойти требования к памяти, поэтому важен хороший баланс для ваших требований.
. Изображение OpenClipart-Vectors с Pixabay сложные модели или большое количество изображений, видео или аудио. Отлично, если вы только начинаете и хотите поэкспериментировать, не нарушая банк. Улучшения по сравнению с процессором по-прежнему будут день и ночь.
8 ГБ — я бы сказал, что это золотая середина. Вы можете выполнять большинство задач, не ограничивая объем оперативной памяти, но у вас возникнут проблемы с более сложными моделями с изображениями, видео или аудио.
12 ГБ — я бы назвал это оптимальным, но не смешно. Вы можете работать с большинством более крупных моделей, даже с теми, которые имеют дело с изображениями, видео или аудио.
12 ГБ+ — Чем больше, тем лучше, вы сможете обрабатывать большие наборы данных и более крупные пакеты. Однако за пределами 12 ГБ цены действительно начинают расти.
По моему опыту, я бы сказал, что в среднем лучше выбрать более «медленную» карту с большим объемом оперативной памяти, если стоимость такая же. Помните, что преимуществом графического процессора является высокая пропускная способность, которая сильно зависит от доступной оперативной памяти для передачи данных через графический процессор.
Ядра CUDA и тензорные ядра
На самом деле это довольно просто. Чем больше ядер CUDA ( C compute U nified D evice A rchitecture)/тензорных ядер, тем лучше.
Другие элементы, такие как ОЗУ и архитектура чипа (см. следующий раздел), вероятно, следует рассмотреть в первую очередь, а затем рассмотреть карты с наибольшим количеством ядер CUDA/тензора из вашего суженного списка.
Для машинного/глубокого обучения тензорные ядра лучше (быстрее и эффективнее), чем ядра CUDA. Это связано с тем, что они разработаны именно для вычислений, которые требуются в области машинного/глубокого обучения.
Реальность такова, что это не имеет большого значения, ядра CUDA достаточно быстры. Если вы можете получить карту, которая также включает в себя тензорные ядра, это хороший плюс, просто не зацикливайтесь на этом.
Двигаясь вперед, вы увидите много упоминаний «CUDA», и это может запутать, поэтому подведем итог:
- Ядра CUDA — это физические процессоры на видеокартах, обычно их тысячи.
- CUDA 11 — номер может измениться, но это относится к программному обеспечению/драйверам, которые установлены для работы видеокарты. Новые выпуски выпускаются регулярно, и его можно установить, как и любое другое программное обеспечение.
- Генерация CUDA (или вычислительные возможности) — это описывает возможности видеокарты с точки зрения ее функций поколения. Это зафиксировано аппаратно, и поэтому его можно изменить только путем обновления до новой карты. Отличается номерами и кодовым названием. Примеры: 3.x [Кеплер], 5.x [Максвелл], 6.x [Паскаль], 7.x [Тьюринг] и 8.x [Ампер].
Архитектура микросхемы
На самом деле это важнее, чем вы думаете. Как я упоминал ранее, на данный момент мы фактически отказываемся от AMD, поэтому с точки зрения поколений архитектуры чипов у нас есть только Nvidia.
Photo by Manuel on Unsplash
Главное, на что следует обратить внимание, — это «вычислительные возможности» чипсета, которые иногда называют «поколением CUDA». Это фиксировано для каждой карты, поэтому, купив карту, вы застряли с любыми вычислительными возможностями карты.
Важно знать вычислительные возможности карты по двум основным причинам:
- значительные улучшения функций
- устаревание
значительное улучшение функций
Начнем со значительного улучшения функций. Обучение смешанной точности :
Существует множество преимуществ использования числовых форматов с более низкой точностью, чем 32-битные форматы с плавающей запятой. Во-первых, им требуется меньше памяти, что позволяет обучать и развертывать более крупные нейронные сети. Во-вторых, они требуют меньшей пропускной способности памяти, что ускоряет операции передачи данных. В-третьих, математические операции выполняются намного быстрее при пониженной точности, особенно на графических процессорах с поддержкой Tensor Core для такой точности. Тренировка со смешанной точностью дает все эти преимущества, гарантируя, что нет Точность для конкретной задачи теряется по сравнению с полной точной тренировкой. Это достигается путем определения шагов, требующих полной точности, и использования 32-битной плавающей запятой только для этих шагов, а 16-битной с плавающей запятой во всех остальных случаях.
-Nvidia Learning Performance Documentation
Обучение смешанной точности возможно только при наличии графического процессора с вычислительными возможностями 7.x (Turing) или выше. В основном это серия RTX 20 или новее, или серия RTX, «T» или «A» для настольных компьютеров/серверов.
Основная причина, по которой обучение смешанной точности является таким преимуществом при рассмотрении вопроса о новой видеокарте, заключается в том, что оно снижает использование ОЗУ, поэтому, имея немного более новую карту, ваши требования к ОЗУ снижаются.
Устаревание
Затем мы переходим к другому концу шкалы.
Если у вас особенно высокие требования к ОЗУ, но не хватает денег на карту высокого класса, возможно, вы выберете более старую модель графического процессора на вторичном рынке.
Однако есть и существенный недостаток… у карты закончился срок службы.
Ярким примером этого является Tesla K80, который имеет 4992 ядра CUDA и 24 ГБ оперативной памяти . Первоначально он продавался по цене около 7000 долларов США еще в 2014 году. Я только что посмотрел на e-bay в Великобритании, и он стоит от 130 фунтов стерлингов (150 долларов США / евро) до 170 фунтов стерлингов (195 долларов США / евро)! Это много оперативной памяти за такую небольшую цену.
Однако есть и довольно большой недостаток. K80 имеет вычислительные возможности 3.7 (Kepler), которые устарели, начиная с CUDA 11 и выше (текущая версия CUDA — 11). Это означает, что срок службы карты истек, и она не будет работать с будущими выпусками драйверов CUDA. На самом деле очень жаль, но кое-что нужно иметь в виду, так как это очень заманчиво.
Nvidia в основном делит свои карты на две части. Существуют потребительские видеокарты, а затем карты, предназначенные для настольных компьютеров/серверов (то есть профессиональные карты).
Очевидно, что между двумя разделами есть различия, но главное помнить, что потребительские видеокарты, как правило, будут дешевле при тех же характеристиках (ОЗУ, ядра CUDA, архитектура). Однако профессиональные карты, как правило, имеют лучшее качество сборки и меньшее энергопотребление.
Фото автора Элиас Гамес на Pexels
Глядя на более дорогие (и очень дорогие) профессиональные карты, вы также заметите, что у них много оперативной памяти (например, у RTX A6000 48 ГБ, а у A100 — 80 ГБ!). Это связано с тем, что они, как правило, нацелены непосредственно на профессиональные рынки 3D-моделирования, рендеринга и машинного/глубокого обучения, которые требуют больших объемов оперативной памяти. Опять же, если у вас есть такие требования, вам, скорее всего, не понадобится совет о том, что купить!
Подводя итог, можно сказать, что вам лучше всего ориентироваться на рынок потребительской графики, так как вы получите более выгодную сделку.
Наконец, я решил дать несколько рекомендаций, исходя из бюджета и требований. Я разделил это на три части:
- Низкий бюджет
- Средний бюджет
- Высокобюджетный
Пожалуйста, имейте в виду, что высокий бюджет не учитывает ничего, кроме высококлассных потребительских видеокарт. Если у вас действительно очень большой бюджет, вам следует обратить внимание на профессиональные серии карт, такие как карты Nvidia серии A, стоимость которых может достигать многих тысяч.
Я включил одну карту, которая доступна только на вторичном рынке, в разделе с низким бюджетом. Это в основном потому, что я думаю, что в разделе с низким бюджетом стоит рассмотреть подержанные карты.
Photo by Nana Dua on Unsplash
Я также включил в набор профессиональные карты серии для настольных ПК (T600, A2000 и A4000). Вы заметите, что некоторые характеристики немного хуже, чем у сопоставимых потребительских видеокарт, но энергопотребление значительно лучше, что может беспокоить некоторых людей.
Низкий бюджет (менее 220 фунтов стерлингов — 250 евро/долларов США)
Средний бюджет (менее 440 фунтов стерлингов — 500 евро/долларов США)
Высокий бюджет (менее 1050 фунтов стерлингов — 1200 евро/долларов США)
Если у вас есть Если вы решили, что затраты на покупку видеокарты не для вас, вы всегда можете воспользоваться преимуществами Google Colab, который дает вам бесплатный доступ к графическому процессору.
Просто имейте в виду, что для этого есть ограничения по времени, если вы используете графический процессор слишком долго, они отключат вас и вернут к центральному процессору. Если GPU неактивен слишком долго, возможно, пока вы пишете код, он также вернет GPU. Графический процессор также назначается автоматически, поэтому вы не можете выбрать именно тот графический процессор, который вам нужен.
На момент написания статьи следующие графические процессоры доступны через Colab:
Примечание: Ранее в статье я упоминал, что K80 имеет 24 ГБ ОЗУ и 4992 ядра CUDA, и это так. Тем не менее, K80 — необычный зверь, поскольку он представляет собой две карты K40, соединенные вместе. Это означает, что когда вы используете K80 в Colab, вам фактически предоставляется доступ к половине карты, то есть только 12 ГБ и 2496 ядер CUDA.
Выбор огромен, и это может привести к путанице. Надеемся, что после прочтения этой статьи вы получили гораздо лучшее представление о том, что будет соответствовать вашим конкретным требованиям.