КАТАЛОГ ТОВАРОВ

Срок доставки товара в течении 1-3 дней !!!

 

ПОЛЬЗОВАТЕЛЬ
КОРЗИНА

Процессоры Intel Pentium 4 660 и Pentium 4 eXtreme Edition 3.73 GHz с 2 МБ кэша второго уровня:. 4 процессора


самый дешёвый четырёхъядерник / Процессоры и память

С появлением микроархитектуры Zen стратегия AMD на процессорном рынке стала базироваться на очень простом принципе: компания старается обеспечивать лучшие характеристики (в первую очередь по числу ядер и поддерживаемых потоков) по более выгодной цене. Семейства Ryzen 7, Ryzen 5 и Ryzen 3 при таком подходе оказались более дешёвыми альтернативами для Core i7, i5 и i3, и именно это во многом обеспечивает их популярность у покупателей. Но несмотря на то, что цена – это один из самых важных аргументов в продвижении процессоров AMD, совсем дешёвых Socket AM4-процессоров в ассортименте у этого производителя до недавних пор не существовало. Для тех покупателей, которые не располагали как минимум 100-долларовым бюджетом,  выделенным на покупку CPU, AMD могла лишь предложить старые процессоры для Socket FM2+ семейств Kaveri и Godavari либо ещё более старые процессоры AMD FX класса Piledriver. Но привлекательность таких предложений в современных условиях вызывает обоснованные сомнения, и это стало заметной проблемой.

Данная проблема дополнительно усугубилась тем, что компания Intel с внедрением дизайна Kaby Lake начала выпускать очень привлекательные процессоры начального уровня – двухъядерные Pentium с поддержкой технологии Hyper-Threading. Такие недорогие четырёхпоточные CPU быстро завоевали признание и стали очень популярным вариантом для бюджетных конфигураций.

Тем не менее оставлять Pentium c Hyper-Threading совсем без конкуренции в начальном рыночном сегменте AMD всё же не стала. Спустя примерно полгода после их появления в продаже «красный чипмейкер» принял решение создать свою альтернативу «гиперпням» и пустить для этого в дело имевшиеся в его распоряжении четырёхъядерные чипы Bristol Ridge. Такие процессоры поставлялись AMD по OEM-каналам примерно с середины прошлого года, но летом было объявлено, что теперь для исправления ситуации в нижнем ценовом сегменте Bristol Ridge станут доступны и для розничных покупателей.

Вообще, семейство Bristol Ridge в первую очередь включает в себя гибридные процессоры A-серии с интегрированным графическим ядром Radeon (поколения Volcanic Islands). Однако для конкуренции с Pentium были спроектированы специальные модели с отключённой графикой – такие процессоры AMD отнесла к отдельному модельному ряду Athlon X4. В результате покупатели бюджетных систем с дискретными видеокартами получили выбор между двухъядерными Kaby Lake с Hyper-Threading и четырёхъядерными процессорами Bristol Ridge, которые базируются на микроархитектуре Excavator. Какой вариант лучше – мы и решили выяснить в нашем очередном материале.

Для проведения тестирования нам пришлось взять модель Athlon X4 950. Несмотря на то, что в серии Bristol Ridge компания AMD запланировала три модификации процессоров без интегрированной графики, в продаже реально доступна только эта, средняя модель. Тем не менее благодаря наличию даже одного такого процессора экосистема Socket AM4 приобрела необходимую полноту. Сегодня для этой платформы можно приобрести процессор с ценой от $51 до $499, и доступный Athlon X4 950 может стать отличным вариантом начального уровня, который со временем можно будет заметить одним из существующих Ryzen серии Summit Ridge или даже перспективным Ryzen серии Pinnacle Ridge.

⇡#Athlon X4 для Socket AM4: что нового

В теории всё выглядит достаточно неплохо. Новая версия Athlon X4 представляет собой производную от наиболее современных APU компании AMD, относящихся к поколению Bristol Ridge. Такие APU пришли на рынок мобильных решений ещё в 2016 году, а в этом году семейство расширилось за счёт чипов для настольных систем. Конструктивно Bristol Ridge можно охарактеризовать как перенос Carrizo в современную экосистему. В процессе этого переноса в APU сохранились вычислительные ядра Excavator и графическое ядро класса Volcanic Islands (дискретный аналог архитектуры R9 Fury с меньшим количеством потоковых процессоров), но добавился более новый контроллер памяти, поддерживающий DDR4 SDRAM. Кроме того, архитектурно Bristol Ridge больше напоминают системы-на-чипе (SoC), что позволило вписать их в экосистему Socket AM4.

Интересующие нас представители серии Athlon X4, как и раньше, интегрированной графики лишены. Графический процессор, естественно, присутствует на полупроводниковом кристалле, но он аппаратно заблокирован, что позволяет AMD задействовать при производстве Athlon X4 кремниевую отбраковку, которая не смогла попасть в полноценные гибридные процессоры A-серии. В результате Athlon X4 представляют собой недорогие четырёхъядерники для платформы Socket AM4, которые кардинально отличаются от схожих по количеству ядер чипов Ryzen 3 своей базовой микроархитектурой. Процессорные ядра в Bristol Ridge были спроектированы в эпоху, предшествовавшую появлению архитектуры Zen, а значит, Athlon X4 для Socket AM4, как и их Socket FM2+-собратья, относятся к прямым потомкам Bulldozer.

Если конкретнее, то лежащие в основе актуального поколения APU вычислительные ядра Excavator представляют собой эволюционное развитие ядер Steamroller, которые, в свою очередь, появились в результате оптимизации Piledriver. Как говорит сама AMD, по показателю IPC (по числу выполняемых за такт инструкций) Excavator превосходит предшествующее ядро Steamroller примерно на 5-15 процентов. Прогресс достигается за счёт увеличения объёма кеш-памяти данных первого уровня до 32 Кбайт на ядро, а также благодаря полуторакратному расширению буфера адресов ветвлений, что улучшает результативность работы алгоритмов предсказания переходов. Кроме того, в Excavator добавлена поддержка 256-битных векторных инструкций из набора AVX2.

Однако не стоит переоценивать все такие дополнения, ведь они сделаны на откровенно устаревшем фундаменте. Ждать каких-то чудес производительности от Excavator явно не следует, и хорошей иллюстрацией слабости данной микроархитектуры может послужить тот факт, что во время представления первых процессоров серии Ryzen представители AMD говорили о 52-процентном превосходстве Zen над Excavator по показателю IPC. То есть при прочих равных четырёхъядерные Ryzen 3 способны обеспечить как минимум в полтора раза более высокую производительность, чем современные Athlon X4. А это значит, что между Athlon X4 для Socket AM4-систем и «полноценными» процессорами Ryzen существует колоссальный разрыв хотя бы с точки зрения эффективности базовой микроархитектуры. И этим дело не ограничивается. В бюджетных CPU компания AMD заложила ещё несколько дополнительных «ухудшений».

Одна из основных потерь, которую понёс современный Athlon X4, касается системы кеширования. В отличие от представителей серий FX или Ryzen, в процессорах этого семейства вообще нет кеш-памяти третьего уровня. Кроме того, в ядрах Excavator сократился и объём L2-кеша. Раньше в CPU такого класса на каждый двухъядерный модуль Bulldozer приходился кеш второго уровня объёмом по 2 Мбайт. Теперь он стал вдвое меньше, и четырёхъядерные Athlon X4 для Socket AM4 располагают лишь небольшим L2-кешем ёмкостью 2 Мбайт суммарно.

Серьёзные претензии вызывает и встроенный в Bristol Ridge двухканальный контроллер памяти. AMD реализовала в этих процессорах поддержку DDR4, но она совсем не такая, как в Ryzen. Bristol Ridge проектировался заметно раньше, и контроллер памяти в нём оказался намного хуже. В частности, максимальная частота поддерживаемой памяти ограничена режимом DDR4-2400, причём более высокие скорости недоступны и через разгон – для них банально не предусмотрены делители. Не впечатляет и эффективность этого контроллера. Bristol Ridge ощутимо проигрывает Ryzen в латентности подсистемы памяти и катастрофически уступает в реальной пропускной способности. Таким образом, переход на использование DDR4 производительность представителей семейства Athlon X4 только ухудшил.

Athlon X4 950 Ryzen 3 1200

Что касается встроенных в процессор элементов SoC, то и они у новых Athlon X4 тоже сильно отличаются от того, что предлагает AMD в процессорах семейства Ryzen. Самая серьёзная потеря затронула шину для взаимодействия с дискретными графическими ускорителями: для этой цели Athlon X4 предлагает лишь восемь линий PCI Express 3.0. То есть видеокарты в Socket AM4-платформах, построенных на базе таких бюджетных процессоров, будут работать «не в полную силу».

В дополнение к урезанной графической шине процессорная SoC в Bristol Ridge поддерживает две дополнительные линии PCI Express 3.0, которые могут быть конвертированы в два порта SATA, а также четыре порта USB 3.0. Расширить этот набор можно за счёт подключения внешнего южного моста, для соединения с которым в процессоре зарезервировано ещё четыре линии PCI Express 3.0. Поскольку способ взаимодействия с набором системной логики у Athlon X4 точно такой же, как и у Ryzen, процессоры поколения Bristol Ridge полностью совместимы с любыми Socket AM4-материнскими платами, включая модели, построенные на чипсетах A320, B350 и даже X370.

Скудные характеристики Athlon X4 объясняются его происхождением. Изначально дизайн Bristol Ridge был нацелен на применение в мобильных системах, поэтому многое из того, в чём нет острой необходимости в ноутбуках, пошло под нож ради оптимизации энергопотребления. И в этом есть некоторая положительная сторона: энергосберегающие технологии в Bristol Ridge сделали большой шаг вперёд, позволяя соблюдать тонкий баланс между производительностью и энергопотреблением.

Но самое важное заключается в том, что, несмотря на использование при производстве Bristol Ridge полупроводниковой технологии с разрешением 28 нм, данный процессорный дизайн получился вполне энергоэффективным. В частности, все представители десктопного семейства Bristol Ridge вписываются в 65-ваттный тепловой пакет, в том числе даже модели с графическим ядром и рабочими частотами порядка 4 ГГц. Достигается это во многом благодаря тому, что производственный партнёр AMD, компания TSMC, внедрил специальную «высокоплотную» разновидность 28-нм техпроцесса, похожую на технологию, которая применяется при выпуске GPU. В результате современные Athlon X4 смогли получить не только сравнительно невысокое тепловыделение и энергопотребление, но и конфигурируемый TDP. Номинальный тепловой пакет этих процессоров, как и у полноценных APU, установлен на уровне 65 Вт, но в случае необходимости его рамки могут быть ужесточены до 35 Вт.

⇡#Athlon X4 950 в подробностях

Когда AMD объявляла о начале розничных продаж десктопных процессоров семейства Bristol Ridge, она говорила о модельном ряде, состоящем из восьми APU A-серии и трёх процессоров Athlon X4 без встроенной графики. Новые модификации Athlon X4 должны были получить модельные номера 940, 950 и 970 и, согласно спецификации, различались бы тактовыми частотами, установленными на уровне 3,2, 3,5 и 3,8 ГГц соответственно. Однако впоследствии AMD решила отказаться от розничной реализации бюджетных Socket AM4-процессоров «широким фронтом» и ограничилась поставками лишь единичной четырёхъядерной модели Athlon X4 950.

Стоит напомнить, что в экосистеме Socket FM2+ модельный ряд процессоров Athlon X4 был весьма представителен. Он формировался из многочисленных четырёхъядерных чипов Kaveri с частотами от 3,0 до 4,0 ГГц и впоследствии получил дополнение в виде Carrizo с частотой 3,5 ГГц. При переносе Athlon X4 в более актуальную платформу Socket AM4 от былого изобилия не осталось и следа. Причём единственный Athlon X4 для Socket AM4 – это ещё и сильно «зарезанный» по характеристикам процессор. Если пытаться провести параллели между Athlon X4 950 и предшественниками для Socket FM2+, то наиболее близкой по характеристикам моделью окажется Athlon X4 845, в то время как популярные Athlon X4 860K (и более быстрые модели) родом из 2015 года новинку заметно превосходят.

Зато это позволило компании AMD установить на Athlon X4 950 очень привлекательную цену. Его официальная стоимость составляет $51, что делает данный процессор самым доступным четырёхъядерником, который вдвое дешевле младшего представителя в серии Ryzen 3. Благодаря такому предложению AMD надеется привлечь на свою сторону покупателей бюджетных систем, которые до настоящего момента ориентировались на Intel Pentium поколения Kaby Lake с поддержкой Hyper-Threading.

При этом характеристики Athlon X4 950 на фоне прочих дешёвых процессоров с возможностью исполнения четырёх потоков выглядят достаточно многообещающе:

AMD Athlon X4 950 AMD Ryzen 3 1200 Intel Pentium G4560
Кодовое имя Bristol Ridge Summit Ridge Kaby Lake
Технология производства, нм 28 14 14+
Ядра/потоки 4/4 4/4 2/4
Базовая частота, ГГц 3,5 3,1 3,5
Частота в турборежиме, ГГц 3,8 3,4 -
Технология XFR Нет +50 МГц Нет
Разгон Поддерживается Поддерживается Не поддерживается
L2-кеш 2 × 1 Мбайт 4 × 512 Кбайт 2 × 256 Кбайт
L3-кеш Нет 2   ×  4 Мбайт 3 Мбайт
Поддержка памяти DDR4-2400 DDR4-2666 DDR4-2400
Линии PCI Express 3.0 для GPU 8 16 16
TDP, Вт 65 65 54
Разъём Socket AM4 Socket AM4 LGA1151 v1
Официальная цена $51 $109 $64

Основная проблема Athlon X4 950 – устаревшая микроархитектура с низкой удельной производительностью, в остальном же никаких очевидных изъянов в приведённом списке спецификаций не видно.

В диагностической программе CPU-Z характеристики Athlon X4 950 выглядят следующим образом.

Реальные рабочие частоты Athlon X4 950 оказываются немного выше номинала. В Bristol Ridge работа технологии Turbo Core привязана исключительно к показаниям встроенных в ядро датчиков температуры и потребляемой мощности и никак не зависит от того, какое количество ядер процессора реально работает, а какое находится в состоянии простоя. Поэтому, несмотря на то, что номинальная частота Athlon X4 950 – 3,5 ГГц, в большинстве случаев он работает на 3,7-3,8 ГГц. Причём активация турборежима нередко происходит даже при исполнении ресурсоёмких многопоточных программ.

В таком состоянии расчётное тепловыделение Athlon X4 950 остаётся в 65-ваттных рамках. Однако имеется возможность снизить TDP через настройки UEFI BIOS материнской платы. Минимальный уровень потребления составляет 35 Вт, что в теории может быть востребовано в случае использования такого CPU в компактных системах. В таком экономичном режиме реальная частота Athlon X4 950 оказывается ниже номинала и в ресурсоёмких приложениях плавает в интервале от 3,0 до 3,4 ГГц.

⇡#Разгон

Хотя в названии Athlon X4 950 нет литеры K, коэффициент умножения у этого процессора не зафиксирован, что открывает путь к сравнительно простому разгону. Впрочем, не стоит забывать, что процессорный дизайн Bristol Ridge пришёл в десктопы из мобильной среды, а это значит, что основанные на нём чипы оптимизированы скорее под низкое энергопотребление, чем под высокие частоты.

Поэтому вполне закономерно, что на практике разгонный потенциал Athlon X4 950 оказался достаточно скудным, и с повышением напряжения питания до 1,5 В нам удалось добиться устойчивой работы нашего экземпляра всего лишь на частоте 4,2 ГГц.

Хотя 28-нм Athlon X4 с ядрами Excavator по оверклокерскому потенциалу немного превосходит 14-нм Ryzen, которые обычно удаётся разогнать до частот порядка 4,0 ГГц, хорошим результатом такой разгон всё равно назвать невозможно. Более ранние потомки Bulldozer были способны работать на значительно более высоких частотах. Например, предшествующие Athlon X4 950 процессоры той же серии с модельными номерами из девятой сотни, предназначенные для платформы Socket FM2+ и базирующиеся на дизайне Kaveri, без особого труда брали частоты в диапазоне от 4,5 до 4,8 ГГц.

При этом максимально доступные для представителей поколения Bristol Ridge частоты ограничиваются отнюдь не тепловыделением. Температура Athlon X4 950 в разгоне остаётся сравнительно невысокой. Повышение же частоты стопорится из-за каких-то глубинных ограничений в полупроводниковой структуре, которые препятствуют безошибочной работе CPU на скоростях сильно выше номинальной.

Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.

3dnews.ru

Процессоры Intel Pentium 4 660 и Pentium 4 eXtreme Edition 3.73 GHz с 2 МБ кэша второго уровня:

что делать, когда делать больше нечего?

Ни для кого не секрет, что рост частот современных x86 CPU в последнее время замедлился, и не помогают производителям ни новые ядра, ни новые техпроцессы. В общем, печальная картина для любителей сенсаций. Однако нет худа без добра: зато компания Intel смогла в очередной раз сделать невозможное - она выпустила два весьма интересных десктопных процессора: eXtreme Edition и обычный Pentium 4 с Processor Number 660. Оба они базируются на новой модификации ядра Prescott (называемой обычно «Prescott-2M»), оснащенной кэшем второго уровня размером два мегабайта: своего рода рекорд для десктопных CPU. Причина достижения такого результата лежит на поверхности: дальнейшее наращивание частот у ядра Prescott, можно сказать, «официально отменено» (у Intel из roadmap пропал процессор с частотой 4 ГГц), а наращивать производительность, тем не менее, как-то нужно. Но нам-то, в конце концов, все равно, за счет чего она будет расти, не так ли? Вот и выясним, дало ли нововведение какой-нибудь эффект. А для начала посмотрим, как соотносятся технические характеристики старых (уже «старых») процессоров Intel с новыми, а также с основным конкурентом.

ХарактеристикаAthlon 64FX-55Pentium 4560Pentium 4660Pentium 4 XE3,46 GHzPentium 4 XE3,73 GHz
Техпроцесс, нм130909013090
Количество транзисторов, млн.106125169178169
СокетSocket 939LGA775LGA775LGA775LGA775
Частота ядра, МГц26003600360034303730
Размер L1D, КБ641616816
Размер L1I64 KB 12 Kuops12 Kuops8 Kuops 12 Kuops
Размер L2, КБ1024102420485122048
Размер L3, КБ2048
ПС процессорной шины (Intel), МГц800 (4x200) 800 (4x200) 1066 (4x266) 1066 (4x266)
ПС контроллера памяти (AMD), МГц800 (2x400)
Поддержка расширенных наборов командMMX, 3DNow!, SSE, SSE2MMX, SSE, SSE2, SSE3MMX, SSE, SSE2, SSE3MMX, SSE, SSE2MMX, SSE, SSE2, SSE3
Поддержка 64-битных расширений x86AMD64EM64TEM64T
Поддержка DEP NXXDXD
Технология управления энергосбережением и нагревомCool'n'QuiteTM2/C1EEIST
TDP, Вт89115115111115

Как видите, оба новых процессора поддерживают технологию EM64T, родную сестричку AMD64, ранее известную как x86-64, что опять-таки внове для десктопных CPU от Intel — ранее EM64T присутствовала только в серверных Xeon Nocona. Однако несмотря на то, что энтузиазм AMD по поводу 64-битных вычислений на десктопных платформах оказался заразительным, и к ней присоединилась даже Intel, основной «рулевой» другой небезызвестной компании — Microsoft, ныне именующий себя «Главным программным архитектором», не спешит нас порадовать официальным релизом 64-битной версии Windows для AMD64/EM64T. Поэтому сегодня нам остается по старинке исследовать те аспекты производительности новых процессоров, которые актуальны для большинства пользователей: скорость исполнения тестов на 32-битной Windows XP и на аналогичном по «битности» программном обеспечении.

Кроме того, видно, что концепция eXtreme Edition себя несколько дискредитировала: теперь XE от Intel уже ничуть не «эксклюзивнее» по отношению к обычным Pentium 4, чем FX от AMD по отношению к обычным Athlon 64: новый Pentium 4 eXtreme Edition 3.73 GHz отличается от обычных десктопных CPU только большей частотой работы ядра и более скоростной шиной. А у AMD FX отличается только частотой, но главное — оба производителя пришли к тому, чтобы делать обычные и «экстремальные» процессоры на одном и том же ядре, «открывая» или «закрывая» некоторые возможности (кто-то сомневается в том, что Pentium 4 660 сможет работать на шине 1066 МГц, если ему понизить коэффициент умножения?). Линейка Pentium 4 6XX будет насчитывать четыре процессора: Pentium 4 660 (3.6 ГГц), Pentium 4 650 (3.4 ГГц), Pentium 4 640 (3.2 ГГц), Pentium 4 630 (3.0 ГГц). Даже судя по одним только частотам можно предположить, что 1066-мегагерцевой шины мы на обычных Pentium 4, увы, так и не увидим. По крайней мере, еще довольно долгое время.

Тоскующим по 64-битным сенсациям мы через некоторое время предложим тестирование новых процессоров в SPEC CPU под одной из 64-битных версий Linux. А для тех, кто интересуется архитектурными особенностями процессорных ядер, можем предложить статью Дмитрия Беседина, главного разработчика пакета RightMark Memory Analyzer, который традиционно исследовал новые ядра с помощью своего пакета и со свойственной ему бескомпромиссной дотошностью даже смог выловить парочку интересных моментов. Таким образом, оставив будущее — будущему, а тонкие моменты — их профессиональным исследователям, приступим к процедуре, которая несмотря на некоторую заезженность является все-таки самой информативной: тестированию производительности в реальных приложениях. К слову, чтобы не делать ее совсем традиционной, не так давно мы весьма существенно поменяли состав тестового ПО, чему была посвящена отдельная статья. Соответственно, тесты, представленные ниже, проведены по новой методике, причем она несколько модифицирована даже по отношению к той, что была описана в статье (надеемся, в лучшую сторону).

Конфигурация тестовых стендов

  • Процессоры
    • Intel Pentium 4 eXtreme Edition 3.73 (266x14) ГГц, LGA775, 2 МБ L2
    • Intel Pentium 4 660 (200x18 ГГц), LGA775, 2 МБ L2
    • Intel Pentium 4 eXtreme Edition 3.46 (266x13) ГГц, LGA775, 512 КБ L2, 2 МБ L3
    • Intel Pentium 5 560 (200x18 ГГц), LGA775, 1 МБ L2
    • AMD Athlon 64 FX-55 (2.6 ГГц, Socket 939)
  • Системные платы
    • ASUS P5AD2-E Premium (чипсет i925XE, Socket 775)
    • Инженерный образец платы на чипсете ATI Xpress 200P (RX480, Socket 939)
    • Albatron K8X890 Pro (чипсет VIA K8T890, Socket 939)
  • Память
    • 2x512 МБ PC3200 (DDR400) DDR SDRAM DIMM Corsair, 2-2-2-5
    • 2x512 МБ PC2-4300 (DDR2-533) DDR2 SDRAM DIMM Corsair, 4-4-4-11
  • Видеокарта ATI Radeon X800 256 MB (PCI Express x16)
  • Жесткий диск Samsung SP1614C (SATA), 7200 об/мин, 8 МБ кэша
  • Windows XP Professional SP2, DirectX 9.0c
  • ATI CATALYST 5.2 (Display Driver 6.14.10.6512)

Небольшой комментарий к конфигурации тестовых стендов: некоторые, быть может, заметят, что в качестве основы для стенда на базе AMD Athlon 64 FX-55 указаны две платы. Дело в том, что ввиду новизны чипсетов для Socket 939 с поддержкой PCI Express, мы решили «подстраховаться», поэтому некоторые тесты выборочно запускали на двух платах, чтобы сравнить результаты. Никаких существенных различий выявлено не было, поэтому на диаграммах вы наблюдаете только один столбец, соответствующий данному процессору.

Также легко заметить, что в качестве оппонента новым процессорам был выбран всего один CPU от AMD. Нам это кажется вполне логичным: мы исследуем производительность топовых решений от Intel, поэтому в качестве ориентира вполне хватит самого быстрого на данный момент процессора AMD. Присутствие других CPU от Intel также объяснимо: новому Pentium 4 XE вполне закономерно противостоит предыдущий, с такой же как у него 1066-мегагерцевой шиной, а Pentium 4 660 соревнуется с Pentium 4 560, от которого он отличается, по сути, только увеличенным в два раза кэшем второго уровня (наличие поддержки EM64T при тестировании под 32-битной версией Windows не актуально, а всевозможные продвинутые технологии энергосбережения при 100% загрузке процессора, по идее, работать не должны).

«Полусинтетика»

CPU RightMark (RMCPU 2004B)

Напомним, что CPU RM представляет собой, по сути, два теста, объединенных в один. Модуль решателя (solver) рассчитывает физику взаимодействия тел, а модуль рендеринга (render) отображает это взаимодействие на экране. Кроме того, модуль рендеринга в состоянии задействовать до 16 процессоров, так как является многопоточным, модуль же решателя в независимости от количества CPU в системе, использует только один процессор. Как мы неоднократно убеждались ранее, соотношение быстродействия процессоров различных архитектур в модулях решателя и рендеринга отнюдь не всегда дает одинаковую картину.

Вполне привычное распределение результатов в зависимости от задачи, с ним мы ранее неоднократно сталкивались: платформа Intel лидирует в рендеринге (в том числе за счет многопоточного модуля), платформа AMD — в расчетной части. Слегка выбивается из общей картины «старый» Pentium 4 eXtreme Edition на ядре Gallatin (Northwood + L3). CPU RightMark — явно «не его» тест: и в вычислениях он на последнем месте, и в рендеринге (традиционной вотчине процессоров Intel) он чуть не проиграл Athlon 64 FX-55. Заметьте, что влияние большого кэша в данном тесте практически не просматривается: Pentium 4 660 идет почти вровень с Pentium 4 560.

Архиваторы

7-Zip может использовать несколько процессоров, поэтому он получает некий выигрыш от Hyper-Threading (причем в некоторых предыдущих статьях мы исследовали этот вопрос, и выяснили, что этот выигрыш ощутим). Поэтому превосходство всех процессоров Intel над Athlon 64 FX-55 в данном случае выглядит закономерно. Впрочем, нетрудно заметить, что оно не так уж и велико.

Совсем по-другому обстоят дела в случае с архиватором WinRAR: преимущество Athlon 64 FX-55 над двумя из четырех процессоров Intel довольно велико, и лишь две модели (причем обе — eXtreme Edition) почти догоняют лидера. Нетрудно предположить, что в этом им помогают две особенности: большой кэш (2 МБ третьего уровня у P4 XE 3.46 ГГц и 2 МБ второго уровня у P4 XE 3.73 ГГц), а также поддержка системной шины с эффективной полосой пропускания, эквивалентной 1066 МГц. Весьма показательно то, что P4 XE 3.46 ГГц обогнал более высокочастотный Pentium 4 660, хотя у последнего тоже большой кэш второго уровня (а вот шина подкачала — «всего» 800 МГц).

Работа с трехмерной графикой

В данном случае мы подразумеваем скорее не трехмерную графику в целом, а «трехмерное моделирование». Оно представлено тремя наиболее популярными программными пакетами: 3ds max, Maya и Lightwave.

SPEC apc для 3ds max 6

Тест от SPEC представляет собой скрипт для 3ds max 6. В нем присутствует и рендеринг, однако ввиду малоинтересности встроенного рендера 3ds max с точки зрения профессионального применения, мы берем во внимание только подтест Interactive, то есть имитацию работы пользователя в данном пакете.

Интерактивный тест демонстрирует убедительное преимущество топового процессора AMD. Что показательно: в рендеринге, о чем свидетельствуют наши более ранние исследования, дела обстоят с точностью до наоборот, там «рулит» Pentium 4. Достаточно забавное распределение ролей: получается, что работать в этой программе будет удобнее на Athlon 64, а вот заниматься финальным рендерингом — на Pentium 4. Впрочем, те, кто зарабатывают этим свой хлеб, вполне могут позволить себе самое простое, хоть и «жирное» решение: использовать преимущества обеих платформ, оснащая рабочие места дизайнеров системами на базе процессоров AMD, выделяя под рендеринг отдельную систему на Intel.

Maya 6

В данном тестировании мы перешли на использование тестового пакета SPECapc for Maya, предназначенного именно для 6-й версии (ранее нами под управлением Maya 6 запускался SPEC apc для Maya 5). С точки зрения организации тестового процесса, тест от SPEC для Maya очень похож на тест для 3ds max — он также представляет собой скрипт, имитирующий различные действия пользователя. Правда, в данном случае отсутствует подтест финального рендеринга.

Забавно, что в подтесте CPU имеются два ярко выраженных лидера — это топовые процессоры Intel и AMD, а вот в общем зачете ситуация выравнивается. С нашей точки зрения это свидетельствует о том, что влияние 3D-акселератора в Maya 6 весьма велико. Также небезынтересен тот факт, что подтест CPU явно больше предрасположен к ядру Prescott в комбинации с большим кэшем (так называемое ядро Prescott-2M), в то время как в общем зачете два первых места заняли процессоры Intel с самой быстрой шиной, причем один из них базируется на более старом ядре Gallatin (фактически представляющем собой Northwood с кэшем третьего уровня).

Lightwave 3D 8

К сожалению, интерактивного теста для Lightwave 8 нам найти не удалось, поэтому в данном случае придется ограничиться тестированием скорости рендеринга относительно сложной сцены. Да, кстати, вот она.

Это один из достаточно удачных, с нашей точки зрения, примеров сцены для Lightwave 3D, вполне соответствующий тому, что часто делают в данном пакете. Сцена найдена на одном из форумов, посвященных Lightwave и лежит в интернете в свободном доступе.

Большой кэш новых процессоров Intel не дал им возможности совершить большой количественный рывок, но зато позволил произвести рывок качественный: ранее (об этом можно судить по результатам Pentium 4 560) у Intel не было «обычного» (не eXtreme Edition) процессора, который мог бы обогнать «экстремала» от AMD. Сейчас такой процессор есть: Pentium 4 660. Однако даже несмотря на большой объем кэша, Lightwave 8 по-прежнему не шибко любит ядро Prescott (в том числе 2M-модификацию), оно в данной программе «берет свое» явно «числом» (мегагерцами, кэшем), но не «умением». Доказательство этому — результат по-прежнему никем не превзойденного Pentium 4 eXtreme Edition 3.46 GHz на старом ядре Gallatin.

Работа с растровой графикойи допечатная подготовка

Основным тестом в данном разделе является скрипт для Adobe Photoshop CS (8), разработанный в нашей тестовой лаборатории. Он включает в себя наиболее часто повторяемые действия: фильтры Blur и Sharpen, изменение цветовой модели (RGB -> CMYK -> Lab), эффекты освещения, вращение изображения, изменение размера, операции типа «Transform». Действия производятся над реальной фотографией, снятой с помощью цифровой камеры. Также по просьбе достаточно большого количества читателей в раздел добавлено тестирование с помощью Adobe Acrobat Distiller — преобразование формата PS в PDF. В качестве исходников используется несколько реальных статей, сверстанных для одного из номеров журнала iXBT.com.

Adobe Photoshop CS (8)

Пестрая картина, однако объяснимая: старое ядро Intel и архитектура AMD не в чести, хороши Prescott. Новая модификация этого ядра с двухмегабайтным кэшем не намного быстрее старой — видимо, дальнейшее наращивание его объема для Photoshop не критично.

Adobe Acrobat 6 Distiller

Adobe Acrobat Distiller отдает безоговорочное предпочтение архитектуре от Intel — NetBurst, причем как более старой ее разновидности в лице P4 XE 3.46 МГц, так и новым процессорам с ядром Prescott[-2M]. В целом: ярко выраженный пример приложения, где ведущую роль играет частота. Сравним соотношения: Pentium 4 560 выполнил задачу на 46% быстрее, чем Athlon 64 FX-55. Соотношение частот: 3600/2600, частота P4 560 больше на 38%. Да, все-таки архитектура тут явно «причем», но все-таки цифры получились более-менее сопоставимые…

CAD/CAM

SolidWorks 2003

Традиционно для многих тестов SPECapc, тестовый скрипт имитирует работу пользователя и в итоге выдает четыре результата: общий балл, производительность графической подсистемы, подсистемы ввода/вывода, и процессора. Стоит заметить, что для SPECapc for SolidWorks 2003 система оценки скорости в баллах сохранена, но наилучшим является меньший результат.

Архитектурные предпочтения SolidWorks 2003 ясны: с очень большим отрывом победил процессор AMD. Далее все менее понятно, но попробуем докопаться до истины. Итак, большой кэш сам по себе, похоже, не очень важен: преимущество Pentium 4 660 над Pentium 4 560 не очень велико. P3 XE 3.46 тоже не впечатляет: несмотря на шину, он проигрывает Pentium 4 660. Предположим, что за счет старого ядра — вполне логичное предположение, не так ли? Тогда получается, что архитектуре NetBurst может помочь только комбинация из трех составляющих: большой кэш, Prescott-подобное ядро, и быстрая системная шина 1066 MHz. А дальше — только частоту наращивать…

Кодирование медиаданных

В данном разделе объединено все что связано с кодированием видео- и аудиоинформации, то есть классическое преобразование WAV -> MP3, а также сжатие видеоданных посредством наиболее распространенных кодеков.

Кодирование аудиоданных

Старый, добрый LAME… Ввиду громадного количества пресетов, и не меньшего количества их ярых поклонников, мы пошли по компромиссному пути: исследуется кодирование с максимально возможным качеством: (320 kbps CBR, q=0) и кодирование VBR от 160 до 320 kbps с «высоким» (опция «-q 2», или просто «-h») качеством, после чего от полученных результатов берется среднее геометрическое.

Введение в тест второго подтеста, откуда убрана «нелюбимая» процессорами AMD опция Q=0, кардинально ситуации не изменило, и причина проста: при наборе опций «-b 160 -B 320 -m j -q 2 -V 0» все процессоры пришли к финишу практически одновременно: наихудший результат (Pentium 4 560) равен одной минуте и шести секундам, а наилучший (Athlon 64 FX-55, Pentium 4 eXtreme Edition 3.73 GHz, Pentium 4 660)… одной минуте ровно. Таким образом, между «рядом стоящими» процессорами от обоих производителей, разницы между кодированием MP3 с помощью LAME в режимах с Q>0, можно сказать, просто не существует. А при Q=0 выигрывают процессоры Intel Pentium 4. Кстати, обратите внимание, что наилучший результат из подгруппы Pentium 4 отнюдь не у нового ядра.

Кодирование видеоданных (MPEG4)

Результат, представленный на диаграмме ниже — это плод компромисса между желанием охватить максимально большое количество широко распространенных кодеков, и нежеланием загромождать статью диаграммами. Вы видите перед собой усредненное время кодирования тестового файла тремя кодеками: DivX, XviD, и Windows Media Video 9. Чтобы успокоить тех, кто боится эффекта «средней температуры по больницe», уточним: распределение мест отдельно по каждому кодеку, и на сводной диаграмме — оказалось одинаковым.

Мы первый раз тестируем Athlon 64 FX-55, и не обошлось без сюрприза: несмотря на то, что в кодировании видео традиционно сильны процессоры Intel, первое место занял все-таки топовый CPU от AMD. Впрочем, легко заметить, что преимущество это весьма невелико, и по большому счету, все процессоры справились с задачей вполне успешно, и отдавать предпочтение в данном случае следует, несомненно, самому дешевому, а не самому быстрому: разницы в той быстроте — единицы процентов…

Кодирование видеоданных (MPEG2)

По многочисленным пожеланиям читателей, в данном тесте теперь используется кодер от Canopus — ProCoder 2 (ранее мы использовали Mainconcept MPEG Encoder 1.4).

Еще один тест, который очень «не нравился» поклонникам AMD, причем настолько, что они даже упрекали нас в предвзятости: дескать, мы используем Mainconcept MPEG Encoder специально чтобы «вытянуть» процессоры Intel. Будем надеяться, что против рекомендованного ими же Canopus ProCoder у них возражений не возникнет. И что в результате? А в результате Pentium 4 все равно лучше :).

Визуализация трехмерной графики

Современные трехмерные игры

Для всех игр мы используем режим 640x480x32 с минимальными настройками качества, поэтому, строго говоря, на тестирование реальной производительности в играх данный раздел претендовать не может. Однако он не мог бы претендовать на эту роль и в том случае если бы установки были более реалистичными, так как в любом случае мы используем всего одну видеокарту — а производительность в играх зависит от этого компонента никак не меньше, чем от процессора.

Зачем нужен данный тест? В общем-то, больше из теоретического интереса, чем из практического. Сведя к минимуму влияние видеокарты, мы анализируем процессорные предпочтения игровых движков. Разумеется, если бы использовалась только одна игра, это было бы малоинтересно. Однако четыре современные игры, если их результат усреднить, дают возможность с более высокой степенью приближения ответить на вопрос: «Какие CPU предпочитают современные игровые движки»? В дальнейшем мы, вполне возможно, введем в тесты еще больше игр, но анализировать будем только последнюю диаграмму: сводную. И именно с той точки зрения, что описана выше.

Убедительная победа процессора AMD, и, похоже, одна из самых убедительных побед в данном тестировании. Можно, конечно, вспомнить Adobe Distiller, но там все-таки одно приложение, а здесь — сводная диаграмма по результатам четырех тестов. Рискнем предположить, что даже пока отсутствующий в списке Half-Life 2 при любом исходе вряд ли смог бы переломить ситуацию, так что для современных игр мы с чистой совестью можем рекомендовать процессоры AMD. Конечно, в «настоящих» игровых режимах преимущество процессора будет намного менее очевидно, так как скажется влияние видеокарты, но если одно число больше другого — то на сколько их не дели, второе больше первого все равно не станет, не так ли?

Пакеты трехмерного моделирования

Достаточно просто трактуемая диаграмма: чем больше кэш — тем лучше. Группы так и распределились: внизу два процессора с 1 МБ L2, чуть повыше — два процессора с двухмегабайтным кэшем (видимо, тесту все равно, какого он уровня), еще выше — CPU с двухмегабайтным кэшем и быстрой шиной 1066 МГц.

Заключение

Для начала приведем небольшую табличку, позволяющую, как нам кажется, наиболее интересным (хотя и не бесспорным!) способом оценить результаты всех тестов в совокупности. В ней снова приведены результаты всех процессоров во всех тестах, но уже в процентном отношении, при этом за 100% берется наихудший результат (понятно, что в зависимости от теста его показывают разные CPU). А в конце полученные проценты сведены вместе методом простейшего среднего арифметического. Разумеется, такая оценка весьма приблизительна, так как предусматривает, что нас в равной степени интересуют результаты всех тестов, однако, учитывая многообразие вкусов различных пользователей, нам такой метод представляется, как минимум, ничуть не менее предпочтительным, нежели любой другой. Для удобства просмотра худшие результаты (100%) выделены красным, а лучшие — синим.

ТестAthlon 64FX-55Pentium 4560Pentium 4660Pentium 4XE 3.46 GHzPentium 4XE 3.73 GHz
CPU RM (solver)129%106%106%100%110%
CPU RM (render)100%120%120%101%124%
7-Zip100%102%105%106%110%
WinRAR121%100%106%112%115%
3ds max 6 (interactive)126%100%103%102%108%
Maya 6 (CPU)113%100%104%101%114%
Maya 6 (overall)105%100%104%107%109%
Lightwave 3D 8106%100%107%113%111%
Adobe Photoshop CS104%112%114%100%120%
Adobe Distiller 6100%147%152%156%157%
SolidWorks 2003132%100%105%103%116%
LAME100%125%126%134%130%
MPEG4106%101%101%100%105%
MPEG2100%113%113%107%115%
Games128%100%102%104%110%
SPEC viewperf102%100%111%108%117%
Overall111% 108%111%110%117%

Итак, если рассматривать вышеприведенную таблицу в качестве оснований для выводов, то основных выводов будет два:

  1. В общем зачете новый топовый процессор Intel вырвал пальму первенства из рук AMD (так и представляешь себе, как он ее, прямо с корнем, вырывает…), более того: новый «неэкстремальный» Pentium 4 660 идет с Athlon 64 FX-55 наравне, обгоняя при этом предыдущий P4 XE от самой Intel. Глядя на эту безрадостную картину, начинаешь понимать всю тщету гонки за громкими названиями типа «eXtreme Edition» или «FX»: что в них толку, если через мизерный срок (не более полугода) выйдет обычный процессор, который окажется быстрее?
  2. Разница между худшим и лучшим показателями составляет… 9%. То есть если брать производительность рассмотренных нами процессоров «в среднем», вероятность того, что пользователь сможет почувствовать разницу в скорости систем на их основе — чрезвычайно мала. Как общеизвестно, чувствительность человека намного ниже чувствительности бенчмарка. Возникает, соответственно, законный вопрос: а не много ли шума из ничего? Впрочем, на него каждый отвечает самостоятельно.

Мы лишь можем констатировать: с точки зрения сравнения производительности топовых CPU, все по-прежнему сводится к продолжающемуся спору о том, «кто хозяин горы», то есть занимает формальное первое место. Кажется, уже всем без исключения понятно, что решения, которое разгромит конкурента в пух и прах, ни один из производителей предоставить не в состоянии. Или не хочет. Что, к слову, не так уж фантастично, как кажется на первый взгляд. Возможна и вариация, совмещающая в себе оба варианта: один осознанно «притормаживает» выход своего нового продукта, второй же рвется к вершине, достигает ее… и через некоторое время получает в качестве ответа давно готовый к выпуску CPU от конкурента. Какой из этих трех вариантов имеет место на самом деле, мы, скорее всего, не узнаем… да и не особенно хочется, честно говоря. Ибо причин может быть масса, а следствие все равно одно: быстродействие CPU растет, но не скачкообразно, а небольшими, четко отмеренными порциями, а смена формального лидера столь же неизбежна как пришествие нового времени года. Впрочем, так или иначе, шоу продолжается! Зритель, правда, порядком подустал. Поэтому наш прогноз на будущее несколько парадоксален: к тому времени, когда два ведущих конкурента на рынке x86 CPU наконец-то сподобятся окончательно выяснить, кто из них делает самые быстрые процессоры — это уже мало кого будет интересовать :).

Впрочем, все вышесказанное отнюдь не мешает поздравить Intel с очередной победой. В конце концов, не так важно, кто победил — важно, что в очередной раз планка производительности поднята еще выше. До тех пор, пока ее кто-нибудь время от времени поднимает, можно не переживать за индустрию в целом: куда-то она все-таки движется…

Процессор AMD Athlon 64 FX-55 предоставлен компанией Формоза

www.ixbt.com

Функции управления производительностью и энергопотреблением процессоров Intel

Часть 4: процессоры семейства Intel Core 2

Мы продолжаем начатое нами исследование технологий управления производительностью и энергопотреблением современных процессоров, начало которому положили наши статьи, посвященные исследованию указанных технологий в процессорах Intel Pentium 4 и Intel Pentium M. Вполне естественно расширить это рассмотрение на случай новых процессоров Intel, основанных на микроархитектуре Intel Core. Примером такого процессора выступит новейший, только что анонсированный «экстремальный» процессор Intel Core 2 Extreme QX6700, характеризующийся четырехъядерной (2x2) конфигурацией процессорного ядра, получившего кодовое наименование Kentsfield.

Конфигурация тестового стенда

  • Процессор: Intel Core 2 Extreme QX6700 (Kentsfield rev. B3, CPUID 6F7)
  • Чипсет: Intel 975X
  • Материнская плата: Intel D975XBX2 rev. 303, версия BIOS BX97520J.86A.1024.2006.0814.1142 от 08/14/2006
  • Память: 2x1 ГБ Corsair XMS2-6400, DDR2-800, 5-5-5-15

Программное обеспечение

  • RightMark CPU Clock Utility (RMClock) версии 2.2RC3 (pre-release)
  • SpeedFan 4.31
  • StressTest, SSE2 build

Intel Core 2: новые технологии и особенности их реализации

Прежде всего, остановимся на кратком рассмотрении новых технологий управления производительностью и энергопотреблением, реализованных в процессорах семейства Intel Core 2, а также особенностей их реализации, связанных с многоядерной конфигурацией данных процессоров.

Для начала, взглянем на скриншот последней версии утилиты RightMark CPU Clock Utility 2.2RC3 (pre-release), в которой полностью реализована поддержка двух- и четырехъядерных процессоров семейства Intel Core 2.

По основному скриншоту видно, что четырехъядерный процессор Intel Core 2 Extreme (Kentsfield) поддерживает все пять рассмотренных ранее технологий управления производительностью и энергопотреблением — технологию управления производительностью процессора по запросу Enhanced Intel SpeedStep (EIST), функции защиты процессора от перегрева Thermal Monitor 1 (TM1) и Thermal Monitor 2 (TM2), устаревшую технологию модуляции тактовой частоты процессора по запросу On-Demand Clock Modulation (ODCM), а также улучшенные режимы простоя Enhanced C States (CxE). По сравнению с процессорами Intel Pentium 4 и Pentium D 600-х, 800-х и 900-х серий, которые, как известно, характеризовались лишь наличием улучшенного режима простоя Enhanced Halt (C1) State, в процессорах Intel Core 2 (а также мобильных процессорах Intel Core Solo/Duo) последняя функция была расширена на случай всех возможных состояний бездействия процессора, включая режимы Stop Grant (C2), Deep Sleep (C3) и Deeper Sleep (C4).

Существенным отличием процессоров семейства Intel Core 2 от рассмотренных нами ранее процессоров Intel является наличие цифровых измерителей температуры ядра (Digital Thermal Sensor), встроенных в каждое ядро процессора. Эти датчики доступны также в мобильных процессорах Intel Core Solo/Core Duo. Их показания можно считывать и отображать независимо для каждого из ядер, что реализовано в последних версиях утилиты RMClock. С технической точки зрения, возвращаемым значением является отрицательное смещение температуры относительно максимально допустимой температуры функционирования ядра процессора (junction temperature, Tj). Последняя указывается в спецификации процессора и составляет 100°C как для процессоров Intel Core Solo/Core Duo, так и для процессоров семейства Intel Core 2. Однако, как показывает опыт, в последнем случае из показаний температуры необходимо вычитать дополнительное смещение, задаваемое в одном из дополнительных модель-специфичных регистров (MSR) процессора, относящихся к рассматриваемым функциям. Это смещение составляет, как правило, 16°C, и его учет реализован в готовящейся к выпуску версии 2.2 утилиты RMClock.

Возвращаясь к улучшенным режимам простоя процессора, из скриншота дополнительных настроек процессора видно, что для десктопных процессоров Intel Core 2 по умолчанию включен лишь режим Enhanced Halt (C1) State — C1E. Связано это с тем, что более глубокие режимы «сна» процессора, как правило, не используются в десктопных платформах — операционная система «не видит» их наличие в информации, предоставляемой ей ACPI BIOS материнской платы. Они приобретают актуальность для мобильных платформ — так, в частности, на платформе Intel Centrino Duo по умолчанию, как правило, оказываются включенными улучшенные режимы C2E и C4E.

Что касается технологий TM1 и TM2, по приведенному скриншоту можно легко увидеть основное отличие в их реализации по сравнению с предыдущими процессорами Intel — в процессорах Intel Core 2 можно задействовать обе технологии одновременно, что в рассматриваемом случае сделано по умолчанию. Однако, как будет показано ниже, само по себе это особого смысла не имеет — для реализации возможности одновременного использования TM1 и TM2 необходимо включение режима так называемого «расширенного троттлинга» (Extended Throttling). Суть последнего, как мы увидим ниже, заключается в аварийном включении технологии TM1 в том случае, если технология TM2 оказывается недостаточно эффективной для сохранения температуры процессора в допустимом интервале температур, заданных производителем. Несмотря на известную высокую эффективность технологии TM2, такая ситуация, в чем легко убедиться, вполне может возникнуть на четырехъядерных процессорах Intel Core 2 Quad / Intel Core 2 Extreme, поэтому мы можем сказать, что режим расширенного троттлинга для этих процессоров предусмотрен производителем явно не зря.

Последняя из дополнительных настроек, являющаяся отключенной по умолчанию, — режим синхронизации TM1 на ядрах процессора (Sync TM1 on CPU cores) — заключается в использовании одного и того же режима модуляции тактовой частоты процессора одновременно для всех его ядер. По всей видимости, особого смысла в использовании этого режима действительно не имеется — ведь каждому из ядер процессора (даже включая те, которые являются составной частью «общего ядра») позволительно иметь собственный режим модуляции тактовой частоты, в зависимости от условий его загрузки и рабочей температуры. С одной стороны, принудительная синхронизация режима TM1 может способствовать более эффективному снижению температуры процессорного ядра в целом, но с другой стороны, она может приводить к более выраженному снижению производительности процессора в случае его перегрева. Видимо, производитель счел более важным сохранение как можно более высокой производительности процессора даже при его сильном перегреве, в связи с чем этот режим не используется по умолчанию.

Говоря о независимости или, наоборот, зависимости отдельных ядер друг от друга, мы перешли к рассмотрению особенностей реализации функций управления производительностью и энергопотреблением процессоров семейства Intel Core 2, поскольку указанные особенности связаны именно с этим обстоятельством. Как известно, классические двухъядерные процессоры Intel Core 2, а также Intel Core Duo, характеризуются наличием общего для обоих ядер процессора L2-кэша. Поскольку этот ресурс функционирует на полной частоте ядра процессора, становится совершенно очевидно, что оба ядра двухъядерных процессоров Intel Core 2 (и Intel Core Duo) всегда обязаны функционировать на одной и той же тактовой частоте. Несмотря на то, что каждое из ядер имеет свой собственный набор модель-специфичных регистров (MSR-ов), предоставляющих возможность управления производительностью и энергопотреблением ядра процессора, попытка установки разных значений тактовой частоты (точнее, множителя системной шины, FID) для разных ядер процессора приводит к немедленному зависанию системы.

Поскольку прямое отношение к тактовой частоте ядра процессора имеют лишь технологии EIST и TM2, одинаковыми для обоих ядер должны быть значения именно этих параметров. А если учесть, что программирование режима TM2 для процессоров Intel Core 2 оказывается недоступным (соответствующий MSR у этих процессоров является «read-only»), проблема синхронизации тактовой частоты ядер сводится к ее управлению посредством технологии EIST. Естественно, драйвер процессора или утилиты управления вроде RMClock должны быть «в курсе» этой особенности управления производительностью двухъядерных процессоров Intel посредством технологии EIST. В то же время, как мы уже упоминали выше, каждому из ядер позволительно иметь собственный уровень «троттлинга» (модуляции тактовой частоты — по запросу, посредством ODCM, либо автоматически, посредством TM1), поскольку «троттлинг» затрагивает лишь исполнительные ресурсы ядра процессора, но не влияет на функционирование его L2-кэша.

На первый взгляд, несколько более сложной может оказаться ситуация управления производительностью и энергопотреблением четырехъядерных процессоров, примером которого является рассматриваемый нами Intel Core 2 Extreme QX6700. Однако таковой она кажется лишь на первый взгляд — дело в том, что ядро этого процессора, по сути, представляет собой как бы два независимых процессора Intel Core 2 Duo E6700, помещенных вместе в один корпус. Соответственно, управление каждым из этих независимых «двухъядерных ядер» оказывается также независимым.

Рассматриваемый процессор представляется операционной системе в виде четырех «системных» процессоров, под которыми, как мы знаем, может подразумеваться все, что угодно — либо полноценное процессорное ядро (например, Intel Pentium M), либо его составная часть (Intel Core Duo или Intel Core 2), либо и вовсе логический процессор (Intel Pentium 4 с технологией Hyper-Threading). Соответственно, для управления каждым из «системных» процессоров необходимо как-либо отнести его к конкретному физическому устройству, а далее — сгруппировать «системные» процессоры по критерию их принадлежности к данному физическому процессору/ядру, которым можно управлять как целым устройством. Для решения этой задачи отлично подходит так называемый APIC ID процессора, который, вообще говоря, может произвольно назначаться ему операционной системой. В случае четырехъядерных процессоров Intel Core 2 младший бит APIC ID означает индекс «зависимого» («дочернего») ядра процессора внутри составляющего его «независимого» («главного») ядра (0 либо 1), а следующий за ним бит APIC ID, смещенный вправо на единицу, отражает индекс «независимого ядра» внутри корпуса процессора. Более наглядно это представлено ниже в таблице.

Индекс системного процессораAPIC IDИндекс «главного» ядра, APIC ID[1] >> 1Индекс «дочернего» ядра, APIC ID[0]
0000
1210
2101
3311

Из этой таблицы видно, что APIC ID процессора не обязательно совпадает с номером связанного с ним «системного» процессора, поэтому полагаться на этот номер было бы ошибочно. Заметим также, что представленная выше расстановка ядер процессора Intel Core 2 Extreme QX6700 формально совпадает с таковой для предыдущих «экстремальных» двухъядерных процессоров, оснащенных технологией Hyper-Threading — например, Intel Pentium Extreme 965. Разница заключается лишь в том, что индексу «главного» ядра в том случае соответствует собственно индекс ядра, а индексу «дочернего» ядра — индекс логического процессора, входящего в состав ядра. Аналогия оказывается более чем полной.

Intel Core 2: тестовые испытания

Выше мы рассмотрели основные технологии управления производительностью и энергопотреблением процессоров семейства Intel Core 2 и особенность их реализации в этих процессорах. Самое время перейти к собственно испытаниям этих технологий.

Поведение технологий EIST и CxE в процессорах Intel Core 2 существенно аналогично их поведению в исследованных нами ранее процессорах Intel Pentium 4 и Intel Pentium M, с точностью до рассмотренных выше особенностей, связанных с многоядерной архитектурой процессоров. Намного больший интерес представляют технологии автоматической защиты процессора от перегрева — TM1 и TM2, получившие развитие в виде расширенного режима троттлинга. Тем более что ситуация перегрева четырехъядерного процессора, как выяснилось, оказывается далеко не такой уж и редкой…

Для начала, рассмотрим вид кривых мониторинга (здесь и далее мониторингу подвергалось первое ядро процессора — «CPU 0», поведение остальных ядер оказывалось в существенной степени аналогичным) в случае простоя процессора.

Видно, что «номинальная» частота ядра процессора оказывается сброшенной до минимального уровня — 1600 МГц (частоты шины 266 МГц, минимальный множитель 6x) за счет функционирования технологий улучшенного режима простоя CxE (в данном случае — C1E). В то же время, измерение «частоты троттлинга» процессора (под которой следует понимать реальную частоту ядра процессора) показывает почти максимальное значение, поскольку само измерение неизбежно является нагрузкой для процессора и выводит его из режима C1E в полностью «рабочее» состояние C0. Температура ядра процессора оказывается на минимальном уровне (порядка 33°C). Следует отметить особенность реализации технологии C1E в процессорах семейства Intel Core 2, заключающуюся в том, что запрашиваемое напряжение ядра процессора (VID), измеряемое при простое системы, как бы практически постоянно остается на максимальном уровне, тогда как множитель системной шины (FID) снижается до минимума. По-видимому, это является особенностью измерения VID на этом типе процессоров, поскольку сама по себе технология C1E по определению помещает процессор в режим минимального энергопотребления, характеризующегося минимальной частотой (FID) и напряжением (VID).

Подаем нагрузку на процессор, моделируемую простым тестовым приложением нашей собственной разработки (StressTest), в данном случае запущенным в четырехпоточном режиме для обеспечения полной загрузки процессора. Частота и загрузка процессора выходят на максимальный уровень, температура ядра очень быстро растет до весьма внушительных величин.

В скором времени, даже в условиях штатной системы охлаждения (надо заметить, весьма шумной!) можно лицезреть картину, представленную на приведенном выше скриншоте. Да-да, все именно так: мы наблюдаем порог срабатывания режима защиты процессора от перегрева. Температура ядра при этом составляет примерно 81°C.

Картина троттлинга в условиях штатного охлаждения разворачивается во времени примерно следующим образом.

На кривых изменения тактовой частоты (а также множителя) процессора во времени легко заметить появление «скачков» до минимального уровня производительности — частоты 1600 МГц при множителе системной шины 6x. Из предыдущих исследований нам хорошо известно, что так работает технология защиты процессора от перегрева TM2. В данном случае (при включенных режимах TM1, TM2, Extended Throttling) она срабатывает в первую очередь, что выглядит вполне естественно, учитывая ее высокую эффективность. Кстати, о последней можно судить также по кривой изменения температуры ядра процессора — она остается на постоянном уровне 81°C. Наконец, по кривой реальной загрузки процессора (CPU Load) можно заметить, что производительность процессора снижается до уровня примерно 97%. Иными словами, хотя троттлинг и имеет место быть (в условиях штатного охлаждения процессора), его влияние на производительность процессора оказывается весьма минимальным.

Изучение троттлинга продолжаем следующим образом: с помощью утилиты SpeedFan снижаем скорость вращения вентилятора процессора до минимально возможного уровня. Полная остановка вентилятора нам не удалась, скорость его вращения снизилась примерно до 1000 об/мин.

Достаточно быстро троттлинг процессора посредством TM2 достигает своей максимальной эффективности — «средняя» частота ядра постепенно снижается практически до минимальной отметки, примерно 1.7 ГГц. Это соответствует примерно 64% эффективной производительности ядра процессора, которую, к сожалению, напрямую нельзя увидеть по изменению кривой CPU Load. Дело в том, что последняя отсчитывается относительно текущей, а не «полной» частоты ядра процессора, и в силу ошибок измерения (связанных с множественными переключениями процессора между минимальной и максимальной частотой) она может оказаться даже выше 100%, в том случае, когда реально измеренная «средняя» частота ядра оказывается реально выше по сравнению с синтетическим мгновенным значением «текущей» частоты. Эффективность защиты процессора от перегрева остается на весьма высоком уровне — обратите внимание, насколько мало изменяется температура ядра процессора.

Принципиальных отличий не наблюдается и по мере продолжения испытания. Единственное отличие заключается в том, что «средняя» частота процессора падает до своего минимального значения (в условиях функционирования TM2), равного 1.6 ГГц. Увидеть режим «расширенного троттлинга» не удается в действии даже в этих условиях, при крайне малой скорости вращения вентилятора кулера процессора. Нам ничего не остается, как остановить его полностью, вручную.

Extended throttling в действии! В реальности все оказалось так, как оно и описано в теории — при недостаточной эффективности TM2 в дело вступает технология TM1, суть которой заключается в модуляции тактовой частоты процессора вставкой «принудительно холостых» тактов. Последняя, измеренная относительно минимальной опорной частоты 1.6 ГГц, в условиях нашего эксперимента достигает отметки примерно 0.91 ГГц, т.е. 57% относительно минимальной частоты процессора, обусловленной действием TM2. По отношению к исходной, полной частоте процессора (2.67 ГГц), эта величина составляет примерно 34%. По-видимому, дальнейшее снижение частоты процессора невозможно даже при одновременном использовании TM2+TM1 в максимальной степени. Обратите внимание на график температуры ядра процессора — в момент экстренного срабатывания TM1 показания последней «исчезают»: цифровой датчик температуры ядра процессора перестает выдавать осмысленные значения, обнуляя при этом свой бит «reading valid», говорящий, как нетрудно догадаться, о корректности выдаваемого им значения. А это означает, что температура ядра процессора отныне не сохраняется на постоянном уровне (примерно 82°C) и продолжает расти. Действительно, устаревшая технология TM1, управляющая лишь эффективной частотой, но не напряжением ядра процессора, неспособна поддерживать его температуру в той же мере, что и технология TM2. По всей видимости, реальная температура ядра в этих крайне жестких условиях испытания продолжает неограниченно расти, пока не достигнет порога срабатывания датчика аварийного перегрева процессора и пока не произойдет принудительное отключение питания системы.

Однако мы не станем дожидаться этого момента, а возобновим активное охлаждение процессора. Сначала вернем установленные программно минимальные обороты вентилятора.

Троттлинг процессора (посредством TM1) весьма медленно сводится на нет, далее появляются первые признаки «оживления» TM2 в виде кратких попыток восстановления максимальной частоты процессора, наконец, возобновляется мониторинг температуры ядра процессора. Следом, возобновляем максимальное охлаждение процессора.

Получаемая картина существенно аналогична картине разворачивания троттлинга процессора посредством TM2, с точностью до обратного порядка следования событий во времени. Постепенно достигается уровень производительности процессора примерно 95%, реально наблюдаемый в условиях полной загрузки последнего при использовании штатной системы охлаждения.

Ради интереса, попробуем теперь отключить режим расширенного троттлинга, оставив при этом одновременно включенными TM1 и TM2. Снизим скорость вращения вентилятора до минимальной.

TM2 достигает своей максимальной эффективности, температура ядра сохраняется на постоянном уровне. Теперь полностью остановим вентилятор кулера процессора.

И увидим границу действия технологии TM2 — сперва исчезают всяческие попытки восстановления максимальной тактовой частоты ядра процессора, а его реальная частота снижается до минимальной. Далее пропадают показания цифрового датчика температуры. Однако, поскольку режим расширенного троттлинга более не используется, технология TM1 при этом не включается.

Восстановление активного охлаждения процессора приводит к возвращению практически максимального уровня производительности процессора.

Напоследок, изучим режим работы устаревшего механизма термической защиты процессора TM1 в чистом виде.

Снижение скорости вращения вентилятора до минимальной оказывается достаточным, чтобы быстро реализовать троттлинг процессора посредством технологии TM1 в полной мере. Опорная частота ядра процессора остается максимальной, однако его реальная частота достаточно быстро снижается до уровня примерно 56% (1.49 ГГц), уже знакомого нам по испытаниям режима расширенного троттлинга. При достижении максимального уровня троттлинга температура ядра процессора достаточно быстро выходит за допустимый предел, в связи с чем показания датчика температуры исчезают. Это лишний раз подтверждает, что технология TM1 оказывается намного менее эффективной по сравнению с TM2. В одинаковых условиях эксперимента эта технология не только приводит к более выраженному снижению частоты процессора, но и оказывается неспособной поддержать его температуру на постоянном уровне.

При возобновлении активного охлаждения процессора температура ядра процессора достаточно быстро возвращается в допустимые рамки, а уровень его производительности достаточно медленно достигает максимального уровня, равного примерно 87% от номинала.

Заключение и практические рекомендации

Проведенные испытания показали недостаточно высокую эффективность штатной системы охлаждения процессора Intel Core 2 Extreme QX6700, которая, к тому же, обладает весьма высоким уровнем шума. В условиях полной загрузки всех четырех ядер процессора штатная система охлаждения не справляется с нагрузкой и приводит к срабатыванию защиты процессора от перегрева посредством троттлинга. Рекомендованным решением этой проблемы является использование более эффективной системы охлаждения. Дополнительные исследования показали, что с этой задачей вполне могут справиться и неэкзотические системы воздушного охлаждения, вроде кулера Zalman CNPS9700NT.

Испытания троттлинга как такового в рассматриваемом процессоре показали весьма высокую эффективность реализации технологии Thermal Monitor 2 в плане поддержания температуры ядра процессора в допустимом пределе в течение длительного времени даже в условиях минимального охлаждения. Однако при возникновении внештатной ситуации, например, при полной остановке вентилятора системы охлаждения процессора в условиях полной загрузки процессора, технология Thermal Monitor 2 может оказаться уже недостаточно эффективной, что приведет к срабатыванию режима расширенного троттлинга — включению технологии Thermal Monitor 1 на фоне Thermal Monitor 2. Наши испытания показали, что в этих условиях температура ядра процессора уже не способна сохраняться в допустимом пределе, что может привести к ее дальнейшему возрастанию и, в конечном счете, к аварийному отключению питания системы. Таким образом, мы считаем, что к проблеме охлаждения четырехъядерных процессоров Intel, каковым является процессор Intel Core 2 Extreme QX6700, следует относиться весьма внимательным образом.

www.ixbt.com

Процесcор, CPU (4) - Устройство персонального компьютера

процессор

Напряжение питания ядра. Ядро современного процессора питается довольно низким напряжением, порядка 1,2-1,7 В. Для каждой модели есть свое паспортное значение этого напряжения, которое обычно задается автоматически. Ручная регулировка иногда используется при разгоне, но это может привести к перегреву процессора и выходу его из строя.

Тепловыделение. Поскольку процессоры работают на очень высоких частотах, они могут обладать большим тепловыделением, достигающим до 100 Вт и более. Для обозначения потребляемой процессором мощности используется параметр TDP (Thermal Design Power). Производители процессоров используют различные технологии снижения энергопотребления. В наиболее экономичных моделях удается снизить тепловыделение до 20-30 Вт, что особенно важно для ноутбуков.Эксплуатация процессора невозможна без системы охлаждения, в качестве которой используются массивные радиаторы с установленными на них вентиляторами.Для современных процессоров характерен набор дополнительных функций и технологий, расширяющих их возможности.Процессоры AMD в зависимости от модели могут поддерживать различные технологии.

3DNowl, SSE, SSE2, SSE3. Наборы дополнительных инструкций для процессора, ускоряющих работу с мультимедиа и большими объемами данных.

Cool'n'Quiet. Технология энергосбережения, требующая поддержки со стороны операционной системы (не ниже Windows ХР SP2), которая «заставляет* процессор снизить тактовую частоту, если его нагрузка невелика.

NX-bit (No Execute). Технология защиты компьютера от вирусов, запрещающая запуск кода из области данных. Поддерживается операционной системой не ниже Windows ХР SP2.

AMD64. Технология, позволяющая выполнять 64-битныс инструкции, то есть устанавливать 64-разрядные операционные системы.

AMD virtualization (AMD-V). Аппаратная поддержка одновременной работы нескольких виртуальных машин на одном компьютере. Для реализации этойтехнологии понадобится специальная программа — менеджер виртуальных машин, которая будет распределять ресурсы компьютера между несколькими операционными системами. Наличие этой технологии совсем необязательно для установки и запуска виртуальных машин, однако она повышает эффективность работы с ними.

inside-computer.narod.ru