| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
КАТАЛОГ ТОВАРОВ Срок доставки товара в течении 1-3 дней !!!
|
Работайте эффективнее благодаря процессорам 8-го поколения — Intel. Сравнение производительности процессоров intel разных поколенийПроизводительность процессоров двух поколений архитектуры Core в равных условияхТех, кто посещает наш ресурс в поисках информации, полезной на практике, сразу же хотим предупредить: эту статью им читать не стоит, поскольку ничего практически полезного данное тестирование не несет. А вот с точки зрения теории оно, как раз, достаточно полезно, поскольку мы решили удовлетворить потребности жаждущих сравнить производительность процессоров первого и второго поколения Core в равных условиях. Зачем это нужно? Хотя бы затем, чтобы оценить — что́ реально дало усовершенствование микроархитектуры, что́ стоит отнести уже к более высокому уровню архитектуры, а что́ можно списать и на сопутствующие факторы. Строго говоря, нечто подобное нами уже было проделано почти год назад, но, во-первых, тогда использовалась предыдущая версия методики тестирования, явно не слишком ориентированная на процессоры Sandy Bridge, появившиеся позже всех входящих в нее версий программ, а во-вторых (и в-главных!), в упомянутом материале условия были не совсем равными. Сегодня же мы решили проработать поставленный во втором предложении вопрос более тщательно. Надеемся, что кому-то это окажется полезным или, хотя бы, интересным :) Конфигурация тестовых стендовКазалось бы — ну что ж здесь сложного? Берем процессоры одного семейства с одинаковым количеством ядер и выставляем одинаковую частоту. Но не все так просто, поскольку современные процессоры имеют слишком много различающихся характеристик, привести которые к общему знаменателю достаточно сложно. Во-первых, нам не подходят Core i5 — у них изменилась емкость кэш-памяти третьего уровня: ранее было 8 МиБ, а теперь стало 6 МиБ. А вот Core i7 — подойдут. Правда, есть один момент: технология Hyper-Threading тоже может работать чуть по-разному, но это не беда — просто протестируем процессоры в двух вариантах, включив и отключив ее. Какие еще есть сложности? У кэша L3 есть не только емкость, но и частота работы. А она разная: в Core i7 на базе кристалла Lynnfield составляет 2,4 ГГц, а во всех процессорах на базе архитектуры Sandy Bridge равна тактовой частоте вычислительных ядер. Решается эта проблема просто — следует, стало быть, и в качестве тактовой частоты выбрать значение 2,4 ГГц. Тогда вообще все получается идеально — частоты ядер равны и полностью синхронны с L3. Но чтоб этот идеал не нарушался, нужно, разумеется, отключить и Turbo Boost. Тем более, что эта технология функционирует гарантированно по-разному в двух поколениях Core. Да и вообще: во избежание каких-либо отклонений от нормы лучше совсем отключить технологии управления питанием — в этом случае можно быть уверенным в том, что частота процессоров действительно будет равной в каждый момент времени, а гоняться за практически полезными результатами мы сегодня и не собирались.
Таким образом и получаются четыре описанных выше конфигурации.
Естественно, с разными системными платами, но одинаковыми видеокартой и модулями памяти, работающими в одинаковом режиме. ТестированиеТрадиционно, мы разбиваем все тесты на некоторое количество групп и приводим на диаграммах средний результат по группе тестов/приложений (детально с методикой тестирования вы можете ознакомиться в отдельной статье). Результаты на диаграммах приведены в баллах, за 100 баллов принята производительность референсной тестовой системы iXBT.com образца 2011 года. Основывается она на процессоре AMD Athlon II X4 620, ну а объем памяти (8 ГБ) и видеокарта (NVIDIA GeForce GTX 570 1280 МБ в исполнении Palit) являются стандартными для всех тестирований «основной линейки» и могут меняться только в рамках специальных исследований. Тем, кто интересуется более подробной информацией, опять-таки традиционно предлагается скачать таблицу в формате Microsoft Excel, в которой все результаты приведены как в преобразованном в баллы, так и в «натуральном» виде. Интерактивная работа в трёхмерных пакетахВесьма скромный прирост, укладывающийся в 10%. Несколько не то, что мы наблюдали в предыдущем тестировании, однако в нем и условия были не совсем равными — частота кэш-памяти существенно отличалась. А вот при равной оказывается, что улучшения самих ядер не так уж и велики. Обратим также внимание на то, что Hyper-Threading не дает ничего. Как, собственно, и ожидалось — группа малопоточная. Но «не дает» он чуть по-разному: и на том, и на другом процессоре включение НТ в некоторых программах производительность уменьшает, а в некоторых увеличивает, однако «в среднем» Lynnfield чуть ускоряется, а вот Sandy Bridge замедляется. Любопытный эффект, сохраняющийся и во многих других тестах. Финальный рендеринг трёхмерных сценВот здесь уже положительный эффект от Hyper-Threading никто в здравом уме никогда не оспаривал, однако опять обратим внимание, что относительная эффективность данной технологии у первого поколения Core выше! А вот абсолютный результат что при включенной, что при отключенной поддержке НТ — ниже. Однако речь в этой группе идет лишь о чуть более чем 5% прироста. Интересное кино — чем более «многопоточным» оказывается характер нагрузки, тем меньше выигрыш новых процессоров. Упаковка и распаковкаДобавляется еще один фактор — производительность системы памяти. А характер нагрузки становится очень пестрым. И опять повторяются сделанные выше наблюдения: размер прироста колеблется от «почти ничего» в многопоточном сжатии данных посредством 7-Zip — до более 10% в двухпоточном WinRAR. Красоту построений портит лишь то, что традиционно однопоточные тесты на распаковку ведут себя скромнее. И еще любопытно, что прирост от НТ тут как раз немного больше у Sandy Bridge. Кодирование аудиоОпять используется столько потоков, сколько вычислительных ядер видит система, и опять бо́льшая эффективность НТ — у предыдущего поколения процессоров Intel. С включением «виртуальной многопоточности» Sandy Bridge обгоняет Nehalem лишь на 5%, а без нее — на 8,5%. И то, и другое мы склонны оценивать как скромный прирост. КомпиляцияМы уже не раз писали, что в этой группе тестов выигрыш новой архитектуры минимальный. Однако, не уравняв частоты L3, мы и не подозревали, что он настолько минимальный. И прирост от НТ, как видим, опять чуть выше у процессоров предыдущего поколения. Математические и инженерные расчётыЭто малопоточная группа, так что Sandy Bridge вроде бы должен быть впереди? Да, так и есть. Но обратите внимание на НТ: Nehalem даже здесь умудряется ускориться при ее включении, а SB — нет. Растровая графикаВ первый раз мы видим, чтобы усовершенствования архитектуры дали прирост более 10%. И в очередной раз видим, что НТ более полезна для процессоров предыдущего поколения. Впрочем, в этой группе тестов новая архитектура настолько хороша, что этим можно и пренебречь :) Векторная графикаСовсем небольшая разница в производительности и второй случай, когда к Нyper-Тhreading в Sandy Bridge меньше претензий. Не в том плане, что технология НТ тут хоть что-то может ускорить (приложения-то вообще однопоточные), а в том, что замедление от ее включения у SB выражено в меньшей степени. Кодирование видеоКазалось бы — здесь использование Hyper-Threading безальтернативно. Но это только казалось, и очень давно — мы уже установили, что Microsoft Expression Encoder и XviD ее на дух не переносят, а в x264 прирост есть, но небольшой. Отсюда и такой немного странный на первый взгляд общий результат в группе. Странный, естественно, с точки зрения оценки полезности НТ, а не разницы между архитектурами — та невелика. Что уже становится привычным. Офисное ПОПримечательно, что диаграмма похожа на предыдущую — только абсолютные результаты разные. Хотя, казалось бы, приложения отличаются кардинально, но вот итог одинаковый. JavaА это еще одна типовая иллюстрация многопоточной группы. Настолько типовая, что и на ней ничего нового не обнаруживается. ИгрыСитуацию с играми можно считать особенным случаем, поскольку разницы между поколениями Core почти нет. Никакой. Хотя Sandy Bridge считается лучшей архитектурой для игрушек, уже можно точно утверждать, что основная «вина» в хороших результатах этих процессоров лежит вовсе не на изменениях в вычислительных ядрах, а в высокочастотной кэш-памяти третьего уровня: если лишить процессоры этого преимущества, то и все остальное превосходство практически испаряется. Многозадачное окружениеИ вновь мы обращаемся к одному из «экспериментальных» тестов методики, поскольку в данном сравнении его результаты крайне интересны. Суть теста проста: пять бенчмарков запускаются практически одновременно (с паузой в 15 секунд), при этом всем задачам присваивается «фоновый» статус (ни одно окно не является активным). Результатом считается среднее геометрическое времён выполнения всех тестов. Более подробную информацию можно получить из описания методики тестирования, ну а сейчас просто посмотрим на результаты… …Которые оказались практически равными! К этому мы, конечно, уже были морально подготовлены, но некоторые надежды на чудо сохранялись. Впрочем, компьютерная индустрия вообще редко балует чудесами. ИтогоПризнаться честно, результаты данного тестирования оказались для нас несколько неожиданными. Но легко объяснимыми :) Все-таки нельзя надеяться на то, что без существенных и коренных изменений архитектуры можно получить существенное же изменение производительности в равных условиях. Небольшое — можно. Что мы и наблюдали при переходе от Core 2 к Core, а теперь наблюдаем на следующей итерации — при переходе ко второму поколению Core. Собственно, и в Intel это не скрывали — иначе бы не назывались две (микро)архитектуры столь похожим образом. Небольшие улучшения, безусловно, были сделаны, но именно небольшие. Кстати, очень может быть, что именно из-за этих улучшений снизилась относительная эффективность Hyper-Threading: ведь основная задача этой технологии — сделать так, чтобы функциональные блоки не простаивали. А если они и так загружаются «плотнее» (что и приводит к росту производительности), следовательно, сложнее получить прирост от добавления потоков вычисления на те же физические ядра. Однако тестирования реальных процессоров демонстрируют совсем иные результаты, чем мы получили при попытке поставить два кристалла в равные условия. Нет ли здесь противоречий? На самом деле, нет — на практике процессоры и работают в неравных условиях. Наиболее заметные изменения связаны с появлением кольцевой шины (более точно — с приходом кольцевой шины в процессоры массового сегмента) и увеличением частоты работы кэш-памяти третьего уровня. Явления это взаимосвязанные — без способа «быстрой доставки» данных из кэша L3 в сами ядра нет смысла и ускорять L3, а если последний делать более быстрым, то надо увеличивать и пропускную способность «магистрали» из UnCore в Core. Именно это в Sandy Bridge и сделано, что позволило перейти от асинхронной работы кэша с ядрами — к синхронной. Особенно сильно эффект сказывается даже не в четырехъядерных, а в двухъядерных моделях: они демонстрируют более высокую производительность, несмотря на сниженную по сравнению с предшественниками тактовую частоту ядер. Clarkdale даже часто́ты около 4 ГГц не помогают бороться на равных с SBDC на частотах в районе 3 ГГц: у последних и кэш работает на той же частоте, а у первых — в полтора раза медленнее (Core i5-680: ядра 3,6-3,73 ГГц и UnCore 2,4 ГГц; Core i3-560: 3,33 и 2,16 ГГц). Четырехъядерным же моделям заодно и тактовую частоту повысили: стартовую на 10%, реальную — сильнее, поскольку переработана была и технология Turbo Boost, что позволяет говорить о том, что это уже Turbo Boost 2.0. А чем из этих преимуществ новых процессоров мы воспользовались? Естественно, ничем! Просто потому, что Sandy Bridge поставили вовсе не в те условия, на которые он рассчитан. Вот и получилось, что он фактически не лучше предшественника. Только вот… на частоте 2,4 ГГц синхронно и для ядер, и для UnCore умеют работать оба, демонстрируя при этом близкие результаты, однако Core i7-2600K на практике работает на частотах от 3,4 ГГц с сохранением все той же синхронности, а Core i7-875K на такие подвиги не способен. Со всеми вытекающими. Целевые частоты у процессоров разные, разная и итоговая производительность в реальных условиях. А в одинаковых — почти одинаковая. У новых нигде не хуже, чем у старых (в отличие от времен перехода на NetBurst, когда попытка уравнять тактовую частоту с предыдущими процессорами могла особо впечатлительных и до инфаркта довести), но и не сильно лучше. Однако в комплексе с другими улучшениями этого оказывается более чем достаточно. www.ixbt.com Сравнение производительности процессоров Intel разных поколений / СоХабрДля этого я решил протестировать производительность аналогичных процессоров разных поколений. Сравнивать решил модели массового сегмента: 8-ядерные процессоры 2660, 2670, 2640V2, 2650V2, 2630V3 и 2620V4. Тестирование с подобным разбросом поколений является не совсем справедливым, т.к. между V2 и V3 стоит разный чипсет, память нового поколения с большей частотой, а самое главное — нет прямых ровесников по частоте среди моделей всех 4-х поколений. Но, в любом случае, это исследование поможет понять в какой степени выросла производительность новых процессоров в реальных приложениях и синтетических тестах. Выбранная линейка процессоров имеет много схожих параметров: одинаковое количество ядер и потоков, 20 MB SmartCache, 8 GT/s QPI (кроме 2640V2) и количество линий PCI-E равное 40. Для оценки целесообразности тестирования всех процессоров, я обратился к результатам тестов PassMark. Ниже привожу сводный график результатов: Так как частота существенно отличается, сравнивать результаты не совсем корректно. Но несмотря на это, с ходу напрашиваются выводы: 1. 2660 эквивалентен по производительности 2620V4 2. 2670 превосходит по производительности 2620V4 (очевидно, что за счёт частоты) 3. 2640V2 проседает, а 2650V2 бьёт всех (также из-за частоты) Я поделил результат на частоту и получил некое значение производительности на 1 ГГц: Вот тут уже результаты получились более интересные и наглядные: 1. 2660 и 2670 — неожиданный для меня разбег в рамках одного поколения, 2670 оправдывает только то, что общая производительность у него весьма высока 2. 2640V2 и 2650V2 — весьма странный низкий результат, который хуже чем у 2660 3. 2630V3 и 2620V4 — единственный логический рост (видимо как раз за счёт новой архитектуры...) Проанализировав результат я решил отсеять часть неинтересных моделей, которые не имеют ценности для дальнейшего тестирования: 1. 2640V2 и 2650V2 — промежуточное поколение, и не очень удачное, на мой взгляд — убираю из кандидатов 2. 2630V3 — отличный результат, но стоит необоснованно дороже 2620V4, учитывая аналогичную производительность и, к тому же — это уже уходящее поколение процессоров 3. 2620V4 — адекватная цена (сравнивая с 2630V3), высокая производительность и, самое главное — это единственная модель 8-ядерного процессора последнего поколения с Hyper-threading в нашем списке, поэтому однозначно оставляем для дальнейших тестов 4. 2660 и 2670 — отличный результат в сравнении с 2620V4. На мой взгляд, именно сравнение первого и последнего (на данный момент) поколения в линейке Intel Xeon E5 представляет особый интерес. К тому же у нас на складе остались достаточные запасы процессоров первого поколения, поэтому для нас это сравнение весьма актуально. Стоимость серверов на базе процессоров 2660 и 2620V4 может отличаться почти до 2 крат не в пользу последних, поэтому сравнив их производительность и выбрав сервер на процессорах V1 — можно существенно сократить бюджет на покупку нового сервера. Но об этом предложении я расскажу после результатов тестирования. Для тестирования было собрано 3 стенда: 1. 2 x Xeon E5-2660, 8 x 8Gb DDR3 ECC REG 1333, SSD Intel Enterprise 150Gb 2. 2 x Xeon E5-2670, 8 x 8Gb DDR3 ECC REG 1333, SSD Intel Enterprise 150Gb 3. 2 x Xeon E5-2620V4, 8 x 8Gb DDR4 ECC REG 2133, SSD Intel Enterprise 150Gb PassMark PerformanceTest 9.0При отборе процессоров на тесты я уже пользовался результатами синтетических тестов, но сейчас интересно сравнить эти модели более детально. Сравнение сделал группами: 1-ое поколение против 4-го.Более подробный отчёт о тестировании позволяет сделать некоторые выводы: 1. Математика, в т.ч. и с плавающей точкой, в основном зависит от частоты. Разница в 100 МГц позволила 2660 опередить 2620V4 в расчётных операциях, в шифровании и компрессии (и это не смотря на существенную разницу в частоте памяти) 2. Физика и вычисления с использованием расширенных инструкций на новой архитектуре выполняются лучше, не смотря на низкую частоту 3. Ну и, разумеется, тест с использованием памяти прошёл в пользу процессоров V4, так как в данном случае соревновались уже разные поколения памяти — DDR4 и DDR3. Это была синтетика. Посмотрим что покажут специализированные бенчмарки и реальные приложения. Архиватор 7ZIPТут результаты перекликаются с предыдущим тестом — прямая привязка к частоте процессора. При этом не важно, что установлена более медленная память — процессоры V1 уверенно берут первенство частотой. CINEBENCH R15CINEBENCH — это бенчмарк для оценки рабочих характеристик компьютера для работы с профессиональной программой для создания анимации MAXON Cinema 4D.Xeon E5-2670 вытянул по частоте и побил 2620V4. А вот E5-2660, имеющий не столь видимое преимущество по частоте, проиграл процессору 4-го поколения. Отсюда вывод — этот софт использует полезные дополнения новой архитектуры (хотя возможно всё дело в памяти...), но не на столько, чтобы это было решающим фактором. 3DS MAX + V-RayДля оценки производительности процессоров при рендеринге в реальном приложении я взял связку: 3ds Max 2016 + V-ray 3.4 + реальная сцена с несколькими источниками света, зеркальными и прозрачными материалами, и картой окружения.Результаты получились схожи с CINEBENCH: Xeon E5-2670 показал самое низкое время рендеринга, а 2660 не смог обойти 2620V4. 1С: SQL/FileВ заключение тестирования прилагаю результаты тестов gilev для 1С.При тестировании базы с файловым доступом уверенно лидирует процессор E5-2620V4. В таблице приведены средние значения 20 прогонов одного и того же теста. Разница между результатами каждого стенда в случае с файловой базой была не больше 2%. Однопоточный тест базы SQL показал весьма странные результаты. Разница получилась незначительной, учитывая разную частоту у 2660 и 2670, и разную частоту у DDR3 и DDR4. Была попытка оптимизировать настройки SQL, но результаты оказались хуже, чем было, поэтому я решил тестировать все стенды на базовых настройках. Результаты многопоточного теста SQL оказались ещё куда более странными и противоречивыми. Максимальная скорость 1 потока в МБ/с была эквивалентна индексу производительности в предыдущем однопоточном тесте. Следующим параметром была максимальная скорость (всех потоков) — результат получился практически идентичным у всех стендов. Так как результаты разных прогонов сильно колебались (+-5%) — иногда они были у разных стендов с существенным отрывом как в одну так и в другую сторону. Одинаковые средние результаты многопоточного теста SQL наводят меня на 3 мысли: 1. Такая ситуация вызвана неоптимизированной конфигурацией SQL 2. SSD стал узким местом системы и не позволил процессорам разогнаться 3. Разницы между частотой памяти и процессоров под эти задачи почти нет (что крайне маловероятно) Если у Вас есть достоверные объяснения подобных результатов — прошу Вас поделиться ими в комментариях. Также оказался необъяснимым результат по параметру «Рекомендуемое кол-во пользователей». Средний результат у 2660 оказался выше всех — и это при низких результатах всех тестов. По этому вопросу также буду рад увидеть Ваши комментарии. ВыводыРезультаты нескольких разносторонних вычислительных тестов показали, что частота процессора в большинстве случаев оказалась важней поколения, архитектуры и даже частоты памяти. Безусловно есть современный софт, который использует все улучшения новой архитектуры. Например, транскодирование видео иногда производится в т.ч. с использованием инструкций AVX2.0, но это специализированное ПО — а большинство серверных приложений по прежнему привязаны к количеству и частоте ядер.Разумеется я не заявляю, что разницы между процессорами нет совсем никакой, я лишь хочу отметить, что для определённых приложений нет смысла в «плановом» переходе на новое поколение. Если Вы со мной не согласны или у Вас есть предложения для тестирования — стенды пока не разобраны, и я буду рад произвести тестирование Ваших задач. Экономическая выгодаКак я уже писал в начале статьи — мы предлагаем линейку серверов на базе процессоров Xeon E5 первого поколения, которые по стоимости существенно бюджетней серверов на E5-2620V4. Это такие же новые серверы (не путать с б/у) с гарантией 3 года.Ниже привожу ориентировочный расчет: Сервер STSS Flagman RX227.4-008LH в конфигурации 2 х Intel Xeon E5-2620V4 + 8 x 8Gb DDR4 ECC REG в розницу стоит на сегодняшний день 265065р. Аналогичная конфигурация STSS Flagman EX227.3-008LH на базе 2 х Intel Xeon E5-2660 + 8 x 8Gb DDR3 ECC REG по акции доступна за 175275р. Читатели Хабра могут получить при заказе дополнительную скидку 5%. Для этого необходимо выбрать нужный форм-фактор корпуса из списка моделей на нашем сайте. Модель EX217.3-004LH выполнена в 1U-корпусе, EX227.3-008LH — 2U, а EX240.3-008LH построена на базе корпуса Tower/4U. В конфигураторе модели можно подобрать необходимые параметры памяти, дисковой подсистемы и дополнительных устройств. При отправке заявки на расчет необходимо указать промокод HABRAHABR. Спасибо за внимание! Буду ждать Ваших комментариев и пожеланий по тестам. Написание статьи и тестирование: Usikoff Тестирование 1C: sarge74 sohabr.net Работайте эффективнее благодаря процессорам 8-го поколения — IntelЦифровая трансформация — эта важный процесс для компаний любого размера. Из-за устаревшего аппаратного обеспечения, которое снижает продуктивность работы и требует больших денежных затрат, компании могут не только потерять время и деньги, но и упустить возможную прибыль. Благодаря переходу на новые динамичные ИТ-инфраструктуры компании смогут удовлетворять требованиям, которые предъявляют новые технологии, и сохранять конкурентоспособность. Недавно корпорация Intel выпустила процессоры Intel® Core™ 8-го поколения, призванные открыть новую эпоху персональных компьютеров. В этой статье мы расскажем о восьми преимуществах процессорной технологии 8-го поколения для развития вашего бизнеса. 1) Ускорение и повышение эффективности работы сотрудников Благодаря повышенной производительности процессоров Intel® Core™ vPro™ 8-го поколения сотрудники могут работать эффективнее. Как результат, компании могут сэкономить значительное количество времени и денег. Новые процессоры с четырьмя ядрами и энергоэффективной микроархитектурой обеспечивают на 40% более высокую производительность по сравнению с аппаратным обеспечением 7-го поколения, выпущенным в прошлом году, и в 2 раза более высокую производительность по сравнению с 5-летними ПК. Преимущества этих новых процессоров, в частности, будут полезны создателям контента. Редактировать фотографии и создавать слайд-шоу можно на 48% быстрее, чем на ПК с процессором 7-го поколения. И это еще не все. Рендеринг видео с разрешением 4K на компьютерах, выпущенных 5 лет назад, занимает целых 45 минут, тогда как на ПК с процессорами 8-го поколения этот процесс занимает всего 3 минуты. 2) Безопасность сети и данных Новые процессоры поддерживают многофакторную аутентификацию, что позволяет ИТ-отделам обеспечить безопасность сетей и проводить меньше операций по сбросу паролей. Эти процессоры оснащены технологией Intel® Authenticate, которая предназначена для проверки как минимум двух факторов аутентификации. Она усиливает безопасность за пределами операционной системы для снижения риска утечки данных. Компании могут выбрать подходящие для них варианты аутентификации, которые затем будут зашифрованы и сохранены в аппаратном обеспечении. www.intel.ru Обзор процессора Intel® Core™ 6-го поколения (Skylake)ВведениеПроцессоры Intel® Core™ 6-го поколения (Skylake) появились в 2015 году. Благодаря целому ряду усовершенствований на уровне ядра, «системы на кристалле» и на уровне платформы, по сравнению с 14-нм процессором предыдущего поколения (Broadwell), процессор Skylake пользуется огромной популярностью в устройствах самых разных типов, предназначенных для работы, творчества и игр. В этой статье приводится обзор основных возможностей и усовершенствований Skylake, а также новые модели использования, такие как пробуждение по голосовым командам и вход в систему по биометрическим данным в ОС Windows* 10. Архитектура SkylakeПроцессоры Intel Core 6-го поколения производятся по 14-нм технологии с учетом более компактного размера процессора и всей платформы для использования в устройствах разных типов. При этом также повышена производительность архитектуры и графики, реализованы расширенные средства безопасности. На рис. 1 показаны эти новые и улучшенные возможности. Фактическая конфигурация в устройствах ОЕМ-производителей может различаться. Рисунок 1.Архитектура Skylake и сводка усовершенствований [1]. Основные направления развития процессоровПроизводительностьПовышение производительности напрямую обусловлено предоставлением большего количества инструкций исполняющему блоку: за каждый тактовый цикл выполняется больше инструкций. Такой результат достигается за счет улучшений в четырех категориях [Ibid].
Рисунок 2.Схема микроархитектуры ядра Skylake На рис. 3 показано улучшение параллельной обработки в процессорах Skylake по сравнению с процессорами прежних поколений (Sandy Bridge — второе, а Haswell — четвертое поколение процессоров Intel® Core™). Рисунок 3.Улучшенное распараллеливание по сравнению с прежними поколениями процессоров Благодаря усовершенствованиям, показанным на рис. 3, производительность процессора возросла на 60 % по сравнению с ПК пятилетней давности, при этом перекодирование видео осуществляется в 6 раз быстрее, а производительность графической подсистемы выросла в 11 раз. Рисунок 4.Производительность процессора Intel® Core™ 6-го поколения по сравнению с ПК пятилетней давности
Подробные результаты сравнения производительности настольных ПК и ноутбуков см. по следующим ссылкам: Производительность настольных компьютеров: http://www.intel.com/content/www/us/en/benchmarks/desktop/6th-gen-core-i5-6500.html Производительность ноутбуков: http://www.intel.com/content/www/us/en/benchmarks/laptop/6th-gen-core-i5-6200u.html Экономия электроэнергииНастройка ресурсов на основе динамического потребления В устаревших системах используется технология Intel® SpeedStep® для балансировки производительности и расхода электроэнергии с помощью алгоритма подключения ресурсов по запросу. Этот алгоритм управляется операционной системой. Такой подход неплох для постоянной нагрузки, но неоптимален при резком повышении нагрузки. В процессорах Skylake технология Intel® Speed Shift передает управление оборудованию вместо операционной системы и дает возможность процессору перейти на максимальную тактовую частоту примерно за 1 мс, обеспечивая более точное управление электропитанием[3]. Рисунок 5.Сравнение технологий Intel® Speed Shift и Intel® SpeedStep® На приведенном ниже графике показана скорость реагирования процессора Intel® Core™ i5 6200U с технологией Intel Speed Shift по сравнению с технологией Intel SpeedStep.
Дополнительная оптимизация электропитания достигается за счет динамической настройки ресурсов на основе их потребления: путем снижения мощности неиспользуемых ресурсов с помощью ограничения мощности векторных расширений Intel® AVX2, когда они не используются, а также с помощью снижения потребляемой мощности при бездействии. Мультимедиа и графикаВидеоадаптер Intel® HD Graphics воплощает целый ряд усовершенствований с точки зрения обработки трехмерной графики, обработки мультимедиа, вывода изображения на экран, производительности, электропитания, возможности настройки и масштабирования. Это весьма мощное устройство в семействе встроенных в процессор графических адаптеров (впервые появившихся в процессорах Intel® Core™ второго поколения). На рис. 6 сравниваются некоторые из этих усовершенствований, обеспечивающих повышение производительности графики более чем в 100 раз[2]. [Пиковое значение FLOPS шейдера при частоте 1 ГГц] Рисунок 6.Возможности графической подсистемы в разных поколениях процессоров Рисунок 7.Улучшение обработки графики и мультимедиа в разных поколениях Микроархитектура 9-го поколенияГрафическая архитектура 9-го поколения аналогична микроархитектуре графики 8-го поколения процессоров Intel® Core™ Broadwell (5-го поколения), но улучшена с точки зрения производительности и масштабируемости. На рис. 8 показана блок-схема микроархитектуры поколения 9[8], состоящей из трех основных компонентов.
По сравнению с 8-м поколением микроархитектура 9-го поколения отличается более высокой максимальной производительностью на 1 Вт, повышенной пропускной способностью и отдельным контуром электропитания/тактов для компонента вне среза. Это позволяет более эффективно управлять электропитанием в таких режимах использования, как при воспроизведении мультимедиа. Срез является настраиваемым компонентом. Например, GT3 поддерживает до двух срезов (каждый срез с 24 исполняющими блоками), GT4 (Halo) может поддерживать до 3 срезов (цифра после букв GT означает количество исполняющих блоков на основе их использования: GT1 поддерживает 12 исполняющих блоков, GT2 — 24, GT3 — 48, а GT4 — 72 исполняющих блока). Архитектура допускает настройку в достаточно широких пределах, чтобы использовать минимальное количество исполняющих блоков в сценариях с низкой нагрузкой, поэтому потребление электроэнергии может составлять от 4 до более чем 65 Вт. Поддержка API графических процессоров 9-го поколения доступна в DirectX* 12, OpenCL™ 2.x, OpenGL* 5.x и Vulkan*. Рисунок 8.Архитектура графических процессоров 9-го поколения Подробнее об этих компонентах см. по адресу (ссылка IDF https://software.intel.com/sites/default/files/managed/c5/9a/The-Compute-Architecture-of-Intel-Processor-Graphics-Gen9-v1d0.pdf) В число усовершенствований и возможностей обработки мультимедиа входят следующие[2]:
На рис. 9 показаны кодеки графического процессора поколения 9. Примечание. Поддержка кодеков мультимедиа и обработки может быть доступна не во всех ОС и приложениях. Рисунок 9.Поддержка кодеков процессорами Skylake В число усовершенствований и возможностей работы экрана входят следующие:
В процессорах Intel® Core™ I7-6700K предусмотрены следующие возможности для геймеров (см. рис. 10). Также поддерживается технология Intel® Turbo Boost 2.0, технология гиперпоточности Intel® и возможность разгона. Прирост производительности по сравнению с ПК пятилетней давности достигает 80 %. Дополнительные сведения см. на этой странице: http://www.intel.com/content/www/us/en/processors/core/core-i7ee-processor.html
Рисунок 10.Возможности процессоров Intel® Core™ i7-6700K МасштабируемостьМикроархитектура Skylake — это настраиваемое ядро: единая конструкция для двух направлений, одно — для клиентских устройств, другое — для серверов без ущерба для требований по мощности и производительности обоих сегментов. На рис. 11 показаны различные модели процессоров и их эффективность с точки зрения мощности для использования в устройствах разного размера и разных типов — от сверхкомпактных Compute Stick до мощных рабочих станций на основе Intel® Xeon®. Рисунок 11.Доступность процессоров Intel® Core™ для различных типов устройств Расширенные возможности безопасностиРасширения Intel® Software Guard Extensions (Intel® SGX): Intel SGX — это набор новых инструкций в процессорах Skylake, дающий возможность разработчикам приложений защищать важные данные от несанкционированных изменений и доступа посторонних программ, работающих с более высоким уровнем прав. Это дает приложениям возможность сохранять конфиденциальность и целостность конфиденциальной информации [1], [3]. Skylake поддерживает инструкции и потоки для создания безопасных анклавов, позволяя использовать доверенные области памяти. Дополнительные сведения о расширениях Intel SGX см. на этой странице: https://software.intel.com/en-us/blogs/2013/09/26/protecting-application-secrets-with-intel-sgx Расширения защиты памяти Intel® (Intel® MPX): Intel MPX — новый набор инструкций для проверки переполнения буфера во время выполнения. Эти инструкции позволяют проверять границы буферов стека и буферов кучи перед доступом к памяти, чтобы процесс, обращающийся к памяти, имел доступ лишь к той области памяти, которая ему назначена. Поддержка Intel MPX реализована в Windows* 10 с помощью встроенных функций Intel MPX в Microsoft Visual Studio* 2015. В большинстве приложений C/C++ можно будет использовать Intel MPX: для этого достаточно заново скомпилировать приложения, не изменяя исходный код и связи с устаревшими библиотеками. При запуске библиотек, поддерживающих Intel MPX, в системах, не поддерживающих Intel MPX (процессоры Intel® Core™ 5-го поколения и более ранних), производительность никак не изменяется: ни повышается, ни снижается. Также можно динамически включать и отключать поддержку Intel MPX [1], [3]. Мы рассмотрели усовершенствования и улучшения архитектуры Skylake. В следующем разделе мы рассмотрим компоненты Windows 10, оптимизированные для использования преимуществ архитектуры Intel® Core™. Новые возможности Windows 10Возможности процессоров Intel Core 6-го поколения дополняются возможностями операционной системы Windows 10. Ниже перечислены некоторые основные возможности оборудования Intel и ОС Windows 10, благодаря которым платформы Intel® под управлением Windows 10 работают эффективнее, стабильнее и быстрее[3]. Ϯ Ведется совместная работа Intel и Майкрософт для реализации дальнейшей поддержки в Windows. Рисунок 12.Возможности Skylake и Windows* 10 КортанаГолосовой помощник Кортана корпорации Майкрософт доступен в Windows* 10 и дает возможность управлять компьютером с помощью голоса после произнесения ключевой фразы «Привет, Кортана!». Функция пробуждения по голосовой команде использует конвейер обработки звука на ЦП для повышения достоверности распознавания, но можно передать эту функцию на аппаратный цифровой сигнальный процессор звука со встроенной поддержкой Windows 10[3]. Windows Hello*С помощью биометрического оборудования и Microsoft Passport* служба Windows Hello поддерживает различные механизмы входа в систему с помощью распознавания лица, отпечатков пальцев или радужки глаз. Система без установки каких-либо добавочных компонентов поддерживает все эти возможности входа без использования пароля. Камера переднего обзора Intel® RealSense™ (F200/SR300) поддерживает биометрическую проверку подлинности на основе распознавания лица[3]. Рисунок 13.Windows* Hello с технологией Intel® RealSense™ Фотографии на рис. 13 показывают, как реперные точки, обнаруженные на лице камерой F200, используются для идентификации пользователя и входа в систему. На основе расположения 78 реперных точек на лице создается шаблон лица при первой попытке пользователя войти в систему с помощью распознавания лица. При следующей попытке входа сохраненное расположение реперных точек, полученное камерой, сравнивается с сохраненным шаблоном. Возможности службы Microsoft Passport в сочетании с возможностями камеры позволяют добиться уровня безопасности с показателями ложного допуска в систему в 1 из 100 000 случаев и ложного отказа в допуске в 2–4 % случаев. Ссылки
software.intel.com Тест пяти поколений процессоров Intel Core: Broadwell, Haswell, Ivy Bridge, Sandy Bridge и NehalemИдея сравнения производительности процессоров разных поколений в одном тесте не является чем-то новым, достаточно вспомнить мой скромный труд трёхлетней давности. Однако деятелям с Hardware.info удалось наглядно показать разницу между пятью (!) поколениями "камушков" Intel.
Для начала нам показывают схему Tick/Tock, по которой Intel выпускала свои процессоры с 2006 года по сей день:
А вот список решений, которые будут представлять свою архитектуру в тестах ниже:
Парочка графиков из полной версии материала, остальное я рекомендую читать по ссылке:
Определённо, в тестах не хватает новеньких Skylake, но и без них материал получился весьма познавательным. Удивительно, но спустя столько лет после выхода Sandy/Ivy Bridge до сих пор более чем актуальны, даже Nehalem вовсю используется с современными видеокартами для игр с комфортом и других развлечений. Ждём Cannonlake ?
Добавить комментарийwww.u-sm.ru |
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
© All rights reserved | Карта сайта
|