Двухъядерные процессоры Intel




 

Первые двухъядерные процессоры Intel были основаны на ядре Smithfield, которое является ничем иным, как двумя ядрами Prescott степпинга E0 объединенными на одном кристалле. Между собой ядра взаимодействуют через системную шину при помощи специального арбитра. Соответственно размер кристалла достиг 206 кв. мм., а количество транзисторов увеличилось до 230 миллионов.

Интересное рассмотреть как реализована технология HyperThreading в двухъядерных процессоров на ядре Smithfield. Так у процессоров Pentium D поддержка этой технологии полностью отсутствует. Маркетологи Intel посчитали, что два "реальных" ядра вполне достаточно для большинства пользователей. А вот в процессоре Pentium Extreme Edition 840 она включена, и благодаря этому процессор может исполнять 4 потока команд одновременно. Кстати, именно поддержка HyperThreading является единственным отличием процессора Pentium Extreme Edition от Pentium D. Все остальные функции и технологии полностью одинаковы. Среди них можно выделить поддержку набора команд EM64T, технологии энергосбережения EIST, C1E и TM2, а также функцию защиты информации NX-bit. В результате разница между процессорами Pentium D и Pentium EE является полностью искусственной.

Перечислим модели процессоров на ядре Smithfield. Это Pentium D с индексами 820, 830 и 840 а также Pentium Extreme Edition 840. Все они работают на частоте системной шины 200 МГц (800QPB), выпущены по 90нм техпроцессу, имеют штатное напряжение питания (Vcore) 1,25-1,388 В, максимальное тепловыделение ~130 Вт (хотя по некоторым оценкам тепловыделение EE 840 находится на уровне 180 Вт).

Честно говоря, каких-либо положительных сторон у процессоров на ядре Smithfield я не обнаружил. Основная претензия заключается в уровне производительности, когда во многих приложениях (которые не оптимизированы под многопоточность) двухъядерные процессоры Smithfield проигрывают одноядерным Prescott, работающих на той же тактовой частоте. При этом у процессоров AMD такой ситуации нет. Очевидно проблема кроется во взаимодействии ядер через процессорную шину (при разработке ядра Prescott не было предусмотрено масштабирование производительности путем увеличения количества ядер). Возможно именно по этой причине, компания Intel решила скомпенсировать недостатки более низкой ценой. В частности ценник на младшую модель Pentium D 820 был установлен на уровне ~260$ (самый дешевый Athlon X2 стоит 340 $).

Кстати, модель Pentium D 820 несовместима со всеми материнскими платами на чипсете nForce4 SLI Intel Edition (операционная система не видит второе ядро). Проблема кроется в самом чипсете и nVidia официально признала данный факт. Кроме того, в интернете встречались сообщения о несовместимости более старших моделей (но это были единичные случае с отдельными конфигурациями). Тут же отметим, что новый чипсет nForce4 SLI Х16 Intel Edition избавлен от этой проблемы.

Потенциал разгона у процессора на ядре Smithfield оказался не очень высоким. Стабильная работа системы сохранялась только при тактовой частоте не превышающей 3,25 ГГц.

Справедливости ради отметим, что данный процессор запускался на частоте 3,8 Ггц, и при использовании более эффективной системы охлаждения можно было бы достичь стабильной работы.

Забегая вперед отметим, что это все "цветочки" по сравнению с разгонным потенциалом 65нм процессоров.

Что касается совместимости, то процессоры на ядре Smithfield потенциально могут быть установлены в любую LGA775 материнскую плату. Однако эти процессоры имеют повышенные требования к модулю питания платы. Подводя итоги, можно сказать что процессоры на ядре Smithfield являются неудачным продуктом. Однако, разговор о двухъядерных процессорах Intel мы не заканчиваем, ибо под конец 2005 года компания успешно перешла на новейший 65нм техпроцесс, а в начале 2006 года на прилавках магазинов (по традиции впервые это случилось в Японии) появились первые процессоры на ядре Presler и Cedar Mill.

Что же дает новый, более "тонкий" техпроцесс? Если кардинально не менять архитектуру ядра, но новый техпроцесс позволяет уменьшить площадь ядра (т.е. увеличить количество процессоров на одной пластине, и тем самым снизить себестоимость), уменьшить энергопотребление (соответственно - тепловыделение) и повысить тактовые частоты. Впрочем, два последних параметра взаимосвязаны: если мы не увеличиваем частоту, то получаем процессор с меньшим тепловыделением. Если же не изменяем энергопотребление, то получаем процессоры с более высокими частотами.

Инженеры компании Intel выбрали именно второй путь - официальное тепловыделение осталось на уровне 130 Вт, что позволило увеличить тактовые частоты до значения 3,4 ГГц и 3,46 ГГц. Причем как показали наши опыты с разгоном, потенциал 65 нм техпроцессора очень велик, и по мере усовершенствования и оптимизации техпроцесса рост тактовых частот будет продолжен (вплоть до перехода на совершенно новую процессорную архитектуру).

Что касается процессорного ядра Presler, то подчеркнем те технические моменты, которые отличают их от ядра Smithfield. Самый главный факт - на одном ядре Presler размещены два ядра Cedar Mill, которое является ничем иным как ядром Prescott 2M выпущенным по 65нм техпроцессу (у ядра Smithfield два "обычных" ядра Prescott). Тем самым инженеры Intel воспользовались преимуществом 65 нм техпроцесса, который позволяет либо уменьшить площадь кристалла либо увеличить кол-во транзисторов.

Впрочем такое описание ядра Presler не совсем корректно. Дело в том, что под крышкой теплораспределителя можно обнаружить два отдельных процессорных ядра, тогда как Smithfield представлял собой единое ядро (хотя внутри существовало разделение между ядрами). Таким образом значительно улучшается эффективность производства: появляется возможность для производства одного 2х-ядерного процессора использовать ядра с разных участков пластины (или даже с разных пластин). Кроме того, из-за модульной архитектуры повышается уровень выхода годных кристаллов (причем условно "негодные" можно отмаркировать как процессоры Pentium D:).

Внешний вид процессора с лицевой стороны ничем не отличается от других LGA775 процессоров. А с обратной стороны есть различия в расположении элементов:

Итак, новые двухъядерные процессоры на ядре Presler получили наименование Pentium D с индексами 920 - 950. Кроме того, был выпущен процессор Pentium Extreme Edition 955 с включенной технологией HyperThreading и работающий на частоте системной шины = 266 МГц (1066QPB). Для того, что бы читатель не запутался во всех представленных процессорах, мы сведем их характеристики в единую таблицу:

 

Наименование Степпинг ядра Тактовая частота Частота шины (FSB) Объем кеш-памяти L2 HyperThreading Поддержка виртуализации
Pentium D 820 Smithfield 2800Мгц 800Мгц 2 x 1Мб Нет Нет
Pentium D 830 Smithfield 3000Мгц 800Мгц 2 x 1Мб Нет Нет
Pentium D 840 Smithfield 3200Мгц 800Мгц 2 x 1Мб Нет Нет
Pentium Extreme Edition 840 Smithfield 3200Мгц 800Мгц 2 x 1Мб Да Нет
Pentium D 920 Presler 2800Мгц 800Мгц 2 x 2Мб Нет Да
Pentium D 930 Presler 3000Мгц 800Мгц 2 x 2Мб Нет Да
Pentium D 940 Presler 3200Мгц 800Мгц 2 x 2Мб Нет Да
Pentium D 950 Presler 3400Мгц 800Мгц 2 x 2Мб Нет Да
Pentium Extreme Edition 955 Presler 3466Мгц 1066Мгц 2 x 2Мб Да Да

 

Несколько слов про совместимость новых процессоров с материнскими платами. Официально новые процессоры на ядре Presler с частотой шины 1066 МГц совместимы только с материнскими платами на новейшем чипсете i975X. Однако каких-либо принципиальных ограничений на работу с платами на других чипсетах с поддержкой такой шины (i945P, i955X и nForce4 SLI (x16) Intel Edition) нет. Главное, что бы модуль питания платы был рассчитан на соответствующие нагрузки, а версия биоса корректно распознавала новый процессор. В частности, мы без проблем запустили процессор Pentium Extreme Edition 955 на материнской платы Asus P5WD2 Premium, которая основана на чипсете i955X.

Что касается процессоров с частотой шины 800Мгц (ядра Presler и CedarMill) то в большинстве случаев они заработают на всех материнских платах поддерживающих эту шину.

Теперь поговорим о разгоне. Также как и у процессоров AMD, у процессоров производства Intel множитель заблокирован в сторону увеличения. Но на тестовом процессоре Pentium Extreme Edition 955 он оказался полностью разблокирован (от 12 до 60) что дало нам возможность оценить потенциал 65нм ядра без влияния остальных компонентов системы (прежде всего чипсета и памяти, которые работали в штатных режимах). Итак, без повышения напряжения ядра процессор с легкостью взял частоту 4,0 ГГц, а с незначительным увеличением Vcore процессор работал совершенно стабильно на частоте 4,26 ГГц.

Еще совсем недавно двухъядерные процессоры в домашнем компьютере оставались уделом отдельных энтузиастов и профессионалов, работающих с ресурсоемкими приложениями. Это было обусловлено достаточно высокой ценой двухпроцессорных систем и тем, что большинство обычных программ ничего не выигрывали от наличия второго ядра.

Возник закономерный вопрос: а есть ли на данный момент польза от второго ядра? Вот в этом мы и попытаемся сейчас разобраться. Начнем с теории. Прежде всего отметим, что многоядерность должна поддерживаться операционной системой, при этом каждое ядро определяется как отдельный процессор. Windows 2000/ХР, в отличие от более старых, но все еще местами используемых Windows 98/Me, обеспечивает полную поддержку многоядерных процессоров. Заметим, что Windows XP Home Edition не стоит особняком от родственных систем: несмотря на то что изначально для данной ОС была заявлена поддержка только одного процессора (а значит, второе ядро не имело шансов работать), под давлением AMD Microsoft несколько изменила лицензионную политику для указанной ОС, произведя регистрацию процессоров по количеству разъемов на материнской плате, а не по количеству ядер.

Далее возможность увеличения быстродействия при наличии второго ядра зависит от самого приложения. Естественно, говорить о приросте производительности имеет смысл, когда программе не хватает возможностей одного ядра, но не только в этом случае. Напомним, что процессоры AMD поддерживают фирменную технологию Cool'N'Quiet, которая позволяет понижать частоту CPU при низкой нагрузке на него, уменьшая тем самым потребление энергии и тепловыделение, благодаря чему снижается скорость вращения кулера во время работы. При наличии двухъядерного чипа и приложения с его поддержкой в некоторых случаях возможна ситуация, когда производительности достаточно даже на небольших частотах, а обычный CPU, выполняя ту же задачу, будет вынужден функционировать на максимальной частоте. Еще заметим, что повышение скорости осуществимо даже при отсутствии поддержки многоядерности со стороны программы, если она создает в ходе работы достаточно большое количество потоков (threads), и планировщик системы распределяет их по разным ядрам или в случае ее взаимодействия с другой программой (или драйвером), поддерживающей многопроцессорность.

Как мы тестировали?

 

Перейдем теперь к методике тестирования. В качестве представителя двухъядерных процессоров мы выбрали популярный AMD Athlon 64 X2 3800+ для сокета AM2, а в противовес ему взяли AMD Athlon 64 3500+ AM2 (на момент тестирования в наличии не было равного по частоте AMD Athlon 64 3200+ AM2). В первую очередь тесты проводились на штатной для X2 3800+ частоте в 2 GHz (соответственно, для получения этой частоты у 3500+ был уменьшен множитель с 11 до 10). Дополнительно мы решили исследовать производительность на 1,8 GHz (такой показатель имеет обычный AMD Athlon 64 3000+), понизив множитель обоих процессоров до 9; и при разгоне до 2,6 GHz (при множителе 10 и частоте задающего генератора в 260 MHz), чтобы проверить, не окажется ли узким местом видеокарта при достаточной частоте CPU. С сожалением отметим, что во время тестирования процессоров на частоте 2 GHz память работала в режиме 533 MHz, вместо положенных 667 MHz, что несколько занизило результаты в указанном режиме.

Набор игр, использованных для измерения показателей производительности, достаточно стандартен. Они делятся на две группы – те, в которых заявлена поддержка двухъядерности (сюда относятся Quake 4, F.E.A.R, Serious Sam 2 и Call Of Duty 2), и те, для которых она не заявлена (Far Cry, DOOM 3, Need for Speed: Most Wanted, TES IV: Oblivion). Отметим, что игры первой группы изначально не поддерживали два ядра, нужная функциональность была впоследствии добавлена обновлениями. Кроме этого, получены результаты и в достаточно популярных бенчмарках 3DMark05 и 3DMark06.

Поскольку уже давно ведутся разговоры об использовании компьютера в качестве универсального центра развлечений, на котором одновременно «крутятся» и фильмы, и музыка, и игры, был проведен еще один эксперимент – в свойствах видеокарты мы включили вывод на телевизор и при этом запускали воспроизведение видео на нем плюс бенчмарк в Far Cry (средней по сегодняшним меркам игры). По причине ограниченного времени тестирования данный эксперимент проводился только для двух типов видеороликов – обычной записи в формате MPEG4 с разрешением 720×480 (обозначение в таблице – SDTV) и видео высокой четкости стандарта H.264 в разрешении 1920×1080 (соответственно – HDTV).

Игровые бенчмарки

 

Рассмотрим полученные результаты. В первую очередь отметим увеличение скорости в тех играх, где оно не ожидалось, а именно, в Far Cry и DOOM 3. Тут стоит вспомнить заявление компании NVIDIA, что ее драйверы, начиная с серии 8х.хх, поддерживают ускорение на двухъядерных процессорах, и, видимо, данное повышение производительности связано с ними. С другой стороны, в Need for Speed: Most Wanted ускорение вообще не зафиксировано, несмотря на рост показателей fps c увеличением частоты. Следовательно, напрашивается предположение, что, как и в случае с технологией SLI, ощутимая прибавка скорости будет достигнута только при дополнительной доработке драйверов под каждую конкретную игру, а значит, в общем случае на автоматическое ускорение рассчитывать не стоит. В Call of Duty 2, невзирая на отсутствие прироста производительности, поддержка двухъядерников есть, и она работает, что было видно из графиков загрузки CPU во время тестов. То же самое касается и TES IV: Oblivion – хотя поддержка многоядерности не заявлена (и результаты с учетом большой погрешности бенчмарка на разных процессорах близки), игра создает много потоков, которые достаточно адекватно распределяются системой по разным ядрам. Противоположная картина наблюдается в F.E.A.R. – несмотря на заявленную поддержку, никаких следов двухъядерности обнаружить не удалось. Более того, если изучить показатели загрузки ядер в ходе тестирования, то игра ведет себя так, будто она жестко привязана к одному из них, загружая его на 100%, в то время как второй используется лишь на 3–10%. Встроенный бенчмарк безразлично отнесся к добавлению второго ядра, а попытка снять показатели производительности внутри игры с помощью утилиты Fraps завершилась неудачей – средний fps от прогона к прогону колебался в пределах 63–90 fps, что дает абсолютно неприемлемую погрешность. Результаты в Quake 4 и Serious Sam 2 в особых комментариях не нуждаются, заявленная поддержка есть и работает, уменьшение прироста производительности с увеличением разрешения вызвано нехваткой мощности графического акселератора; естественно, на более быстрой видеокарте ускорение будет и в тяжелых видеорежимах.

Игры плюс видео

 

Отдельно прокомментируем параллельное выполнение двух ресурсоемких приложений. Как видно, при запуске обычного видео в MPEG4 производительности даже одноядерного процессора в целом достаточно для одновременной игры и просмотра фильма. Единственное замечание – при загрузке уровня в Far Cry изображение на телевизоре начинало подтормаживать, однако при разгоне до 2,6 GHz указанная проблема полностью исчезала. На двухъядернике таких затруднений не было даже при минимальной частоте. С очень ресурсоемким HDTV-роликом в разрешении 1080p ситуация кардинально меняется – на одноядерном процессоре и с разгоном невозможно нормально играть, параллельно смотря видео, на двухъядерном же на штатной частоте fps в игре достаточно высок, однако наблюдались подтормаживания и рассинхронизация звука/видео у выводимого на телевизор изображения. Повышение частоты процессора избавляет от данной проблемы, но тестирование проводилось не в самой ресурсоемкой из современных игр: при запуске в паре с HDTV-видео Quake 4 или TES IV: Oblivion производительности даже разогнанного двухъядерника недостаточно. Вероятно, ситуацию изменят процессоры Core 2 Duo от фирмы Intel, это можно будет проверить в дальнейшем. Еще необходимо заметить, что для одновременной игры и просмотра фильма требуются две звуковые карты: первая станет отвечать за звук в игре, вторая – за звук в фильме.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2019-08-20 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: