Процессоры AMD седьмого поколения (K7)




Содержание

 

Введение

1. Процессоры AMD седьмого поколения (K7)

2. Общие сведения о процессоре AMD Athlon (Thunderbird)

2.1 Основные свойства архитектуры процессора AMD Athlon™

2.2 Характеристики процессора AMD Athlon

3. Архитектура процессора AMD Athlon (Thunderbird)

3.1 Микроархитектура

3.2 Системная шина

3.3 Блок операций с плавающей точкой

3.4 Расширенные возможности технологии 3DNow!™

3.5 Архитектура КЭШа

3.6 DDR память

4. Возможности следующего поколения компьютеров

Список источников

Приложение

 


Введение

 

К7 - первый из семейства микропроцессоров х86 7-го поколения, в котором присутствуют конструктивные решения, до сих пор не применявшиеся в процессорах архитектуры х86 и сулящие выигрыш в быстродействии даже при одинаковых тактовых частотах. Наиболее впечатляющим из них является, конечно, 200-мегагерцовая системная шина, однако есть и другие, менее заметные на первый взгляд новшества, ставящие К7 выше процессоров 6-го поколения.


Процессоры AMD седьмого поколения (K7)

 

K7 - первые процессоры, выпущенные на платформе PC, которые не только вывели AMD на уровень действительно достойного и мощного конкурента Intel, но и на длительное время стали признанными лидерами по производительности. Архитектура принципиально отличаются от Intel, которая уперлась в свой Slot1 и решила давить конкурентов, никого на него ни в коем случае не пуская. В результате AMD разработала свой интерфейс и в альянсе с VIA Technoliges, а в последствии и с nVidia обеспечила быструю и надежно работающую гибкую связку процессор + чипсет. Это был абсолютно новый кристалл следующего поколения, с тщательно переработанной и проработанной архитектурой. На этот раз особенно впечатлял своими показателями как раз блок арифметики с палавающей запятой (FPU): для него использовалось 3 независимых полностью автоматизированных конвейера, один из которых обеспечивал взаимодействие регистров с памятью (что сильно повышает среднюю производительность), а два других (сложения и умножения) могли одновременно обрабатывать инструкции (их подача осуществлялась конвейерно, в отличии от FPU K6). При этом пиковая производительность при, скажем, 500MHz составляет 1000 Mflops (когда обрабатываются 2-е инструкции за такт). AMD в качестве маркетинговой политики продвигала тезис о том, что конвейер у Athlon меньше (соответственно команды выполняются быстрее), а инструкций за такт больше.

Также был сильно увеличен объем кэш-памяти L1 - 128 Кбайт (по 64 Кбайт для инструкций и данных). Кэш-память L2 - 512 Кбайт, первое время работала на 1/2, 2/5 или 1/3 частоты процессора. Чем тактовая частота процессора выше, тем на относительно меньшей частоте работал кэш процессора "благодаря" вот этим самым делителям. В следствии чего ядро было в скором времени переделано. Был эффективно переработан интерфейс с L2, причем без дублирования данных L1, т.е. размер кэша для процессора суммировался, в отличии от Intel. Осуществлен механизм двойной независимой шины - по отдельному каналу на кэш и на оперативную память. Изменения также коснулись и SIMD блока. Были добавлены 24 новые инструкции, из них 19 для улучшения целочисленного блока MMX и работы с потоковыми данными, а еще 5 - для обработки инструкций DSP (digital signal processor), которые используются в таких программах, как MP3, Dolby Digital, а также в программных модемах. Дополненный набор был именован как "Enhanced 3DNow!". Процессорная шина взята от небезызвестной Alpha - EV-6. Тактовая частота 100 МГц с эффективной частотой передачи данных 200 МГц (упрощенно: по 100 МГц в обе стороны). Процессор поддерживает набор инструкций MMX и расширенный по сравнению с K6-III набор 3DNow!. Форм-фактор - Slot A, а затем и Socket A, который используется по сей день. К7 получил гордое наименование Athlon. Были выпущены модели 500-1000 МГц. Ядро K75 (Slot A, 0,25мкм) - алюминиевые соединения, K76 (Socket A, 0,18, 0,13мкм) и последующие - медные. Терминология процессоров AMD

Теперь пробежимся по терминологии процессоров AMD, ну а что бы не было скучно - продолжим сравнение с линией Intel. Athlon - наименование процессоров, созданных на основе архитектур K7, К75, К76, Thunderbird, Palomino, Thoroughbred и Barton в вариантах Slot A и Socket A (Socket 462). Высокопроизводительные процессоры, ориентированные на сектор рабочих станций с большим быстродействием. При этом изначально цена у них была ниже чем у PIII (в то время - Coppermine), а производительность заведомо выше. Ценовая тенденция сохранилась и до настоящего момента:) Argon - Первое ядро семейства K7. Выпускался по технологии 0,25 мкм от 500-650 МГц. Имел кэш память L2 512 Кб, работающую на половине частоты процессора. Был предназначен для Slot A. Thunderbird - кодовое название 2-го ядра процессоров Athlon, выпущенных по технологии 0,18 мкм с использованием технологии медных соединений. На чипе интегрированы 256 Кбайт полноскоростного эксклюзивного кэша L2 (что решило проблему медленного L2 в первых Athlon). В качестве переходного варианта камень некоторое время выпускался в модификации для Slot A. Однако основным форм-фактором является все же Socket A. Модель с частотой 1,33 ГГц демонстрирует большую производительность на офисных задачах, чем процессор Intel Pentium IV с частотой 1,7 ГГц. Технологический потенциал ядра Thunderbird предоставляет возможность выпуска изделий с частотой до 1,4 ГГц. Однако достойную конкуренцию PIV с его "бешеными мегагерцами" составил кристалл с существенно обновленным ядром… Palomino - кодовое название 3-го ядра процессоров Athlon XP, принявший эстафетную палочку AMD от Thunderbird. C этого ядра AMD, следуя своим традициям, ввела так называемый PR рейтинг, который вместо реальной тактовой частоты указывает некий индекс, сопоставимый с производительностью P4. (т.е. 1500+ по производительности, с точки зрения AMD соответствует P4 1500, даже немного быстрее:)), хотя его реальная тактовая частота состовляла 1333 МГц). Было произведено несколько незначительных изменений, а результат получился весьма интересным. Первое: обновлен набор SIMD команд, добавлен SSE. Правда, только первая версия (насчет второй с Intel не договорились?), полученный блок называли 3Dnow! Professional. Впрочем, в то время не так много программ были оптимизированны под SSE (ну а SSE2 использовали еще меньше), к тому же не все из них были способны распознать процессорную поддержку (что больше говорит о кривости программ - как правило, они используют старый способ определения поддерживаемости каких-либо инструкций - по CPUID. Естественно, не-интеловские процессоры при таком "технологичном" запросе ничего не говорят, да, собственно, и не обязаны). В любом случае, это шаг в сторону программной совместимости, что вообще-то приятно - нет необходимости волноваться о специальной поддержке в конкретном приложении и медленной работе в случае ее отсутствия. Да и дополнительная производительность в некоторых приложениях с переходом с "обыкновенного" Athlon на XP хоть и иногда, но будет заметна (при поддержке SSE). Тем более, такие бренды, как Adobe (Photoshop etc), с такой поддержкой обычно не затягивают. А в последнее время производители софта стали предусматривать поддержку не только первого, но и второго SSE. Забегая немного вперед, отмечу поддержку SSE2 в поколении AMD K8. Кэш у Palomino экслюзивный, то есть данный в кэше L1 и L2 не дублируются. Дополнительно была реализована опережающая загрузка инструкций в кэш L1, а заодно и механизм TLB (Translation Look-aside Buffer) - кэширование адресов команд и данных (а не их самих), причем приоритет выставлен в пользу данных. С указанной предварительной загрузкой инструкций - выглядит весьма стройным и красивым решением… Улучшен блок предсказания ветвлений что повышает производительность практически во всех приложениях. Хотелось бы также замолвить пару слов про реанимированный Pentium Rating (PR). Для начала просто список приложений, с помощью которых специалисты из AMD его считали. Приложения бизнес класса (офисное ПО): · Business Winstone 2001 · SYSmark 2001 Office Productivity Графика и мультимедиа: · Content Creation Winstone 2001 · SYSmark 2001 Internet Content Creation Игры и игровые бенчмарки: · 3D WinBench 2000 · 3DMark 2001 · Aquamark · Half-Life · Expendable · Quake III · DroneZ · Unreal Tournament · Evolva · MDK2 · Serious Sam В отличие о первого введения PR, здесь это уже не просто рекламный ход, как для К5, но вполне информативный параметр. По 2 теста на разные виды деловых приложений и 11 игровых программ! Роскошно! При этом AMD еще проводит аудит этих своих тестов, и в общем, похоже, она действительно хочет быть объективной, а не только казаться таковой. Кроме того AMD для справки честно объявила настоящие частоты для своих процессоров (таблица приведена далее). Резюмируем: Palomino - высокопроизводительный кристалл с большим количеством высокотехнологических новшеств, и если по "мускулатуре" (частотам и объему кэша) PIV время от времени и урывками выпрыгивает в лидеры гонки, то AMD уж точно можно давать приз за оригинальность исполнения, причем без ущерба производительности. Thoroughbred - кодовое название 4-го ядра процессоров Athlon XP. Никакими новыми функциями по сравнению с Palomino он не обладает. Это "подопытный" AMD, именно на нем она впервые испытала новый техпроцесс 0,13 мкм. В настоящее время выпускается от 1700+ до 2800. Благодаря технологии 0,13 мкм стали доступны более высокие частоты. Топовая модель Throughbred имеет реальную тактовую частоту 2233 при работе FSB - 333 МГц. Это позволяет реально приблизиться к основному конкуренту - P4. Преимущества "более микронной" технологии следующие: уменьшается площадь ядра - следовательно, увеличивается простор для добавления каких-либо микросхем, например кэша (Northwood (512) по сравнению с Willamette (256) - пример от Intel), уменьшается напряжение питания ядра, соответственно уменьшается тепловыделение, и, наконец, открывается возможность увеличивать тактовые частоты, в том числе потому, что микросхемы находятся ближе друг к другу и сигнал проходит быстрее. В общем, такой ход - логичен и ожидаем, и анонс этой "внутренней кухни" многое говорит о перспективах развития конкретного семейства. В настоящее время можно встретить модели от 1700+ до 2700+, процессоры с более высоким рейтингом, как правило, имеют больший объём кэша, это уже Barton (младшая модель Barton 2500+). Следует также отметить великолепный разгонный потенциал 0,13мкм AMD. Начиная с Thoroughbred, наконец убрали "принудительную честность", выраженную в виде заблокированного множителя частоты процессора (что повсеместно присутствует у Intel). Теперь, когда множитель разблокирован, если это предусмотрено возможностями материнской платы, умножение по умолчанию можно запросто поменять. Например, если очень постараться, использовать качественную мать, грамотно подойти к напряжению и охлаждению, то некоторые модели Thoroughbred 1700+ разгоняются аж до 2900+ (по данным www.overclockers.ru). Верхние модели Throughbred с относительно низкой тактовой частотой вполне реально приближаются к основному конкуренту - P4. Для иллюстрации изменений посмотрим таблицу с тремя представителями каждого ядра:

 

Модель Тактовая частота, МГц Площадь ядра, мм2 Напряжение питания ядра, В Максимальная мощность тепловыделения, Вт
AMD Athlon XP (Palomino) 1900+     1,75 68,1
AMD Athlon XP (Palomino) 2000+   1,75 70,0
AMD Athlon XP (Palomino) 2100+   1,75 71,9
AMD Athlon XP (Thoroughbred) 2000+     1,60 60,3
AMD Athlon XP (Thoroughbred) 2100+   1,60 62,1
AMD Athlon XP (Thoroughbred) 2200+   1,65 68,0

 

Максимальные частоты (в смысле рейтинг частоты) Thoroughbred в настоящее время дошли до 2800+, выпущена новая версия ядра - степпинг 1(B). Доработаны недочеты начального варианта, уменьшена мощность тепловыделения, повысилась надежность и стабильность работы, что позволяет в большинстве тестов успешно конкурировать с PIV, в связи с чем AMD несколько поменяло политику своего PIV рейтинга, вот частотная таблица (обновленна в декабре 2003 года, указаны все модели Athlon XP на тот момент):

 

Рейтинг Кэш L2. Кб Множитель / FSB / МГц Palomino T-bred A T-bred B Barton
3200+   11*200 = 2200 X
3000+   10.5*200 = 2100 X
3000+   13*166 = 2167 X
2800+   12.5*166 = 2083 X
2800+   13.5*166 = 2250 X
2700+   13*166 = 2167 X
2600+   11.5*166 = 1917 X
2600+   12.5*166 = 2083 X
2600+   16*133 = 2133 X
2500+   11*166 = 1833 X
2400+   15*133 = 2000 X
2200+   13.5*133 = 1800 X X
2100+   13*133 = 1733 X X X
2000+   12.5*133 = 1667 X X X
1900+   12*133 = 1600 X X X
1800+   11.5*133 = 1533 X X X
1700+   11*133 = 1466 X X X
1600+   10.5*133 = 1400 X
1500+   10*133 = 1333 X

 

Поскольку при все большем увеличении частоты производительность растет все меньше и меньше, с версии 2400+, можно увидеть большее увеличении частоты, чем выводится из общей формулы AMD для процессоров с маркировкой XP. Должно бы быть 1800+2*66=1933 МГц, а реально 2000. И немного по другому: разница между 2600+ и 2700+ всего 33MHz, однако переход на 166 МГц шину позволяет увеличить рейтинг при такой малой разницы частоты. Все это в очередной раз свидетельствует о честном подходе AMD к данному рейтингу как к показателю реальной производительности процессора, а не к пустым ничего не значащим цифрам. Barton - кодовое название 5-го ядра процессора Athlon XP. Отличает Barton от Throughbred кэш-память второго уровня 512 кб и шина 333 (400). Будут выпускаться от 2500+, 2800+, 3000+ 3200+ (шина 400 МГц). До 3500+ (если будут:)). Больше отличий нет.

Посмотрите, ядро Barton (справа) немного удлинено из-за большего объёма кэша:

Частотная политика AMD реализованная в модельном ряде Barton представляется мне несколько сомнительной. Выпущен кристалл с рейтингом 3000+, реальная частота которого 2167. Такая же частота у Thoroughbred 2700+, а у 2800+ частота уже выше(2233MHz). Получается что Barton 3000+, хоть и быстрее предыдущей модели 2800+, но не строго. Потому что с увеличением кэша, увеличение быстродействия во многом зависит и от приложения, а иногда его может не наступить вообще. В отличии от всех предыдущих моделей, когда при увеличении рейтинга, увеличивалась и частота. А при увеличении частоты производительность увеличивается всегда. Соответственно росло и быстродействие всей линейки, пусть и не равномерно, особенно с учётом разгона по частоте с 133 на 166 на последних моделях. Но - постоянно, от модели к модели. А теперь, с учётом того, что у 2800+ частота выше, возможно в некоторых приложениях он окажется даже быстрее. Впрочем основные усилия AMD сосредотачивает на K8, а модельный ряд К7, с надрывом достигает возможных и невозможных для него пределов, повторяя историю К6. Кстати и увеличение кэша до 512Мб погоды не делает - в случае большого потока данных кроме кэша ещё необходима быстрая связь с контроллером памяти (как впрочем и с остальными устройствами), а шина FSB (процессор-северный мост, через который процессор может соединяться со всеми устройствами, в том числе и с контроллером памяти) обладает пропускной способностью всего 2700Мб/с (при 166МГц, результирующая - 333 МГц), чего явно не достаточно. Добавленно декабрь 2003: для сравнения у Intel с 800MHz шиной пропускная способность состовляет 6400Мб/с. Чем больше частота процессоров AMD, тем более сказывается эффект узкой шины. Thorton - кодовое название 6-го ядра процессора Athlon XP. Это ядро завершает всю линейку K7. Младший брат ядра Barton комплектуется кэш-памятью второго уровня 256 Кб. Возможно появление таких процессоров с рейтингом от 3000+ и выше. Поддерживает технологию как и Athlon XP Barton "Bus Disconnect", которая в случае перегрева отключает процессор от системной шины. Duron - семейство процессоров K7, ориентированных на сектор компьютеров Low-End. Являются конкурентами процессоров Celeron, однако обладают меньшей ценой и большей производительностью при равных рабочих частотах. Построены на варианте ядра Thunderbird с урезанной до 64 Кбайт кэш-памятью L2. Выпускаются только в форм-факторе Socket A. Spitfire - кодовое название 1-го ядра Duron. Основано на ядре Thunderbird с урезанным в 4 раза кэшем 2-го уровня.

Morgan - кодовое название 2-го ядра Duron. Основано на ядре Palomino с урезанным в 4 раза кэшем 2-го уровня.

Appaloosa - кодовое название 3-го ядра Duron. Основано на ядре Thoroughbred с урезанным в 4 раза кэшем 2-го уровня. Должен был выпускаться с шиной 266 мгц при 0,13 техпроцессе. Ни одного экземпляра процессора выпущено не было. Этот процессор мог бы помешать продажам Athlon нижних частот, и поэтому AMD от него отказалась. Athlon MP - серверная версия Athlon XP, с хорошей масштабируемостью в 2-х процессорных системах, по маркетинговым соображениям вышел раньше Athlon XP. Вполне возможно, что новые ядра процессоров AMD получат технолонию виртуальной многоядерности, или даже реальной - в сервереных кристаллах. Intel уже имеет технологию виртуальной двухпроцессорности. Носит она название Hyper-Threading. Для иллюстрации подобного рода решений несколько слов о её работе. Технология очень кстати для многозадачности и задач с множеством потоков, а это востребованно практически повсеместно. Разумеется, для этого необходима поддержка многопроцессорности на уровне операционной системы (есть в Win2k - NT, 2000, XP, в различных Linux и Unix, в Win9x такой поддержки нет); для увеличения производительности в отдельном приложении важно, учитывалось ли при разработке распараллеливание кода на несколько процессоров. Реализовано Hyper-Threading в виде дополнительного набора регистров. Получается 2 независимых регистровых блока + процессорное ядро. В итоге могут исполняться 2 независимых участка кода на одном ядре - 2 процессорная система de facto. Однако необходимо учитывать, что "второй" процессор - логический, поэтому при загрузке процессора множеством потоков производительность растет (за счёт более "плотной" загрузке ядра потоками), но совсем не настолько, как при наличии второго физического ядра (или как у двухпроцессорных систем). В этой гонке основные козыри PIV перед AMD - SSE2 и широкая полоса пропускания шины процессор-память - практически единственные явные технологические преимущества Intel за долгое время. В спецификации Northwood увеличен кэш L2 до 512 Кб, что является традиционной для Intel "игре мускулами". Полоса пропускания взята с большим запасом и пока еще до конца не востребована, что дает возможность Intel спокойно и планомерно повышать частоты процессоров, сохраняя практически линейную масштабируемость, сосредотачивая усилия на оптимизации технологии изготовления, рекламных компаниях и будущих планах. Большинство приложений в первую очередь пишется с учетом технологий Intel, что делает эту компанию "законодателем мод", что способствует продаже процессоров в целом. Поэтому Intel, не обладая наиболее интересными и концептуально стройными решениями, но применяя свои наработки вовремя, к месту и в достаточном количестве, в данный момент является лидером по показателям абсолютной производительности.

Теперь более подробно рассмотрим архитектуру процессора AMD Athlon.




Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2019-07-29 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: