Athlon (Thunderbird) содержит 3 узла вычислений с плавающей точкой (fpu), любой из которых способен принимать на вход инструкции каждый такт работы процессора. При этом один узел предназначен исключительно для выполнения команды FSTORE! Назначение этого узла - обеспечивать обмен между регистрами и памятью в то время, как процессор выполняет другие инструкции. Такой подход, хотя и не повышает пиковую производительность, позволяет достичь более высокой средней производительности, что во многих случаях важнее. Остальные два fpu состоят из блока сложения (adder) и блока умножения (multiplier). Оба блока используют конвейеры (fully pipelined). Архитектура каждого fpu такова, что он может принимать на вход каждый такт одну инструкцию сложения и одну умножения, что дает пиковую производительность 1000MFLOPS при 500МГц. Ближайшим аналогом с точки зрения архитектуры является Pentium II, у которого также присутствуют adder и multiplier. Однако существуют два основных отличия. Во-первых, у PII только adder является полностью конвейеризованным (fully pipelined), multiplier же может принимать инструкцию на вход только каждый второй такт. Во-вторых, каждый узел fpu PII может принимать только одну инструкцию за такт, таким образом, пиковая производительность составляет 500MFLOPS при 500МГц. В результате возможности для вычислений с плавающей точкой у Athlon (Thunderbird) процессора выросли настолько, что ставят его в один ряд с RISC-процессорами, которыми оснащают мощные рабочие станции и серверы.
3.4 Расширенные возможности технологии 3DNow!™
Блока 3DNow! в AMD Athlon коснулись сильные изменения. Хотя его архитектура и осталась неизменной - два конвейера обрабатывают инструкции, работающие с 64-битными регистрами, в которых лежат пары вещественных чисел одинарной точности, в сам набор команд было добавлено 24 новинки. Новые операции должны не только позволить увеличить скорость обработки данных, но и позволить задействовать технологию 3DNow! в таких областях, как распознавание звука и видео, а также интернет:) Кроме этого, по аналогии с SSE были добавлены и инструкции для работы с данными, находящимися в кеше. Поддержка обновленного набора 3DNow! уже встроена в Windows 98 SE и в DirectX 6.2.
|
Таким образом, в набор 3DNow! входит теперь 45 команд, против 71 инструкции в SSE от Intel. Причем, судя по всему, использование новых команд должно дать еще больший эффект от 3DNow! В доказательство этого факта AMD распространила дополнительный DLL для известного теста 3DMark 99 MAX, задействующий новые возможности процессора.
Для того, чтобы усилить возможности процессоров AMD Athlon™ как в обработке трехмерной графики, так и в исполнении других мультимедийных задач, разработанный AMD пакет из 21 инструкции, улучшающий возможности набора команд x86 по использованию суперскалярной техники SIMD и известный как технология 3DNow!™, был значительно расширен. В 3DNow!™ было добавлено 24 новых инструкции - 19 для того, чтобы улучшить возможности процессора в целочисленных расчетах, в том числе и в технологии MMX и ускорения передачи данных для Internet-приложений использующих потоки данных, а так же 5 DSP-расширений для программных модемов, ADSL, Dolby Digital и приложений, использующих MP3.
Технология Enhanced 3DNow!™ против SSE - сравнение наборов команд
Исполняемые функции | Enhanced 3DNow! | SSE | Вывод |
Выполнение SIMD-вычислений с плавающей точкой (впервые предложено AMD) | 21 (число инструкций в первоначальном варианте технологии 3DNow!) | ~52 | Сравнение функциональности: Обе технологии поддерживают 4 операции за такт и выполняют вплоть до 2.4 Gflops на частоте 600 MHz. Но инструкции 3DNow! проще для исполнения. SSE включает в себя намного больше инструкций, поскольку архитектура Intel's требует дублирования управляющих функций MMX, для чего необходимо исполнять две инструкции, управляющие операциями с плавающей точкой - одну для SIMD-операций и другую для скалярных операций. |
MMX (целочисленные вычисления),сложение и перемещение данных | 19 (Новые инструкции) | Сравнимое функциональное назначение: обе технологии имеют инструкции для работы с кэшем и потоковыми данными. | |
DSP-расширения для коммуникаций | 5 (новые инструкции) | Оригинальная методика AMD: Компания AMD приспосабливает SIMD-операции для решения задач DSP - программных модемов, программной реализации ADSL, MP3 и Dolby Digital. | |
Общее число инструкций | Преимущество AMD: Расширенный набор 3DNow! имеет больше функциональных возможностей, нежели SSE. Усовершенствованная технология 3DNow! плюс превосходный блок для операций с плавающей точкой процессора AMD Athlon дают наивысшую производительность в операциях с плавающей точкой среди x86-совместимых процессоров! |
|
Архитектура кэша
Что касается кеша L1 в AMD Athlon, то его размер 128 Кбайт превосходит размер L1 кеша в Intel Pentium III аж в 4 раза, не только подкрепляя высокую производительность Athlon, но и обеспечивая его эффективную работу на высоких частотах. В частности, одна из проблем используемой Intel архитектуры Katmai, которая, похоже, уже не позволяет наращивать быстродействие простым увеличением тактовой частоты, как раз заключается в малом объеме L1 кеша, который начинает захлебываться при частотах, приближающихся к гигагерцу. AMD Athlon лишен этого недостатка.
|
Что же касается кеша L2, то и тут AMD оказалось на высоте. Во-первых, интегрированный в ядро tag для L2-кеша поддерживает его размеры от 512 Кбайт до 16 Мбайт. Pentium III, как известно, имеет внешнюю Tag-RAM, подерживающую только 512-килобайтный кеш второго уровня. К тому же, Athlon может использовать различные делители для скорости L2-кеша: 1:1, 1:2, 2:3 и 1:3. Такое разнообразие делителей позволяет AMD не зависеть от поставщиков SRAM определенной скорости, особенно при выпуске более быстрых моделей.
AMD Athlon (Thunderbird) располагает самым большим среди x86-совместимых процессоров объемом кэша первого уровня (128КB). Кроме того, AMD Athlon (Thunderbird) оснащен высокоскоростным 64-разрядным кэш-контроллером для управления кэш-памятью второго уровня, объем которой может составлять от стандартных 256KB до почти фантастических 8MB. Эта разработка позволяет эффективно управлять системной шиной, а так же позволяет обходить узкие места в полосе пропускания.
DDR память
Эта память является естественным развитием PC100/PC133 SDRAM памяти. Память DDR позволяет поднять производительность x86-платформы при сохранении конкурентноспособной цены. В то время, как другие типы SDRAM могут выполнять только один цикл чтения и записи за такт, технология DDR позволяет выполнить два цикла чтения и записи за то же время. DDR память доступна от основных производителей DRAM во всем мире.