Автор: Олег Нечай

Опубликовано 31 мая 2011 года

В отличие от Intel, которая выпускает уже 17 моделей "настольных" чипов на основе новой микроархитектуры Sandy Bridge, компания AMD пока не обновила линейку своих десктопных процессоров: официальная презентация первых четырёх чипов серии FX, известных под кодовым названием Bulldozer, ожидается лишь 22 июня 2011 года. Пока же на рынке представлены лишь процессоры Athlon II и Phenom II, поставки которых начались ещё в январе 2009 года. В апреле 2010 года к существующей платформе AMD Dragon добавилась обновлённая высокопроизводительная платформа AMD Leo - в её состав вошли мощные шестиядерные процессоры Phenom II с кодовым названием Thuban и четырёхъядерные Zosma.

Микроархитектура K10

Архитектура AMD K10 достаточно хорошо известна, поэтому, не вдаваясь в подробности, напомним её характерные особенности. Прежде всего, это многоядерные чипы, в которых все ядра выполнены на одном кристалле, снабжены выделенным кэшем L2, а также общим для всех ядер кэшем L3 (за исключением Athlon II). Ядра претерпели существенные изменения по сравнению с K8: в частности, была переработана конструкция блоков выборки, предсказания переходов и ветвлений, диспетчеризации, что позволило оптимизировать загрузку ядра и в конечном итоге повысить производительность. Разрядность блоков SSE была повышена с 64 до 128 бит, появилась поддержка двух дополнительных инструкций SSE4a.

В процессорах реализована скоростная системная шина нового поколения HyperTransport 3.0, обеспечивающая пиковую скорость до 41,6 Гбайт/с в обоих направлениях в 32-битном режиме или до 10,4 Гбайт/с в одном направлении в 16-битном режиме и частотой до 2,6 ГГц. В силу избыточности такой пропускной способности для текущего конструктива в настоящее время применяется режим до 2 ГГц и 8,0 Гбайт/с.

Два независимых контроллера оперативной памяти DDR2-1066 (модели для разъёма AM2+ и AM3) или DDR3-1333 (чипы для разъёма AM3), встроенные в чип, обеспечивают ускоренный доступ к модулям.

В микропроцессорах с архитектурой K10 применяется комплексная система энергосбережения, состоящая из нескольких фирменных технологий - Cool’n’Quiet, CoolCore, Independent Dynamic Core и Dual Dynamic Power Management. Чипы способны автоматически снижать энергопотребление как всей микросхемы в целом, так и отдельных ядер и контроллера, а также отключать неиспользуемые элементы.

Технология Turbo Core, реализованная в четырёх- и шестиядерных Phenom II, обеспечивает автоматический динамический разгон наиболее загруженных ядер (от одного до двух или трёх) на частоту до 500 МГц выше номинальной. При этом частота менее нагруженных ядер снижается, поэтому даже в этом режиме не превышается заявленный термопакет.

Актуальный модельный ряд процессоров K10

Все чипы с архитектурой K10 производятся по 45-нм технологии, и по техпроцессу уступают современным процессорам Intel, которая начала массированный переход на 32-нм нормы ещё при запуске первых Nehalem. Самые мощные в линейке шестиядерные Phenom II X6 (Thuban), представленные весной 2010 года, также выпускаются по 45-нм технологии.

Процессоры семейств Athlon II и Phenom II рассчитаны на установку в разъём AM3, за исключением двух моделей: Phenom II X4 940 и 920, которые устанавливаются в Socket AM2+ и работают только с оперативной памятью DDR2. Чипы обеих линеек доступны в двух-, трёх- и четырёхъядерном исполнении (X2, X3, X4), "атлоны" также в одноядерном, а "феномы" - и в шестиядерном. Специально для энтузиастов разгона предлагаются модификации Black Edition, отличающиеся от стандартных моделей разблокированным множителем.

Микросхемы Athlon II X2 (Regor) представляют собой "настоящие" двуядерные чипы, а не четырёхъядерники Phenom II X4 (Deneb) с двумя нерабочими ядрами, как Phenom II X2 (Callisto). В свою очередь, Athlon II X3 - это Athlon II X4 c одним нефункциональным ядром, Phenom II X3 (Heka) - это Phenom II X4 (Deneb) с одним отключённым ядром, а Phenom II X4 (Zosma) - это Phenom II X6 (Thuban) с двумя отключёнными ядрами.

Каждое ядро Athlon II и Phenom II оснащается 128 Кбайт кэш-памяти L1 и 512 Кбайт кэша второго уровня. Однако, в отличие от Phenom II, у "атлонов" нет общей кэш-памяти L3, поэтому они чаще обращаются к заведомо более медленной системной памяти. Результат - ограниченная производительность в ресурсоёмких приложениях, в частности, в трёхмерной графике и компьютерных играх. Впрочем, в сочетании с хорошей дискретной видеокартой системы на Athlon II демонстрируют вполне достойную игровую производительность.

Микроархитектура Bulldozer

Процессоры на основе микроархитектуры следующего поколения под кодовым названием Bulldozer должны появиться на рынке в самое ближайшее время - в июне 2011 года. Эти чипы представляют собой одну из реализаций всё более популярной концепции "системы на чипе", когда на одном кристалле размещаются несколько вычислительных ядер, графические ядра и различные контроллеры, ранее входившие в состав наборов логики. В компании AMD разработкой гибридного процессора модульного типа под названием Fusion занялись ещё в 2006 году, сразу после покупки канадского производителя графических чипов ATI Technologies. Однако если Intel уже несколько лет массово выпускает ЦП со встроенной графикой, AMD так и не представила серийной десктопной модели - по некоторым сведениям, из-за проблем с производством. При этом если первоначально Fusion планировалось выпускать по 45-нм технологии, то Bulldozer уже рассчитаны на 32-нм техпроцесс.

Процессоры следующего поколения будут состоять из одного или нескольких двухъядерных модулей с общим внешним интерфейсом (блоков выборки и декодирования), блоком вычислений с плавающей запятой и кэш-памятью второго уровня. Поскольку в работающем многоядерном процессоре некоторые блоки часто остаются незадействованными, их можно сделать общими для нескольких ядер. В результате процессор будет состоять из меньшего числа блоков и его физические размеры будут меньше. Это сделает его экономичнее, "прохладнее" и, разумеется, дешевле. При этом по производительности в реальных приложениях такой чип не будет уступать микросхеме с "полноценными" ядрами.

Микроархитектура Bulldozer совместима со стандартными инструкциями x86 и поддерживает дополнительные наборы инструкций SSE4.1, SSE4.2, AVX, AES и LWP. Набор векторных инструкций AVX (Advanced Vector Extensions) был разработан в Intel в качестве возможного набора мультимедийных инструкций SSE5 нового поколения, и он уже используется в процессорах Core на основе архитектуры Sandy Bridge. В чипах Bulldozer этот набор дополнен двумя проприетарными расширениями XOP и FMA4. Инструкции AES (Advanced Encryption Standard) отвечают за поддержку алгоритмов шифрования, а LWP (Light Weight Profiling) позволяют одним программам отслеживать производительность других, что особенно важно при отладке софта. Иными словами, в Bulldozer поддерживаются практически любые когда-либо написанные инструкции для x86-совместимых процессоров.

Блок выборки, общий для пары ядер, отвечает за отбор и передачу на декодирование следующей инструкции из кэш-памяти или оперативной памяти. Кэш инструкций первого уровня, как неотъемлемая часть блока выборки, также общий для всего модуля, при этом у каждого "ядра" есть выделенный кэш данных L1. В чипа предусмотрена также общая кэш-память второго уровня для двух "ядер" и кэш третьего уровня, общий для всех "ядер" и двухъядерных модулей.

Блок декодирования преобразует инструкции x86 в понятные процессору микроинструкции RISC. В каждом двухъядерном модуле четыре таких блока. Расшифрованные инструкции поступают в планировщики, работающие с инструкциями для целочисленных вычислений или расчётов с плавающей запятой. Для обеспечения равномерной загрузки исполнительных блоков в ней используются планировщики, сортирующие инструкции в произвольном порядке и отправляющие их на блоки, которые могут их исполнить.

В каждом двухъядерном модуле два "ядра", то есть два независимых блока целочисленных расчётов и один блок вычислений с плавающей запятой. В каждом "ядре" четыре исполнительных подблока: EX, MUL (выполняет любые целочисленные вычисления, за исключением деления), EX, DIV (выполняет любые целочисленные вычисления, за исключением умножения) и два AGen (блоки генерации адресов данных, используемых загружаемыми инструкциями). В каждом "ядре" также имеется блок загрузки и хранения (Ld/ST), отвечающий за выгрузку или загрузку в память данных, затребованных инструкцией. Выполненные целочисленные инструкции пересылаются в блок вывода, в котором они снова выстраиваются в правильном порядке.

В блоке вычислений с плавающей запятой четыре подблока: два MMX (выполняет все основные вычисления с плавающей запятой x87, включая инструкции MMX/SSE) и два 128-битных блока FMAC (выполняет любые вычисления с плавающей запятой).

Как и в топовых K10, в Bulldozer реализованы технология автоматического разгона Turbo Core, а также система управления энергопотреблением, существенно модернизированные в связи с принципиальными изменениями в самом процессоре.

Модельный ряд Bulldozer

Первые четыре модели носят кодовое название Zambezi; чипы на основе 32-нм технологии предназначены для высокопроизводительных настольных компьютеров и рабочих станций. Восьмиядерные чипы войдут в серию с индексом FX-81хх, шестиядерные - FX-61xx, а четырёхъядерные - FX-41xx. Контроллеры трёхканальной оперативной памяти Zambezi будут поддерживать память типа DDR3 вплоть до 1866 МГц.

Одновременно с новыми чипами появится и процессорный разъём Socket AM3+, который официально не совместим с разъёмом предыдущего поколения, хотя некоторые производители системных плат утверждают, что обновление BIOS позволит устанавливать новые чипы на некоторые их «материнки» с Socket AM3. Визуально новый сокет отличается чёрным цветом пластика, отверстиями под выводы чуть большего диаметра и, разумеется, маркировкой.

Специально для Zambezi разработаны наборы системной логики 900-й серии: AMD 980G (c интегрированной графикой), AMD 970, AMD 990X и AMD 990FX, отличающиеся, в основном, числом линий PCI Express, то есть возможностями установки одной или нескольких видеокарт в режиме СrossFireX и количеством поддерживаемых слотов расширения.

Во второй части статьи мы познакомимся со справочной информацией об основных технических характеристиках всех выпускаемых в настоящее время процессоров AMD Athlon II и Phenom II, с основными данными чипов FX (Zambezi), а также с ориентировочными розничными ценами на них в российских магазинах. А в заключение мы поговорим о самых интересных моделях, на которые стоит обратить внимание при выборе.

.