Компьютеры и программы

23*2005 (приложение)
23/2005
5/2005
16/2005
32/2004
26/2004
18/2004
6/2004

35/2003

ПОИСК

ИНФОРМАЦИЯ

О нас
Контакты
Где купить?
Реклама на сайте
Подписка на новости
Карта сайта



  главная    содержание    форум    архив  

Статья

Новый виток конкуренции

Компания AMD (Advanced Micro Devices) является одним из двух ведущих игроков на рынке процессоров для настольных систем. Уже более 10 лет она пытается соперничать с единоличным лидером полупроводниковой промышленности – компанией Intel. И порой эта борьба приносит AMD локальные победы, как это было, к примеру, при покорении частоты 1 ГГц. В последнее время репутация компании несколько пошатнулась из-за многократного переноса анонса процессоров нового поколения K8. Однако в сентябре 2003 года ситуация сдвинулась с мертвой точки, и очередной этап процессорной гонки, наконец, стартовал.

Но мы начнем повествование с описания процессоров предыдущего поколения K7 — AMD Athlon XP, так как среди всей продукции AMD именно эти чипы наиболее востребованы на массовом рынке в настоящий момент.

Athlon XP является прямым последователем процессора AMD Athlon, который долгое время был хитом продаж в России. Поэтому представители семейства Athlon XP сохранили все достоинства предыдущих моделей, но при этом были дополнены новыми наработками.


AMD Athlon XP Thoroughbred

Первые процессоры Athlon XP были основаны на ядре Palomino и выпускались по технологии 0,18 мкм. Однако достижение физического предела тактовой частоты вынудило инженеров AMD перевести производство на новую технологию изготовления 0,13 мкм, что привело к обновлению ядра и изменению его названия на Thoroughbred.

Данное обновление носило исключительно технологический характер и никоим образом не затронуло архитектуру процессора. Модели на ядре Thoroughbred стартовали с тактовой частоты 1,47 ГГц, частоты системной шины 266 МГц и соответствующего им рейтинга 1700+. При этом максимальная тактовая частота, которая покорилась данным процессорам, составила 1,8 ГГц (рейтинг 2200+). Сейчас модели на основе первой ревизии ядра Thoroughbred еще можно встретить в продаже, однако их производство уже прекращено.

На полках компьютерных магазинов гораздо легче встретить процессоры AMD Athlon XP на основе ядра Thoroughbred-B, являющегося второй ревизией Thoroughbred. Редизайн коснулся только взаимного расположения блоков процессора и не изменил его архитектуры. Тем не менее он позволил увеличить тактовые частоты выпускаемых кристаллов до 2,25 ГГц (рейтинг 2800+). В настоящее время активно продаются процессоры AMD Athlon XP на основе ядра Thoroughbred-B, работающие на частотах от 1,47 (1700+) до 2,17 ГГц (2700+). При этом модели 2,08 ГГц (2600+) и 2,17 ГГц (2700+) имеют частоту системной шины 333 МГц, а все остальные – 266 МГц.

Микроархитектура Athlon XP под названием QuantiSpeed продолжает традиции предыдущих поколений процессоров компаний AMD и Intel. Она нацелена в первую очередь на достижение максимальной производительности за один такт работы. По словам разработчиков AMD, QuantiSpeed можно охарактеризовать как суперскалярную суперконвейерную x86-микроархитектуру с возможностью обработки 9 инструкций за такт. На более понятном языке это означает, что Athlon XP имеет многоконвейерную структуру с независимыми исполнительными устройствами. А именно, в его распоряжении находятся три идентичных конвейера, способных работать параллельно. Каждый из них оснащен декодером инструкций, блоками выполнения операций с целыми (ALU) и блоком вычисления адресов. Все рассматриваемые функциональные устройства также конвейеризированы, что позволяет процессору достигать высокой пиковой производительности.

Отдельного упоминания заслуживает на редкость удачная разработка AMD последнего времени – блок операций с плавающей точкой (FPU). Он состоит из трех независимых конвейерных модулей. Первый отвечает за исполнение операций вещественного умножения, второй – вещественного сложения, и, наконец, третий осуществляет обмен данными между регистрами и памятью. В результате FPU процессоров Athlon и Athlon XP способен выполнять до двух операций с плавающей точкой за такт, что по современным меркам считается высоким показателем. В FPU Athlon XP встроена поддержка инструкций MMX, 3DNow! Professional и, главное, SSE. Благодаря последним заметно повышается производительность при обработке потоковых данных. Тем не менее отсутствие поддержки набора команд SSE2 во многом ограничивает возможности Athlon XP в мультимедийных приложениях.

Athlon XP обладает коротким, по сравнению с Pentium 4, конвейером. Его длина составляет 10 и 15 стадий при выполнении целочисленных и вещественных операций соответственно. По данному показателю архитектура Athlon XP, как и всего поколения процессоров K7, является наследницей более ранних разработок. В связи с этим Athlon XP хуже масштабируется по частоте, но зато способен выполнять большее количество операций за один такт.

Для того чтобы наиболее эффективно использовать возможности архитектуры QuantiSpeed, необходимо обеспечить непрерывное снабжение ядра командами и данными. Для этого Athlon XP оснащен тремя параллельными декодерами инструкций x86, которые разбивают поступающие из кеша команды x86 на специальные макрооперации, которые имеют регулярную структуру и фиксированную длину. Отметим, что каждая макрооперация представляет собой совокупность двух микроопераций, непосредственно исполняемых в вычислительных устройствах. Первая из них является командой для блоков ALU или FPU, тогда как вторая отвечает за вычисление адресов данных. Подобная организация внутренней системы команд позволяет сократить количество обращений к памяти, а значит, увеличить эффективность работы конвейера в целом. Принцип исполнения команд у процессора Athlon XP является спекулятивным (по предположению) и динамическим (с измененным порядком), что, безусловно, позволяет более эффективно заполнять работой вычислительные устройства.

Из других архитектурных особенностей AMD Athlon XP отметим наличие аппаратной предвыборки команд, позволяющей загружать команды из кеша во время исполнения ранее декодированных инструкций, увеличенный объем буфера TLB — своеобразного кеша, предназначенного для хранения адресов команд и данных, а также усовершенствованное динамическое предсказание ветвлений.

Athlon XP оснащен кешами 1-го и 2-го уровней. Кеш L1 делится поровну между командами и данными, и его общий объем составляет 128 кбайт. Эксклюзивный кеш L2 может сохранять до 256 кбайт информации. По сравнению с Pentium 4 Northwood, обладающим кешом L2 размером в 512 Мбайт, объем 256 Мбайт может показаться небольшим. Однако эксклюзивность кеша L2 во многом исправляет этот недостаток.

Как уже было сказано выше, AMD Athlon XP, основанные на ядре Thoroughbred, работают на частоте системной шины 266 или 333 МГц. Однако большинство этих процессоров имеют незафиксированный коэффициент умножения, что позволяет без труда их эксплуатировать и при частоте FSB 400 МГц. Отметим также, что многие младшие представители линейки демонстрируют отменный разгонный потенциал: к примеру, некоторые процессоры с рейтингом 1700+ и частотой 1,47 ГГц способны достигать частот 2,2–2,3 ГГц.

С другой стороны, работа в экстремальных режимах может обернуться потерей работоспособности при сбоях в системе охлаждения. Дело в том, что все процессоры AMD Athlon XP лишены аппаратной защиты от перегрева. Они оснащены лишь встроенным температурным датчиком, информацию от которого используют далеко не все материнские платы. Проблемы могут возникнуть и при установке AMD Athlon XP в разъем Socket A. Дело в том, что кристалл рассматриваемых процессоров не защищен теплораспределителем, поэтому при перекосе кулера на нем могут образоваться сколы.

Для раскрытия всех вычислительных возможностей процессора AMD Athlon XP необходимо обеспечить высокую скорость обмена данными между ядром и оперативной памятью, что зависит как от используемого набора системной логики, так и от типа установленных в системе модулей. Все современные чипсеты для платформы AMD Athlon XP ориентированы на использование памяти DDR SDRAM.

Наибольшую производительность в операциях обмена данными по магистрали процессор-память демонстрируют наборы системной логики nVidia nForce2 и nVidia nForce2 Ultra 400. При этом пиковая производительность достигается при синхронном режиме работы системной шины и шины памяти и максимальной частоте FSB. С другой стороны, если вы предпочитаете использовать «официальные» значения частоты FSB – 266 или 333 МГц в зависимости от модели, то в этом случае имеет смысл ориентироваться на асинхронный режим работы с модулями памяти PC2700 или PC3200. Неплохую скорость работы демонстрируют и такие чипсеты, как VIA KT600, KT400A и KT400. Однако следует учитывать, что у KT400A и KT400 максимальная частота FSB составляет 333 МГц. Чипсет SiS 748, рассчитанный на частоты FSB вплоть до 400 МГц, занимает, тем не менее, последнее место в рейтинге производительности. Но он будет неплохим выбором при построении бюджетной системы, основанной на младших моделях, где разница в быстродействии чипсетов не играет заметной роли.

Благодаря архитектуре с коротким конвейером, развитой суперскалярности и эффективному предсказанию программных ветвлений процессор AMD Athlon XP демонстрирует очень высокие показатели в приложениях с хаотическим кодом, к которым относятся многие компьютерные игры, например, «Unreal Tournament 2003» и «Serious Sam 2». Очень любит Athlon XP и счетные научные задачи, которые активно задействуют FPU и не требуют высокой пропускной способности шины памяти.

В офисных задачах Athlon XP вполне держится на уровне Pentium 4. Причиной тому является не равная производительность конкурентов, а низкие аппаратные требования текстовых редакторов и электронных таблиц.

С другой стороны, Athlon XP пасует перед Pentium 4 в большом количестве других приложений с предсказуемым кодом, чувствительных к тактовой частоте и пропускной способности шины памяти. К ним относятся всевозможные программы компрессии звука и видео, архиваторы, приложения по рендерингу изображений и графические редакторы. Перечисленные приложения являются наиболее важными для многих пользователей ПК. Поэтому Athlon XP на ядре Thoroughbred ощутимо отстает от Intel Pentium 4 Northwood. Отметим, что Athlon XP проигрывает Pentium 4 не только из-за меньшей тактовой частоты, но и из-за отсутствия поддержки таких технологий, как SSE2 и Hyper-Threading.

Таким образом, следует признать, что удел процессоров AMD Athlon XP на ядре Thoroughbred – системы начального и среднего уровня производительности, и их низкие цены это подтверждают. С другой стороны, они могут понравиться и требовательным геймерам, особенно при наличии разгонного потенциала.


AMD Athlon XP Barton

Появление процессоров AMD Athlon XP на ядре Barton должно было стать ответом на быстро растущую производительность топовых процессоров семейства Intel Pentium 4 на ядре Northwood. К тому времени инженеры компании AMD достигли предела роста тактовой частоты кристаллов, выпускаемых по технологии 0,13 мкм (2,25 ГГц для модели Athlon XP 2800+ на ядре Thoroughbred), и для увеличения быстродействия процессоров необходимо было вносить архитектурные усовершенствования.

Ядро Barton отличается от ядра Thoroughbred лишь размером кеша второго уровня, который был увеличен вдвое до 512 кбайт. Подобное нововведение можно с уверенностью назвать косметическим и не приносящим существенного роста производительности. Тесты это подтверждают. Лишь в программах, активно взаимодействующих с памятью, наблюдается заметный выигрыш в быстродействии – до 7%. К ним можно отнести игры с хаотическим программным кодом и архиваторы. Тогда как в остальных приложениях добавка к производительности при переходе к ядру Barton составляет всего 1—3 процента.

Первоначально на рынок были выпущены процессоры AMD Athlon XP Barton, работающие на частоте системной шины 333 МГц. Это модели 2500+ (1,83 ГГц), 2800+ (2,08 ГГц) и 3000+ (2,17 ГГц). При переходе на ядро Barton система определения рейтинга производительности стала менее правдоподобной. Модели Thoroughbred 2700+ и Barton 3000+ имеют одинаковую частоту, тогда как их рейтинг отличается на 11%, что не соответствует среднему росту быстродействия на 3—5%.

В дальнейшем AMD предприняла перевод своих процессоров на системную шину 400 МГц, в результате на свет появились модели на ядре Barton с рейтингами 3000+ (2,1 ГГц) и 3200+ (2,2 ГГц). Такая модификация привела к более существенному росту производительности по сравнению с тем небольшим скачком быстродействия, что имел место при переходе от ядра Thoroughbred к ядру Barton. Если сравнивать процессоры Athlon XP 3000+ (FSB — 333 МГц) и Athlon XP 3200+ (FSB — 400 МГц), то последний неизменно оказывается в лидерах с отрывом, колеблющимся в диапазоне от 3 до 20% в зависимости от приложения, несмотря на то, что разница в тактовых частотах составляет лишь 1,5%.

Процессоры AMD Athlon XP на ядре Barton, работающие на частоте системной шины 400 МГц, являются венцом развития поколения K7. Тем не менее на сегодняшний день их производительность уступает быстродействию топовых процессоров Intel Pentium 4 с частотой FSB 800 МГц. Речь в первую очередь идет о модели с тактовой частотой 3,2 ГГц. Паритет имеет место лишь в считанном числе компьютерных игр, тогда как в большинстве популярных приложений лидирует процессор Pentium 4 с отрывом вплоть до 30%.


AMD Athlon XP Thorton

Плавный перевод Athlon XP на ядро Barton коснулся и младшей линейки процессоров с объемом кеша второго уровня 256 кбайт. Теперь эти кристаллы основываются на ядре Thorton, которое представляет собой Barton с отключенной половиной кеша L2. С точки зрения производительности данная трансформация не вносит каких-либо изменений.

Однако факт отключения половины кеша не означает его неработоспособности. И эксперименты некоторых умельцев это подтвердили. Оказалось, что с помощью модификации мостиков, располагающихся на верхней крышке процессора, можно увеличить кеш до 512 кбайт.

Пока на ядре Thorton выпускаются три модели с рейтингами 2000+ (1,67 ГГц), 2200+ (1,8 ГГц) и 2400+ (2 ГГц). Они предназначены для работы на частоте системной шины 266 МГц и позиционируются как дешевые процессоры с неплохим уровнем производительности.


AMD Duron Applebred

Процессоры Duron всегда предназначались для систем начального уровня. Их отличия от более старших собратьев из семейства Athlon XP заключаются в меньшей частоте системной шины и в меньшем размере кеша второго уровня.

В настоящее время в продаже еще встречаются процессоры Duron на ядре Morgan, выполненные по технологии 0,18 мкм. Однако все большее распространение получают процессоры AMD Duron на ядре Applebred, которое является аналогом Thoroughbred с уменьшенным до 64 кбайт размером кеша второго уровня.

Процессоры AMD Duron на ядре Applebred работают на частоте системной шины 266 МГц и имеют вполне высокие тактовые частоты 1,4, 1,6 и 1,8 ГГц. Отметим, что, несмотря на вчетверо меньший объем кеша L2, производительность AMD Duron по сравнению с AMD Athlon XP на частоте FSB 266 МГц падает не столь сильно – на 10—20%, а то и меньше. Поэтому процессоры AMD Duron на ядре Applebred могут стать отличным выбором при создании ПК начального уровня, благо их цены находятся в диапазоне $35–50. Кроме того, любителям модернизации явно придется по душе возможность увеличения объема кеша L2 до 256 кбайт и соответственно превращения ядра Applebred в Thoroughbred посредством манипуляции над мостиками процессора.


AMD Athlon 64 Clawhammer

Появление процессоров AMD нового поколения K8 ожидалось компьютерной общественностью больше года. Многократный перенос даты анонса заставил многих пользователей разочароваться в возможностях компании AMD. Тем не менее разработчики, наконец, справились с причинами задержек и представили публике сначала серверные модели Opteron, а несколько месяцев спустя — в сентябре 2003 года – и настольные варианты процессоров под логотипом Athlon 64.

Важная особенность процессоров нового поколения K8 видна уже в самом их названии. AMD Athlon 64 являются первыми настольными 64-битными процессорами. Тем не менее рассматриваемые чипы основаны на ядре Clawhammer, в архитектуре которого получили развитие идеи, заложенные еще в первых процессорах поколения K7 — AMD Athlon.

Архитектура K8 по-прежнему является суперконвейерной и суперскалярной. Процессоры AMD Athlon 64 оснащены тремя идентичными конвейерами с параллельными стадиями декодирования и исполнения. Количество функциональных блоков по сравнению с Athlon XP также не изменилось – это по-прежнему три блока ALU, три блока FPU и три блока вычисления адреса. С другой стороны, конвейер увеличился на 2 ступени. Теперь его длина составляет 12 стадий при выполнении целочисленных операций и 17 стадий – при выполнении вещественных. Причина данной модификации заключается в существенной переделке параллельного декодера x86-инструкций, в результате которой конвейер AMD Athlon 64 стал максимально плотно заполняться микроинструкциями.

Изменениям подвергся и блок FPU. Теперь он наравне с 3DNow! Professional и SSE способен исполнять набор потоковых инструкций SSE2. Это, безусловно, полезное нововведение, которое в определенной степени позволило повысить производительность процессора при обработке потоковых данных. Тем не менее нельзя однозначно утверждать, что более высокие результаты процессора AMD Athlon 64, которые имеют место в потоковых приложениях, являются прямым следствием поддержки набора команд SSE2. Дело в том, что синтетические тесты показывают 1,5-кратное преимущество процессора Intel Pentium 4 3,2 ГГц над AMD Athlon 64 3200+ (2 ГГц) при выполнении векторных операций SSE2.

Заметно обновленный декодер Athlon 64 позволяет обрабатывать большее число инструкций за такт, что, естественно, увеличивает нагрузку на систему кеширования. Поэтому в целях создания сбалансированного процессора инженеры AMD также модернизировали и систему кешей.

В первую очередь изменения коснулись шины, связывающей кеши L1 и L2. Если в Athlon XP она была 64-битной, то в Athlon 64 это уже две независимые 64-битные шины, одна из которых работает на пересылку данных из L1 в L2, другая – из L2 в L1. Второе важное нововведение заключается в увеличении размера кеша второго уровня до 1 Мбайт при сохранении его эксклюзивности. Кроме всего прочего были увеличены размеры буферов TLB как кеша L1, так и L2, а также улучшено предсказание переходов за счет анализа вчетверо большей истории программных переходов.

Но инженеры AMD замахнулись и на самую низкую ступень в иерархии памяти. Теперь в процессоры AMD встроен контроллер оперативной памяти, который раньше всегда являлся неотъемлемой частью системной логики. Это довольно элегантное решение позволяет исключить чипсет из цепочки обмена данными между процессором и памятью. В результате латентность при совершении подобных операций снизилась в 2,5 раза по сравнению с процессором AMD Athlon XP и оказалась ниже аналогичного показателя Intel Pentium 4. Но есть у подобного решения и определенный недостаток: процессор со встроенным контроллером накрепко «привязан» к определенному типу памяти. Так что приближающийся переход на память DDRII, а также желание потребителя иметь реальную возможность выбора между одно- или многоканальными подсистемами памяти может заставить AMD производить многочисленные варианты одного и того же процессора, отличающиеся лишь контроллером памяти. В настоящее время процессоры AMD Athlon 64 оснащаются одноканальным контроллером DDR SDRAM, поддерживающим модули со спецификациями вплоть до PC3200.

Роль системной магистрали выполняет теперь шина HyperTransport, частота передачи данных по которой составляет 600 или 800 МГц в зависимости от чипсета, а ее ширина равна 16 битам. Таким образом, пропускная способность шины составляет 1,2 или 1,6 Гбайт/с в каждую сторону. Этого вполне хватит, чтобы прокормить видеокарту и различные периферийные устройства.

Таким образом, слегка огрубляя действительность, можно сказать, что по сравнению с Athlon XP у нового семейства процессоров сильно переработана часть, отвечающая за своевременную доставку команд и данных на исполнительные устройства, тогда как сами эти устройства практически не претерпели изменений, если не считать поддержку набора инструкций SSE2.

Однако все вышеперечисленные особенности архитектуры относились к стандартному 32-битному режиму работы. Существенным же новшеством, примененным в AMD Athlon 64, является реализация возможности исполнения 64-битного кода, для чего инженеры не только расширили регистры общего назначения до 64 бит, но и удвоили их количество в системе команд – с 8 до 16, позволяя программистам обойти, наконец, искусственное ограничение стандартной архитектуры x86-32, приводящее к уменьшению эффективности работы приложений.

Использовать возможности новой архитектуры x86-64 можно только в том случае, если перевести процессор в специальный 64-битный режим работы. Для этого необходимо наличие 64-битных же операционных систем. К сожалению, в настоящее время разработка 64-битной версии системы Windows еще не закончена, тем более не написаны в необходимом количестве 64-битные приложения. Поэтому возможности процессоров AMD Athlon 64 не будут полностью реализованы еще довольно долгое время.

При переходе к новому поколению процессоров AMD обновила и процесс их изготовления. Теперь AMD Athlon 64 производятся с помощью техпроцесса 0,13 мкм с применением технологии SOI (Silicon On Isolator). Эта технология улучшает скоростные характеристики транзистора, а также приводит к уменьшению энергетических потерь. Использование SOI позволит продлить срок жизни техпроцесса 0,13 мкм и поднять планку тактовых частот выше 2,2 ГГц, характерную для AMD Athlon XP.

Отметим, что процессоры AMD Athlon 64, по всей видимости, будут лишены званий «самый горячий» и «самый хрупкий», которыми часто награждались Athlon XP. Во-первых, благодаря технологии SOI максимально выделяемая мощность Athlon 64 не превысит 89 Вт, тогда как у Intel Pentium 4 на ядре Prescott этот параметр должен перескочить рубеж 100 Вт. Во-вторых, кристалл новых моделей защищен металлическим теплораспределителем, который призван в том числе предотвращать образование сколов на чипе при неправильной установке кулеров. В-третьих, в Athlon 64 реализован активный контроль температуры. Поэтому при превышении порога процессор будет «снижать обороты» во избежание теплового удара.

Смена поколений затронула не только архитектуру, но и конструктив процессоров. Для совместимости с AMD Athlon 64 материнские платы должны быть оснащены новым разъемом Socket 754.

В настоящее время AMD производит лишь одну модель процессора из линейки Athlon 64. Она имеет тактовую частоту 2 ГГц, встроенный контроллер памяти DDR SDRAM с поддержкой модулей PC3200, что, по мнению маркетологов AMD, соответствует рейтингу 3200+. Заметим, что процессору Athlon 64 удается достичь того же рейтинга производительности при меньшей на 200 МГц тактовой частоте, чем Athlon XP. Кроме того, как показывают тестовые испытания, Athlon 64 3200+ опережает Athlon XP 3200+ во многих приложениях весьма значительно. Новый процессор на 10—20% быстрее своего предшественника в игровых приложениях, а в архивировании – на все 10—40%, что, безусловно, является следствием переработки декодера и всей подсистемы памяти в широком понимании данного термина. Athlon 64 по-прежнему силен в научных расчетах, хотя чуть меньшая частота ядра может привести и к снижению производительности в специфичных задачах. Инженерам удалось повысить быстродействие в приложениях рендеринга изображений и кодирования видео на 5—10%. Таким образом, по параметру производительности процессор Athlon 64 3200+ существенно превосходит своего предшественника и практически добирается до уровня Intel Pentium 4 3,2 ГГц. В играх он его даже превосходит, а в задачах рендеринга и архивирования все-таки значительно уступает, сохраняя примерный паритет в остальных приложениях. А если учесть тот факт, что у технологии 0,13 мкм SOI есть определенный потенциал наращивания тактовых частот, то будущее процессоров Athlon 64 не внушает опасений.

Появление платформы Athlon 64 не вызвало бума на рынке чипсетов и материнских плат. На настоящий момент потребителю доступно только два набора системной логики – VIA K8T800 и nVidia nForce3 150. Также анонсированы чипсеты SiS755 и Ali M1687. Но, несмотря на новизну, цены на материнские платы уже вплотную подбираются к отметке $100, что обещает сделать платформу Athlon 64 доступной в ближайшее время. Осталось дождаться снижения цен на сами процессоры. Пока Athlon 64 3200+ можно купить лишь за 500–600 долларов США.


AMD Athlon 64 FX Sledgehammer

Анонсируя новое поколение K8, компания AMD решила не ограничиваться презентацией только одного семейства процессоров и представила публике более высокопроизводительное решение под логотипом AMD Athlon 64 FX.

Кристалл Athlon 64 FX имеет тактовую частоту 2,2 ГГц и отличается от обычного Athlon 64 только контроллером памяти. В Athlon 64 FX он является двухканальным и способен работать только с регистровой памятью DDR SDRAM со спецификациями вплоть до PC3200. Если присмотреться к Athlon 64 FX повнимательнее, то станет понятно, что он является прямым родственником серверных моделей AMD Opteron серии 1xx на ядре Sledgehammer, предназначенных для применения в однопроцессорных конфигурациях. Даже конструктив у Athlon 64 FX не отличается от Opteron: это разъем Socket940.

Несовместимость контроллера памяти Athlon 64 FX со стандартной памятью PC3200 является недостатком данных процессоров. Во-первых, регистровые модули PC3200 дороги, и их попросту тяжело найти в продаже. К тому же латентность буферизованной памяти выше, чем у обычной. С другой стороны, Athlon 64 FX обеспечивают поддержку коррекции ошибок ECC.

Процессор Athlon 64 FX на частоте 2,2 ГГц маркируется как Athlon 64 FX-51. Подобные обозначения будут применяться и в дальнейшем — Athlon 64 FX-53 для частоты 2,4 ГГц, Athlon 64 FX-55 – для 2,6 ГГц и т.д.

Модель Athlon 64 FX так же, как и Athlon 64, поддерживается пока лишь двумя чипсетами – VIA K8T800 и nVidia nForce3 Pro 150. Однако материнские платы на их основе стоят достаточно дорого – порядка 200 долларов, что вкупе со стоимостью самого процессора Athlon 64 FX-51 в районе 700 долларов образует достаточно солидную сумму, потратить которую смогут лишь толстосумы-энтузиасты.

Несмотря на незначительные, казалось бы, нововведения, процессор Athlon 64 FX-51 демонстрирует уверенный рост производительности по сравнению с Athlon 64 3200+. Во многих играх, задачах рендеринга изображений и кодировании аудио и видео данный прирост составляет 10%, а в архиваторах и при работе с растровой графикой – все 20%, что нельзя объяснить только разницей тактовых частот.

По сравнению с продукцией конкурирующей компании Intel, а именно, процессорами Pentium 4 3,2 ГГц и Pentium 4 XE 3,2 ГГц, Athlon 64 FX-51 демонстрирует высокие показатели. По усредненному показателю производительности он практически вровень идет с моделью Pentium 4 XE 3,2 ГГц, обладающей 2 Мбайтами кеша третьего уровня, и процентов на 10 опережает обычный Pentium 4 3,2 ГГц, наибольшее преимущество демонстрируя в игровых приложениях.

Таким образом, Athlon 64 FX-51 является во многом имиджевым процессором, так как высокая стоимость самого кристалла, регистровой памяти и материнских плат плохо соотносится с 10—20% роста быстродействия по отношению к значительно более дешевому AMD Athlon 64 3200+. На этом секторе рынка он будет соперничать с Intel Pentium 4 XE 3,2 ГГц, который обладает сходным соотношением цена/производительность.


Intel Pentium 4 Northwood

Компания Intel является одним из технологических лидеров в полупроводниковой промышленности. Ее разработки подчас приводили к смене принципов проектирования чипов. Так, к примеру, впервые появились суперскалярные настольные процессоры. В свете вышесказанного создание процессора Pentium 4 можно назвать важной вехой в истории развития данных устройств. Дело в том, что в его основу легла концепция, которая раньше не использовалась при проектировании процессоров.

Раньше для увеличения производительности разработчики старались оптимизировать микроархитектуру таким образом, чтобы увеличить число инструкций, выполняемых за один такт работы процессора. И, надо сказать, добились в этом немалых успехов: если у Intel 8086 на обработку одной инструкции уходило 12 тактов работы, то у Intel Pentium Pro — уже полтакта. Тем не менее инженеры компании решили пойти по другому пути – попытаться увеличить производительность, создав легко масштабируемую по частоте архитектуру. Pentium 4 – яркий пример такого подхода.

Архитектура Pentium 4 носит наименование NetBurst. Для нее характерна так называемая гиперконвейеризация. Это означает, что в Pentium 4 используется существенно более длинный конвейер, чем это было принято до сих пор, а именно 20-ступенчатый. На самом деле количество стадий еще больше, поскольку блок преобразования x86-инструкций в микрооперации вынесен за пределы конвейера, но об этом чуть позже.

Удлинение конвейера позволяет увеличить тактовую частоту процессора. Это связано с тем, что мелкие стадии архитектурно более просты и выполняют меньшее количество работы. А это означает, что на прохождение одной стадии требуется меньше времени, то есть появляется резерв для повышения частоты. Вместе с тем на заполнение длинного конвейера после неправильно предсказанного перехода уходит большее число тактов работы, что является основным недостатком гиперконвейерной архитектуры.

Для уменьшения его значимости инженеры Intel применили ряд интересных идей. Они расположили кеш команд первого уровня (так называемый Trace Cache) между блоком преобразования x86-инструкций в микрооперации и самим конвейером. Таким образом, в процессоре Pentium 4 в кеше команд хранятся не x86-команды, а микрооперации, имеющие регулярную структуру и фиксированную длину. Это позволяет обеспечить более полную загрузку конвейера на возросших частотах, так как исключает его простой при дешифрации сложных инструкций. Команды в кеше располагаются в исполняемой последовательности и образуют так называемые трассы, которых может быть несколько в соответствии с предсказанными ветвями. Поэтому даже в случае ошибки в предсказании заполнение конвейера будет происходить максимально быстро. Отметим, что Trace Cache способен принять до 12 000 микроинструкций. Очевидно, что производительность архитектуры NetBurst сильно зависит от качества работы блока предсказания переходов. По сравнению с Pentium III инженеры смогли улучшить его эффективность до 95%, что считается очень высоким показателем.

По сравнению с кешем команд, который по оценкам экспертов имеет реальный размер порядка 100 кбайт, в кеш данных L1 может уместиться лишь 8 кбайт информации. Но при этом его отличительной особенностью является чрезвычайно низкая латентность и широкая шина L1-L2 с пиковой пропускной способностью 100 Гбайт/с для наиболее высокочастотных процессоров. Так что, возможно, маленький объем кеша данных L1 не является узким горлышком для архитектуры NetBurst. Наконец, размер кеша второго уровня для ядра Northwood составляет 512 кбайт, что вполне достаточно для своевременной доставки данных в функциональные блоки.

По количеству исполнительных устройств Intel Pentium 4 уступает AMD Athlon XP. Данный факт также является следствием новой идеологии: зачем увеличивать число конвейеров, когда можно их удлинить и поднять частоту? Тем не менее Pentium 4 оснащен тремя конвейеризованными блоками ALU, два из которых способны работать на удвоенной частоте ядра, двумя блоками вычисления и сохранения адреса AGU, двумя конвейерными блоками FPU, только один из которых занят непосредственно вычислениями, блоками MMX и SSE.

Высокоскоростной ALU смело можно назвать гордостью Intel. Он способен выполнять до 4 инструкций за такт. Устройство обработки вещественных чисел FPU не претерпело серьезных изменений по сравнению с Pentium III. Зато разработчики Intel сконцентрировали свое внимание на другом блоке – SSE, которой при соответствующей оптимизации программ дает большой рост производительности в операциях с плавающей точкой. Pentium 4 способен выполнять расширенный, по сравнению с Pentium III, набор потоковых инструкций SSE2. Именно эта особенность позволяет Pentium 4 конкурировать с высокоразвитым FPU процессоров Athlon XP. И если в начале своего пути Pentium 4 заметно проигрывал конкуренту, то в дальнейшем, когда разработчики программного обеспечения ввели поддержку SSE2 в свои продукты, он зачастую стал обыгрывать Athlon XP на его же поле.

Архитектура NetBurst ориентирована на обработку больших потоков данных. Поэтому она предъявляет высокие требования ко всей подсистеме памяти в целом. Cистемная шина процессоров Intel Pentium 4 работает на эффективных частотах 533 и 800 МГц, что вдвое выше соответствующих показателей прямого конкурента – AMD Athlon XP и даже AMD Athlon 64. Более того, стандартом де-факто в системах, основанных на процессорах Intel Pentium 4, стало применение двухканальных контроллеров памяти DDR SDRAM, работающих с модулями PC2700 или PC3200, что позволяет говорить о достижении пропускной способности шины памяти 6,4 Гбайт/с.

Незадолго до начала выпуска процессоров с поддержкой частоты системной шины 800 МГц компания Intel анонсировала новую технологию Hyper-Threading, которая позволила в ряде задач существенно повысить производительность. Hyper-Threading, что в переводе с английского означает многопоточность, позволяет процессору выполнять одновременно несколько потоков команд. Достигается это за счет перераспределения ресурсов ядра, при котором в работу включаются простаивающие исполнительные устройства.

При исполнении большинства программ современные процессоры обычно загружаются на треть. Связано это с тем, что они состоят из большого количества блоков, часто дублирующих друг друга. К ним, к примеру, можно отнести многоконвейерные ALU или FPU. Таким образом, если «научить» процессор работать одновременно с несколькими потоками, то его быстродействие должно увеличиться. Эту задачу и решает технология Hyper-Threading.

Процессор, поддерживающий технологию Hyper-Threading, для операционной системы и приложений виден как пара логических процессоров. Но, несмотря на то, что их взаимосвязь внутри ядра осуществляется на аппаратном уровне, для активации Hyper-Threading необходима поддержка как со стороны набора системной логики, так и со стороны операционной системы. Все производители чипсетов после появления рассматриваемой технологии выпустили обновленные версии своих наборов системной логики. Что касается распространенных операционных систем, то истинную поддержку Hyper-Threading обеспечивает только Microsoft Windows XP.

Для использования всех возможностей Hyper-Threading необходима перекомпиляция программы. Однако даже без совершения подобной процедуры данная технология позволяет получить выигрыш в производительности. Но бывают случаи (хотя они редки), когда Hyper-Threading, наоборот, приводит к некоторому падению производительности. В настоящее время использование Hyper-Threading (при условии оптимизации ПО) позволяет получить значительный прирост скорости (до 30%) в задачах рендеринга изображений, архивировании, кодировании и расчетах.

По сравнению с продукцией конкурента, а именно AMD Athlon XP, процессоры Intel Pentium 4 демонстрируют уверенное преимущество во многих приложениях, в которых важны такие архитектурные особенности, как легкая масштабируемость по частоте, поддержка SSE2 и Hyper-Threading, мощная подсистема памяти. К таким приложениям относятся задачи кодирования данных, архивирование, рендеринг, работа с растровой графикой. С другой стороны, Pentium 4 «боится» хаотического программного кода и задач, активно задействующих FPU. Поэтому в играх и, к примеру, в научных расчетах AMD Athlon XP подбирается к конкуренту вплотную, а порой и превосходит его.

Процессоры Intel Pentium 4 на ядре Northwood выпускаются по технологии 0,13 мкм. Наиболее оборотистые модели выделяют достаточно много тепла, поэтому владельцам подобных систем следует позаботиться об эффективном охлаждении. Вместе с тем процессоры Intel отлично защищены от перегрева на аппаратном уровне. При резком повышении температуры они просто уменьшают тактовую частоту, что делает разгон этих процессоров более сложным.

В настоящее время в продаже можно встретить процессоры Intel Pentium 4 Northwood без поддержки Hyper-Threading, работающие на частоте системной шины 533 МГц и на тактовых частотах 2,26, 2,4, 2,53, 2,66 и 2,8 ГГц. Все модели с частотой FSB 800 МГц Hyper-Threading поддерживают. Их тактовые частоты составляют 2,4, 2,6, 2,8, 3,0 и 3,2 ГГц. Наконец существует процессор c тактовой частотой 3,06 ГГц и частотой системной шины 533 МГц, который также совместим с Hyper-Threading.

Владельцы Intel Pentium 4 имеют широкий выбор наборов системной логики. Наибольшую производительность демонстрируют чипсеты Intel семейства Springdale – i865PE и i875P. За ними следует одноканальный Intel i848P, одноканальный же VIA PT800. Замыкает рейтинг быстродействия одноканальный набор логики SiS648FX.

Цены на процессоры Intel Pentium 4 никогда не привлекали своей доступностью. Наиболее доступные модели стоят порядка $130, средние по производительности – $180–200$, и, наконец, топовые модели – $300–400.

В целом можно отметить, что Intel Pentium 4 на ядре Northwood является отличным выбором для людей, собирающихся собрать мощный компьютер, ориентированный на выполнение мультимедийных приложений.


Intel Pentium 4 Northwood Extreme Edition

Пытаясь сопротивляться натиску новой 64-битной платформы от AMD и в первую очередь наиболее производительному ее представителю – AMD Athlon 64 FX-51, компания Intel неожиданно для многих представила экстремальную версию (Extreme Edition) Intel Pentium 4 на ядре Northwood c интегрированным в кристалл инклюзивным кешем третьего уровня объемом ни много ни мало 2 Мбайт. Intel Pentium 4 XE — его коммерческое название.

Интересно, что как AMD Athlon 64 FX-51 является прямым родственником серверного AMD Opteron 1xx, так и Intel Pentium 4 XE происходит от процессора Intel Xeon MP с поднятыми до 800 МГц частотой системной шины и до 3,2 ГГц тактовой частотой.

Кеш третьего уровня – единственное отличие Intel Pentium 4 XE от стандартного Intel Pentium 4 на ядре Northwood. Отметим, что он работает на частоте ядра, а с кешем L2 соединен 64-битной шиной. Таким образом, пропускная способность канала L2-L3 составляет 24 Гбайт/с.

Процессор Intel Pentium 4 XE имеет прежний конструктив Socket478 и совместим с материнскими платами, изначально предназначенными для Intel Pentium 4. Отметим лишь, что у нового процессора возросла мощность, выделяемая в виде тепла, до 92 Вт. Поэтому к выбору системы охлаждения для подобного монстра необходимо подходить с особой осторожностью.

Архитектура NetBurst сильно зависит от эффективности подсистемы памяти. Поэтому быстрый и объемный кеш третьего уровня не мог не увеличить производительность Intel Pentium 4 XE. Наибольший прирост производительности по сравнению с Intel Pentium 4 3,2 ГГц наблюдается в архиваторах – от 10 до 20%, в играх и графических редакторах – порядка 10%. В задачах кодирования звука и видео и при рендеринге изображений выигрыша либо нет вовсе, либо он составляет несколько процентов.

Таким образом, Intel Pentium 4 XE так же, как и AMD Athlon 64 FX-51, — чисто имиджевый игровой процессор. Его стоимость составляет величину порядка $1000, что невообразимо много для массового потребителя. Но если у AMD Athlon 64 FX-51 цена завышена искусственно, то высокая стоимость Intel Pentium 4 XE, по всей видимости, обусловлена высокими производственными затратами.


Intel Pentium 4 Prescott

После того, как инженеры Intel достигли предела роста тактовых частот для технологии 0,13 мкм (3,2–3,4 ГГц), встал вопрос о переходе на более тонкий 0,09 мкм техпроцесс. На основе данной технологии с начала 2004 года планируется выпускать процессоры Intel Pentium 4 на новом ядре Prescott.

Ядро Prescott основано на той же архитектуре NetBurst, что и Northwood, которая обеспечивает легкую масштабируемость по частоте. Поэтому по ключевым параметрам Prescott не отличается от своего предшественника. Однако не следует думать, что новый процессор от Intel – это Northwood, выполненный по технологии 0,09 мкм. Prescott является существенно переработанным ядром, что ясно даже из скудных данных, предоставленных компанией Intel о своем детище.

В новом процессоре возросла эффективность работы блока предсказания ветвлений, а также блока предвыборки команд и данных из кеша первого уровня. Кроме того, увеличены объемы кеша данных первого уровня до 16 кбайт, Trace Cache – до 16 000 микроинструкций и кеша второго уровня – до 1 Мбайт. Все вышеперечисленные нововведения преследуют одну цель – обеспечить, по возможности, безостановочную работу длинных конвейеров архитектуры NetBurst на возросших тактовых частотах.

Intel Pentium 4 на ядре Prescott дополнен 13 новыми инструкциями поточной обработки данных, которые объединены в набор под названием PNI (Prescott New Instructions). Фактически PNI является расширением SSE2. Отметим, что данный набор команд будет поддерживаться всеми операционными системами, совместимыми с SSE. Итак, PNI объединяет инструкции обработки комплексных данных, команды преобразования вещественных чисел в целые, инструкции для ускорения процесса кодирования видео и синхронизации потоков. Предполагается, что новый набор команд должен увеличить быстродействие процессора Intel Pentium 4 в играх и мультимедиаприложениях.

В ядре Prescott усовершенствована технология Hyper-Threading. Теперь потоки могут разделяться на два типа – главный и второстепенные, а в руках программистов появились новые команды из набора PNI, позволяющие их синхронизовать. Таким образом, инженеры Intel предлагают избежать проблем, характерных для ядра Northwood, когда технология Hyper-Threading могла приводить к снижению быстродействия.

Также следует упомянуть об оптимизации работы функциональных блоков АЛУ при выполнении операции целочисленного умножения.

Пользуясь преимуществами техпроцесса 0,09 мкм, разработчики ядра Prescott существенно изменили компоновку функциональных блоков с целью достичь более равномерного распределения температуры по поверхности кристалла.

В производстве процессоров Intel Pentium 4 Prescott будет использоваться технология так называемого натяженного кремния, призванная уменьшить тепловыделение высокочастотных кристаллов. Однако, по имеющимся данным, рассеиваемая новыми процессорами мощность составляет величину порядка 100 Вт, что оказалось заметно выше ожидаемых величин.

Ожидается, что первые модели Prescott будут работать на частоте системной шины 800 МГц и иметь тактовые частоты 3,2 и 3,4 ГГц. При этом разъем сохранится старый — Socket478. Однако в ближайшем будущем произойдет переход на новый конструктив SocketT. Предполагается, что именно проблема совместимости ядра Prescott с упаковкой Socket478 является причиной переноса начала производства нового процессора Intel на начало 2004 года (ранее представители Intel утверждали, что наиболее вероятным временем анонса является октябрь-ноябрь 2003 года).


Intel Celeron Northwood Prescott

Процессоры Intel Celeron всегда позиционировались для рынка систем начального уровня. Не стали исключением и наши герои. Intel Celeron на базе ядра Northwood является «урезанным» вариантом Intel Pentium 4. Помимо того что данный процессор работает на низкой частоте FSB 400 МГц, он не поддерживает технологию Hyper-Threading и лишен большей части кеша 2 уровня — на его долю пришлось лишь 128 кбайт из первоначальных 512. Следует признать, что Celeron является несбалансированным чипом. Поэтому, даже несмотря на внушительные тактовые частоты (до 2,8 ГГц), он не в состоянии демонстрировать высокую производительность.

Более обнадеживающие результаты должны показать процессоры Intel Celeron на ядре Prescott. Характеристики данных чипов следующие: частота системной шины — 533 МГц, тактовые частоты первых моделей — 2,8 и 3,06 ГГц, объем кеша второго уровня – 256 кбайт, технология изготовления – 0,09 мкм.

Интересно, что Intel Celeron на ядре Prescott своим ранним появлением (конец 2003 года) обязан проблемам с процессорами Intel Pentium 4 Prescott. Дело в том, что в процессе интеграции нового ядра со старым конструктивом Socket478 обнаружилась проблема, не позволяющая Intel Pentium 4 работать на частоте системной шины 800 МГц. Поэтому было принято решение выпустить на рынок уже произведенные процессоры Intel Pentium 4 под видом Intel Celeron с искусственно отключенным кешем второго уровня и заниженной до 533 частотой FSB.


технические характеристики процессоров


Илья ГОЛУБЦОВ.






Мнения пользователей

Пока нет мнений о данной статье.


Оставить мнение

Имя

E-mail (не обязательно)

Мнение


Введите код

 
  все статьи    все тесты    экспертная оценка    школа потребителя  




Яндекс цитирования Яндекс.Метрика
Rambler's Top100
Система Orphus


Нашли ошибку на сайте? Выделите ее мышью и нажмите Ctrl+Enter.

Copyright © "Потребитель".
Использование материалов сервера в on-line изданиях разрешается при наличии гиппертекстовой ссылки на comp.potrebitel.ru.
Ссылка должна содержать слова: "Журнал ПОТРЕБИТЕЛЬ. Компьютеры и программы".
Использование материалов в off-line изданиях возможно лишь с письменного разрешения редакции.
По вопросам размещения рекламы, ошибкам на сайте, предложениям по работе сайта -


Место для рекламы: