На главную Назад
Добро пожаловать, уважаемый посетитель!

3.4. Процессоры

3.4.1. Функционирование процессоров

В состав процессора входят четыре основные блока:

  • арифметико-логическое устройство (АЛУ);
  • блок управления;
  • блок памяти;
  • устройства ввода/вывода.

Данная логическая организация процессора - архитектура - была определена еще в 1946 г. американским ученым (венгром по национальности) Дж. фон Нейманом. Сегодня, больше половины столетия спустя, почти все процессоры имеют архитектуру "фон Неймана".

3.4.1.1. Принцип работы

Принцип работы любого процессора заключается в следующем. На вход CPU m системной шине поступают сигналы в виде логических 0 или 1 (т.е. двоичные сигналы), эти сигналы декодируются и на основании набора инструкций, интегрированных в CPU, управляют работой процессора, затем на выход процессора поступают "результаты работы CPU" в виде логических 0 и 1. Логические 0 или определяются напряжением на линиях шины. CPU "принимает решение" в результате функционирования так называемых логических вентилей, каждый из которых состоит по крайней мере из одного транзистора Логические вентили процессора используют принципы, заложенные Лейбницем и Дж. Булем и развитые в работах Шеннона и Винера. Главными булевыми операторами являются И, ИЛИ, НЕ, и НЕ-И (не И), а также всевозможные комбинации этих операторов. Логические вентили обеспечивают построение необходимого набора логических цепей для реализации инструкций процессора. Логические вентили управляются транзистором данного вентиля. Однако эти транзисторы не являются отдельным элементом. Современные микропроцессоры на одном кристалле содержат десятки миллионов микроскопических транзисторов. Используемые в комбинации с резисторами, конденсаторами и диодами, они составляют логические вентили, которые в свою очередь и составляют основные блоки процессора. В 1971 г. корпорации Intel впервые удалось интегрировать логические вентили на одном кристалле и создать первый в мире процессор, получивший название Intel 4004. Функционирование всех элементов процессора синхронизировано с помощью таймера. Первый микропроцессор работал с тактовой частотой 108 кГц, в то время как современный Pentium 4 - 3,06 ГГц, т. е. выполняется 3 млрд тактов в секунду. Во время каждого такта происходит обращение к специальному модулю памяти CPU -счетчику программ (Programm Counter - PrC), который содержит адрес следующей выполняемой инструкции. Блок управления передает инструкцию из памяти в регистры инструкций (Instruction Registers - IR). В то время как процессор выполняет инструкцию из IR, в счетчик программ поступает ссылка на следующую инструкцию. Некоторые инструкции обрабатывают непосредственно в блоке управления. Однако большинство инструкций поступает в арифметико-логическое устройство (arithmetic and logic unit - ALU), в котором выполняются арифметические и логические операции над числами.

3.4.1.2. Основные компоненты процессора

Главные функциональные компоненты процессора описаны ниже.

  • Ядро. Основной компонент процессора, осуществляющий выполнение команд. Pentium имеет два параллельных целочисленных конвейера, дающие возможность читать, интерпретировать, выполнять и посылать две команды одновременно.
  • Модуль предсказания перехода (Branch Predictor). Модуль определяет изменение последовательности выполнения команд после перехода, для того чтобы переслать эти команды заранее в декодер команд.
  • Сопроцессор. Модуль для выполнения операций с нецелыми числами (числами с плавающей точкой).
  • Кэш-память первого уровня (LI). CPU Pentium имеет два модуля кэш-памяти (L1) по 8 Кбайт каждый, один для команд, а другой для данных. Время доступ к данным модулям намного быстрее чем к внешней кэш-памяти второго уровня (L2).
  • Интерфейсный модуль системной шины. По системной шине в CPU поступают команды и данные, которые в данном модуле разделяются на два потока. В случае, когда данные и команды выходят от CPU, потоки объединяются.


Рис.3.11. Основные компоненты процессора Pentium

Переход - это изменение последовательности выполнения команд в соответствии с алгоритмом программного обеспечения. Согласно статистике, переходы встречаются в среднем через каждые шесть команд. Существуют безусловные переходы (типа GOTO), когда управление передается по новому указанному адресу, и условные (типа IF), когда изменяется ход выполнения программы в зависимости от результатов сравнения. Условные переходы снижают общую производительность CPU, т. к. в ожидании этого перехода конвейер работает вхолостую.

Увеличение быстродействия процессора

Согласно закону, сформулированному в 1965 г. Гордоном Муром, количество транзисторов в интегральной микросхеме увеличивалось вдвое каждые 18 месяцев. Мур предсказал, что эта тенденция будет сохраняться в течение следующих десяти лет. График показывает, что закон выполняется и до настоящего времени. Законы физики ограничивают разработчиков в безграничном увеличении тактовой частоты процессора. Поэтому инженеры постоянно ищут способы заставить процессор выполнять как можно больше операций за один такт. Один подход состоит< увеличении разрядности шины данных и регистров. Первый CPU был 4-разрядным, большинство современных CPU имеет 32-разрядную шину, разрабатываются и 64-разрядные процессоры. Кроме того, внедряются и другие технологические решения, основные из которых рассмотрены далее.

Сопроцессор

Помимо обмена информацией с другими микросхемами на плате, главное предназначение CPU - считать, считать и считать. Если вы вспомните свое школьное время, то констатируете факт, что счет счету рознь. Основные арифметические операции, такие как сложение и вычитание, умножение и деление, приносят меньше забот, чем возведение в степень, вычисление тангенсов или операции с плавающей точкой.

На заре своего существования процессоры могли эффективно работать только с целыми числами. Для того чтобы обрабатывать дробные числа, необходимо было писать специальные программы, используя простые команды.

Для выполнения арифметических операций с плавающей точкой был разработан специальный арифметический процессор, называемый сопроцессором. В отличие от CPU, он не управляет системой, а ждет команду CPU на выполнение арифметических вычислений и формирование результатов. Согласно заявлениям фирмы Intel, арифметический сопроцессор может сократить на 80% и более (по сравнению с CPU) время выполнения таких арифметических операций, как умножение и возведение в степень. Скорость выполнения сложения и вычитания, как правило, остается без изменения.

Сопроцессор - только обиходное название для этого чипа. Правильно он называется математический сопроцессор (Numeric Processing Unit - NPU, или Floating Point Processing Unit, FPU). Сопроцессор стал впервые применяться с CPU третьего поколения. Тогда он располагался на материнской плате. Начиная с CPU 486DX, сопроцессор интегрирован прямо в CPU.

Конвейерная обработка

Сказать, что процессор с тактовой частотой 100 МГц выполняет 100 млн команд в секунду - не верно. Для выполнения одной команды требуется, как правило, пять тактов: один, чтобы загрузить команду; один, чтобы ее декодировать; один, чтобы ! загрузить данные, один - выполнить команду и один, чтобы записать результат, В этом случае очевидно, что процессор с тактовой частотой 100 МГц может выполнить лишь 20 миллионов команд в секунду.

Большинство процессоров теперь использует конвейерную обработку. Под конвейером в данном случае понимается такой метод внутренней обработки команд, когда исполнение команды разбивается на несколько ступеней (Stages) и каждой ступени соответствует свой модуль в структуре CPU. По очередному тактовому импульсу каждая команда в драйвере продвигается на следующую ступень, при этом выполненная команда покидает конвейер, а новая поступает в него.

Конвейерную обработку можно сравнить с работой грузчиков, стоящих в "цепочке" и передающих из рук в руки упаковки с продуктами. В этом случае процесс погрузки (разгрузки) существенно ускоряется по сравнению с тем, когда каждый грузчик бегает с отдельной упаковкой к месту их складирования. Процессоры, имеющие несколько ступеней, называются суперскалярными.

Таким образом, если за один такт одна команда загружается, другая декодируется, для третьей команды загружаются данные, четвертая фактически выполняется, а результаты пятой команды записываются, то можно говорить, что одна команда выполняется за один такт.

Суперскалярная архитектура

Процессоры, имеющие несколько конвейеров, называются суперконвейерными. Таким образом, несколько команд могут выполняться параллельно. Так, например, CPU Pentium Pro способен выполнить до пяти команд за один такт.

Технология ММХ/ММХ2

Технология ММХ ориентирована на решение задач мультимедиа, требующих интенсивных операций с целыми числами. Подобные задачи решают игровые, коммуникационные, обучающие программы, которые используют графику, аудио, трехмерное изображение, мультипликацию и т. п. Сущность технологии ММХ состоит в появлении в CPU Pentium виртуального эквивалента 8 новых 64-разрядных регистров и 57 новых команд для решения задач мультимедиа. Восемь новых регистров можно назвать виртуальными потому, что физически эти регистры являются регистрами сопроцессора. Таким образом, сохраняется совместимость с предыдущими поколениями программ. В сопроцессорах Pentium имеется восемь универсальных регистров для операций над числами с плавающей точкой по 80 бит каждый. При описании числа с плавающей точкой используются 64 бита для мантиссы и 16 бит для экспоненты. Команды ММХ используют только 64-разрядную часть мантиссы каждого из регистров сопроцессора. Регистры сопроцессора могут содержать 8 упакованных байтов, 4 упакованных 16-разрядных слова, два упакованных 32-разрядных двойных слова или же одно 64-разрядное слово. Таким образом, данные мультимедиа, разрядность которых кратна восьми, упаковываются в одно 64-разрядное слово, и над ним производится некое общее действие. Эта методика называется одиночной командой с множественными данными (Single Instruction Multiple Data, SIMD) и ориентирована на алгоритмы и типы данных, которые характерны для программного обеспечения мультимедиа. Предположим, что программа управляет графикой в 8-разрядном представлении цвета (т. е. цвет каждого пиксела кодируется 8 битами), который чаще всего используется в играх. ММХ-команда может упаковать восемь пикселов в один операнд и обработать их все одновременно. Обычный CPU обрабатывает пикселы последовательно. Приложения, работающие со звуком, в основном используют 16-разрядные пакеты данных, таким образом, одна команда ММХ может обработать сразу четыре таких пакета. Следует отметить, что для реализации этого алгоритма требуется специальное программное обеспечение, ориентированное на CPU класса ММХ. В январе 1999г. в технологию ММХ было добавлено 70 новых команд (SIMD-инструкций) групповой обработки данных с плавающей точкой (50) и дополнительные команды групповой обработки целочисленных данных (20). Благодаря этому набору команд, называемому SSE (Streaming SIMD Extensiuon), KNI (Katmai New Instruction) или ММХ2, были расширены возможности обработки изображений, потоков аудио- и видеоданных, а также распознавания речи.

Технология 3DNow!

Для решения задач мультимедиа корпорация AMD разработала и установила на свои CPU новый модуль с конвейерной структурой для обработки 24 новых 3D-инструкций для ускорения обработки трехмерной графики, аудио- и видеоданных. Этот модуль получил название 3DNow!. В отличие от технологии ММХ, основанной на работе с целыми числами, в набор инструкций 3DNow! включены команды, работающие с вещественными числами, что важно при расчете трехмерных сцен. Теоретически 3DNow! должен заменить сопроцессор при расчете трехмерных объектов. Модуль может выполнять одновременно до четырех SIMD-инструкций, что заметно увеличивает производительность процессора.

Технология Hyper-Thereading

Фактически все современные операционные системы (начиная с Windows NT) и приложения (базы данных, программы мультимедиа, CAD и др.) поддерживают так называемые потоки или нити (threads). Потоки - это наборы команд, для выполнения которых процессором выделяется время. Потоки позволяют в рамках одной программы решать несколько задач одновременно. К примеру, пакеты из состава MS Office задействуют по несколько потоков. MS Word может одновременно корректировать грамматику и печатать, при этом осуществляя ввод данных с клавиатуры и мыши.

В многопроцессорных системах разные потоки могут обрабатываться на разных процессорах (при использовании современных операционных систем и приложений), что увеличивает скорость обработки данных. Технология Hyper-Thereading имитирует работу с потоками 2-процессорной системы, создавая на одном CPU два логических 32-разрядных процессора.

Для реализации в системе технологии Hyper-Thereading необходимо:

  • новейший процессор Intel Pentium 4 с тактовой частотой 3,06 ГГц или выше;
  • набор микросхем IntelR с поддержкой технологии Hyper-Thereading;
  • BIOS с поддержкой технологии Hyper-Thereading (соответствующая опция должна быть включена);
  • операционная система, оптимизированная для работы с технологией Hyper-Thereading.

3.4.2. Основные характеристики процессоров

3.4.2.1. Внутренняя разрядность данных

Это количество бит информации, которое процессор может обрабатывать одновременно. Данная характеристика важна при выполнении простейших арифметических и логических операций. В зависимости от типа процессора внутренняя разрядность данных может составлять 16, 32 или 64 бита.

3.4.2.2. Внешняя разрядность данных

Это количество бит информации, рассматриваемой как единое целое, которым процессор может обмениваться с другими устройствами (кэш-памятью, оперативной памятью и т.д.) посредством системной шины. Данная величина может составлять 8, 16, 32, 64 бита.

3.4.2.3. Внутренняя и внешняя тактовая частота

Все процессоры являются синхронными устройствами. Это значит, что любые операции, выполняемые ими синхронизируются по времени тактовым сигналам. В зависимости от сложности операции, выполняемой процессором, она может длиться несколько тактов.

Из-за того, что быстродействие процессора может существенно превышать быстродействие всех остальных компонентов компьютера (памяти, внешних устройств и т.д.), используются разные тактовые частоты:

  • Внешняя тактовая частота процессора, равная частоте системной шины, синхронизирующая операции обмена данными по системной шине между процессором и другими устройствами.
  • Внутренняя тактовая частота процессора, используемая для синхронизациии работы самого процессора. Эта частота образуется внутри процессора путем умножения внешней тактовой частоты на заданный коэффициент (например, 1.5, 2, 2.5, 3, 3.5 и т.д.).

Для процессоров 8086, 80286, 80386 и ранних моделей процессоров 80486 (например, 486DX/SX-25, 33, 40, 50) внешняя и внутренние тактовые частоты совпадали. Во всех современных процессорах широко применяется умножение внешней тактовой частоты для получения большей внутренней тактовой частоты процессора. Имеется два способа увеличения производительности компьютера:

  • Повышение внутренней тактовой частоты процессора, выполняемое путем замены процессора с одной внутренней частотой на другой процессор с более высокой частотой. Это увеличивает производительность самого процессора. Данный способ имеет ограниченное применение, т.к. процессор вынужден простаивать при выполнении операций обмена данными с другими устройствами по системной шине, которая имеет тактовую частоту гораздо меньшую, чем внутренняя частота процессора.
  • Повышение частоты системной шины, увеличивающее производительность самой шины и заодно процессора, т.к. при заданном коэффициенте умножения частоты процессора его внутренняя частота тоже увеличивается. Этот способ дает больший эффект для повышения быстродействия системы в целом. Однако, не все устройства компьютера устойчиво работают на повышенных частотах системной шины.

3.4.2.4. Максимальный объем адресуемой памяти

Этот показатель напрямую зависит от количества разрядов n шины адреса и рассчитывается по формуле 2n. Как правило, процессор теоретически может адресовать гораздо больший объем оперативной памяти, чем тот, который фактически можно установить на конкретной системной плате. Например, системная плата на чипсете Intel 80440BX может работать не более чем с 512 Мбайт оперативной памяти, хотя процессор Pentium-II может адресовать теоретически 4 Гбайта памяти.

3.4.2.5. Режимы работы процессора

Для всех процессоров, которые применяются в IBM-совместимых компьютерах, характерно три режима работы - реальный, защищенный и режим эмуляции процессора 8086.

3.4.2.6. Внутренняя кэш-память

Представляет собой сверхбыстродействующее ОЗУ небольшой емкости, входящее в состав процессора. Внутренняя кэш-память постоянно обновляется и хранит данные из оперативной памяти компьютера, к которым процессор обращался сравнительно недавно. При повторных запросах процессора на чтение, он получает данные не из относительно медленной оперативной памяти, а из более быстрой внутренней кэш-памяти. Впервые внутренняя кэш-память емкостью 8 Кбайт была использована в процессоре 80486. Малая емкость внутренней кэш-памяти обусловлена ее высокой стоимостью (плата за высокое быстродействие) и необходимостью размещения ее на одном кристалле с процессором.

3.4.2.7. Напряжение питания

Проблема - отвод тепла (зависит от внутренней тактовой частоты процессора, степени интеграции и напряжения его питания)

Первые процессоры (8086-80486DX2-66)- U=5B

Последующие CPU (486DX2-66) -3B

Блок питания подает на процессор стандартное напряжение (+5 В), которое может быть преобразовано с помощью микросхем-преобразователей напряжения в набор напряжений (3.5 В, 2.8 В, 2.5 В, 2.2 В, 2.0 В и др.), необходимых для питания процессоров различных типов.

3.4.2.8. Форм-фактор

Под форм-фактором процессора понимаются не только его геометрические размеры, но и количество и расположение контактов, с помощью которых процессор соединяется с системной платой. В зависимости от форм-фактора меняются и способы крепления процессора на плате. Применялись следующие основные способы крепления: пайка, установка в "кроватку" (PGA-разъем), установка в ZIF-разъемы, установка в картридж (Slot1).

3.4.3. Способы крепления процессора на системной плате

Крепление процессора с помощью пайки

Первые микропроцессоры впаивались непосредственно на системную плату. Такой способ крепления широко использовался начиная процессоров с 8086 до 80386 включительно. Такой подход существенно ограничивал возможности дальнейшей модернизации компьютера путем замены процессора.


Рис.3.12. Внешний вид процессора 80386, впаянного на системную плату

Установка в "кроватку" (PGA-разъем)

Данный вид крепления имеет преимущество по сравнении с пайкой процессора, т.к. позволяет относительно легко осуществить замену процессора., т.е. в данном случае жесткого соединения процессора с системной платой не происходит. Для установки процессора достаточно просто вставить его в соответствующий разъем ("кроватку"). Такая установка использовалась для крепления процессоров 80286 и 80386

Установка в ZIF-разъемы

На смену ранее описанным методам крепления пришел метод установки процессора в ZIF-разъемы с "нулевым" усилием вставки, который получил широкое распространение (80486, Pentium, Pentium-MMX). В отличие от установки в "кроватку" разъемы такого типа (Socket 3 -Socket 7) позволяют более надежное крепление процессора путем использования специального зажима. На самом процессоре и на разъеме один из углов срезан, что позволяет однозначно ориентировать процессор при вставке.


Рис.3.13. Внешний вид разъема Socket 7


Рис.3.14. Внешний вид разъема процессора AMD К-5, устанавливаемого в Socket 7

Установка в картридж

Для высокопроизводительных процессоров типа Pentium II, Celeron, Xeon был разработан новый способ установки, когда процессор устанавливается в специальный SEC-картридж (Single Edge Contact), и уже этот картридж устанавливает перпендикулярно в специальный разъем на системной плате, подобный слотам для установки модулей оперативной памяти. Такой разъем называется Слот 1. Для охлаждения процессора в картридж встроена теплоотводная пластина, к которой присоединен радиатор. Специально для многопроцессорных систем разработан новый Слот 2, картридж которого значительно больше по размерам. Использование картриджей экономит место на системной плате, используемое ранее под размещение разъема для установки процессора.

3.4.4. Состав и история развития семейства процессоров Intel

Название процессора и год появления

Тактовая

частота, МГц

Разрядность шины данных

Разрядность шины адреса

Наличие и размер внутренней кэш-памяти

Способ

крепления

Особенности

8086

1976 г.

8

16

20

-

пайка

Применялся в компьютерах класса XT; работает только в реальном режиме; доступно 1 Мб оперативной памяти

8088

1978 г.

4,77

8

20

-

пайка

Более дешевая версия за счет уменьшения разрядности шины данных, но менее производительная

80286

1981 г.

от 6, 8 до 20

16

24

-

пайка или установка в "кроватку"

Применялся в первых комптьютерах класс AT; работает не только в реальном, но и в защищенном режиме, в котором может обращаться к 16 Мб физической и 1 Гб виртуальной памяти

80386DX

1986 г.

33

32

32

-

пайка или установка в "кроватку"

Также как и 80286 поддерживает защищенный режим, в котором может обращаться к 4 Гб физической и 64 Гб виртуальной памяти, поддерживает виртуальный (эмуляция нескольких процессоров 8086) режим, для повышения производительности системы в целом может работать с внешней установленной на системной плате кэш-памятью

80386SX

1985 г.

16, 25

16

32

-

пайка

Является "упрощенной" версией 80386DX

80486DX

1989 г.

25, 33, 50

32

32

8 Кб

Socket 5

Имеет интегрированный сопроцессор для выполнения вычислений с плавающей точкой; конвейризация вычислений, то есть каждая последующая команда начинает выполняться после прохождения первой ступени предыдущей команды; расширенный набор команд

80486SX

1991 г.

20, 33

32

32

8 Кб

Socket 5

Является "упрощенной" версией 80486DX; отсутствует сопроцессор

80486DX/2

1992 г.

40, 50, 66

32

32

8 Кб

Socket 5

Представляет собой развитий 80486DX за счет удвоения тактовой частоты; требует систему охлаждения процессора (радиатор или вентилятор)

80486DX/4

1994 г.

75, 83, 100

32

32

16 Кб

Socket 5

Представляет собой развитий 80486DX/2 за счет удвоения тактовой частоты

80586 (Pentium)

1993 г.

60, 66, 75, 90, 100, 133, 150, 166, 200

64

32

16 Кб

Socket 7

Встроенный сопроцессор дает 3-4-кратный выйгрыш по скорости выполнения операций по сравнению с 80486; получила дальнейшее развитие конвейризация вычислений; имеется специальный буфер адреса перехода, где хранятся данные о последних 256 адресах перехода.

80686

(Pentium Pro)

1995 г.

200,

64

32

16 Кб

  Предназначен для работы с мощными вычислительными система и прикладными программами высокого класса, для обычных пользователей не дает выйгрыша в производительности; наличие встроенной кэш-памяти второго уровня

Pentium MMX

1997 г.

200, 233

64

32

16 Кб

Socket 7

Ориентирован на решения задач мультимедиа, то есть увеличения скорости работы с графикой, звуком, трехмерными изображениями, мультипликацией и т.д.;

Pentium II

233, 266, 300

64

32

32 Кб

Slot 1

Представляет собой модификацию Pentium Pro с поддержкой MMX; использована двойная системная шина DIB (Dual Independent Bus), тоесть процессор с кэш-памятью и оперативной памятью двумя различными шинами

Celeron

1998 г.

266

64

32

32 Кб

Slot 1,

Celeron Socket

Удешевленная версия Pentium II; отсутствует кэш-память второго уровня

3.4.4.1. AMDK5

Во втором квартале 1996 г. компания AMD анонсировала CPU K5-PR75 и K5-PR90, ориентированные на рынок недорогих систем для дома и малого офиса. Уже в этих первых моделях AMD была реализована более совершенная архитектура, чем в процессорах Pentium.

Таблица 6.15. Основные характеристики процессоров AMD K5 и Pentium

Элемент архитектуры CPU  AMDK5 Pentium
Суперскалярная архитектура (количество ступеней)  5 5
Количество конвейеров 4 2
Кэш-память первого уровня (команды + данные), Кбайт 16+8 8+8
Исполнение по предложению + -
Динамическое предсказание переходов  + -
80-разрядный FPU  + +

В июне 1996 г. на рынке появился CPU AMD K5-PR100, выполненный по 0,35 мкм технологии и содержащий 4,3 млн транзисторов, а несколько позднее - AMD К.5-PR133 . Конструктивно этот CPU выполнен в 256-штырьковом корпусе типа SPGA и так же, как и K5-PR75, K5-PR90, полностью совместим по выводам с CPU Pentium P54C. Однако перед установкой подобного процессора в гнездо материнской платы необходимо посмотреть документацию на плату и убедиться, что она поддерживает AMD K5.

Стоимость CPU AMD K5 примерно на 30% ниже стоимости аналогичных по производительности CPU Intel Pentium. Определенным недостатком применения процессов AMD следует считать отсутствие их поддержки в материнских платах производства корпорации Intel.

3.4.4.2. Cyrix 6x86

Компания Cyrix впервые в истории PC создала CPU, превосходящий по интегральной производительности процессор такого же класса, что и выпускаемый корпорацией Intel, - это Cyrix 6x86 (рис. 6.13). Процессор Cyrix 6x86 одинаково стабильно работает как с 32-, так и с 16-разрядными приложениями. Особенностью Cyrix 6x80 является объединенная кэш-память первого уровня (L1) для команд и данных, что было характерно для CPU 80486.

3.4.4.3. Pentium III

Процессор Pentium III пришел на смену Pentium II в январе 1999 г. Основное отличие данного процессора от Pentium II состоит в том, что он поддерживает набор из 70 новых команд (SIMD-инструкций - Single Instruction Multiple Data) групповой обработки данных с плавающей точкой (50) и дополнительные команды групповой обработки целочисленных данных (20). Благодаря этому набору команд, называемому SSE (Streaming SIMD Extension), KNI(Katmai New Instruction) или ММХ2, расширяются возможности обработки изображений, потоков аудио- и видеоданных, распознавание речи.

Архитектура процессора существенных изменений не потерпела. CPU Pentium III выпускаются в корпусах двух типов: S.S.E.C. 2 и PPGA (называемый также FC-PGA -Flip Chip-PGA).

Картридж S.E.C.C. 2, как и S.E.C.C., устанавливается в разъем Slot 1. В отличие от S.E.C.C. он не имеет термопластины - внешние "холодильники" прижимаются непосредственно к корпусу микросхем ядра и кэш-памяти, что повышает эффективность охлаждения. Однако в дальнейшем Intel отказалась от картриджей и было решено использовать для CPU Pentium III разъем Socket 370.

Katmai

Первые CPU имели ядро под кодовым названием Katmai, созданное по 0,25 мкм технологии. CPU Pentium III Katmai работал на тактовых частотах 450, 500, 533, 550 и 600 МГц. В картридже этого процессора установлено 512 Кбайт кэш-памяти (L2), работающей на половинной тактовой частоте ядра CPU.

Coppermine

В сентябре 1999 г. появился CPU Pentium III с ядром Coppermine. Оно создано по технологии 0,18 мкм. Уменьшение размеров минимальной структуры ядра с 0,25 до 0,18 мкм позволило увеличить тактовую частоту CPU до 1 и более ГГц.

В отличие от CPU Pentium III Katmai, в ядро Coppermine интегрировано 256 Кбайт кэш-памяти (L2) типа Advanced Transfer Cache, работающей на тактовой частоте CPU. Кэш-память связана с ядром 256-разрядной шиной, а не 64-разрядной как у Pentium III Katmai. Тактовая частота системной шины составляет 100 или 133 МГц. Процессоры, поддерживающие тактовую частоту системной шины 133 МГц, обозначают при маркировке буквой "Е" (например, Pentium III 600E). Весной 2000 г. появились процессоры Pentium HI с тактовой частотой 850 и 866 МГц, которые уже устанавливались не в слот S.E.C.C. 2, а в гнездо FC-PGA. Это привело к необходимости создания специального "переходника" SSA (slot-to-socket adapter), для совместимости новых процессоров с материнскими платами, выпущенными в начале 2000 г.

В конце мая 2000 г. тактовая частота CPU Pentium III достигла 933 МГц и до преодоления барьера 1 ГГц было совсем недалеко. Однако 31 июля 2000 г. Intel был вынужден отозвать всю партию процессоров Coppermine 1,13 ГГц в связи с тем, что использование данного CPU приводило к "зависанию" операционной системы при выполнении некоторых приложений. Возможно, проблема в выпуске на рынок "полуфабриката" связана с конкурентной гонкой Intel и AMD. Компания AMD двумя неделями раньше преодолела барьер 1 ГГц, выпустив на рынок процессор Athlon,

Tualatin

В середине 2001 г. на рынке появился процессор Pentium III с новом ядром Tualatin. Дл изготовления данного ядра была впервые применена 0,13 мкм технология и использованы медные проводники. Процессор устанавливается в гнездо Socket 370, однако необходимы специальные материнские платы, поскольку процессор с ядром Tualatin используя сигналы с напряжением 1,25 В, а не 1,5 В, как Coppermine.

Ядро Tualatin также имеет и некоторые архитектурные усовершенствования по сравнению с Coppermine, так, изменился внутренний микрокод процессора, что выразилось! уменьшении числа тактов, требуемых для выполнения некоторых программ.

Уменьшение площади кристалла сделало невозможным использование старой схемы охлаждения (когда радиатор непосредственно контактирует с кристаллом), поэтому Tualatin использует термический интерфейс, аналогичный применяемому в Pentium 4. Первоначально CPU Pentium III Tualatin был заявлен как процессор для настольных систем (Pentium III-A), для серверов (Pentium III-S) и мобильных компьютеров (Pentium III-М). Pentium III-A и Pentium III-S имеют кэш-память 512 Кбайт, в то время как Pentium III-M - лишь 256 Кбайт, по-видимому, чтобы не создавать конкуренцию CPU Pentium 4 для настольных компьютеров. Процессор Pentium III Tualatin "помог" Intel преодолеть барьер в 1 ГГц и канул в лету, поскольку все свои усилия Intel направила на продвижение на рынке процессора Pentium 4. Однако Pentium III-M нашел широкое применение в Notebook.

3.4.4.4. Celeron

Учитывая высокую стоимость процессоров Pentium II, корпорация Intel в апреле 1998 г. анонсировала первый процессор семейства Celeron, который по замыслу создателей должен был ускорить процесс перехода пользователей на новое поколение процессоров. Процессоры семейства Celeron базируются на архитектуре Р6 с поддержкой технологии ММХ и представляли собой удешевленную версию процессоров Pentium II. Впоследствии Intel разработала удешевленные версии процессоров Pentium III и Pentium 4.

Covington

Первоначально процессоры Celeron использовали ядро Covington с элементами размером 0,25 мкм, содержащее 7,5 млн транзисторов. Тактовая частота работы процессора составляла 266 и 300 МГц, а системной шины - 66 МГц. В ядро была встроена кэш-память первого уровня объемом 32 Кбайт.

Кэш-память второго уровня для данного типа CPU Celeron отсутствует. Поскольку Celeron ориентирован на пользователей обычных домашних компьютеров, то отсутствие кэш-памяти второго уровня не вызывает заметного замедления при работе с несложными офисными приложениями, в Internet и т. д.

Набор команд SSE не поддерживается. В отличие от Pentium II, картридж процессора не был оборудован защитным кожухом.

Процессор устанавливается в гнездо Slot 1. Ему требуется напряжение питания не 2,8 В, как процессору Pentium П, а 2 В. Установленная на материнской плате система BIOS должна "знать" об установке процессора Celeron, поскольку для его работы необходима загрузка специального микрокода. При загрузке BIOS на экране монитора должно появиться соответствующее сообщение об установленном процессоре Celeron, в противном случае система зависнет на этапе загрузки или вообще не будет загружаться. Специально для процессора Celeron корпорация Intel разработала Chipset 440ЕХ и ZX. Кроме того, процессор работал с любым Chipset, который поддерживал CPU Pentium II (440LX, 440ВХ).


Рис.3.15. Процессор Celeron: а - без радиатора; б - с радиатором

Mendocino

Второй процессор семейства Celeron получил "в подарок" от Intel кэш-память второго уровня (L2) размером 128 Кбайт. Причем эта кэш-память установлена не на плате процессора, а непосредственно в ядре и работает на тактовой частоте процессора. Ядро выполнено по 0,25 мкм технологии, а наличие встроенной кэш-памяти обусловило увеличение количества транзисторов до 19 млн. Новое ядро получило название Mendocino. Набор команд SSE не поддерживается.

Тактовая частота этого процессора составляет 300, 333, 366, 400, 433, 466, 500 и 533 МГц, а тактовая частота системной шины - 66 МГц.

Для процессора, имеющего ядро Mendocino (называемого также Celeron М'или Celeron ЗОО'А'), разработан разъем на 370 контактов- Celeron Socket (или Socket370). Эти процессоры выпускают как в картриджах S.E.C.C. (для установки в Slot 1), так и в корпусе PPGA (для установки в гнездо Celeron Socket).

Coppermine 128K

Процессор Celeron с ядром Coppermine (используемым в CPU Pentium III), выполненным по 0,18 мкм технологии, является дальнейшим развитием CPU семейства Celeron. Он выпускается в корпусе FC-PGA и содержит 128 Кбайт интегрированной кэш-памяти. В отличие от своих "младших братьев" Celeron Coppermine 128K поддерживает тактовую частоту системной шины 100 МГц. Кроме того, он поддерживает SIMD-инструкции SSE. Тактовая частота первых процессоров Celeron Coppermine составляла 533 МГц, а к осени 2001 г. достигла 1,1 ГГц.

Tualatin

Первый процессор Celeron с ядром Tualatin (0,13 мкм) появился на рынке в октябре 2001 г. и имел тактовую частоту 1,2 ГГц. Однако тактовая частота системной шины оставалась 100 МГц. Впоследствии возникли проблемы при создании Celeron с ядром Tualatin, работающим с тактовой частотой системной шины 133 МГц, кроме того, не удалось увеличить тактовую частоту процессора более 1,4 ГГц. Объем адресуемой памяти составлял 64 Гбайт, а объем кэшируемой памяти -4 Гбайт.

Willamette

В мае 2002 г. появился процессор Celeron с тактовой частотой 1,7 ГГц, а в июне -1,8 ГГц, которые получили "в подарок от Pentium 4" ядро Willamette. Наличие нового ядра также позволило увеличить тактовую частоту системной шины CPU до 400 МГц, а введение 70 новых инструкций ММХ2 (среди которых инструкции для групповой обработки вещественных чисел одной командой, дополнительные команды для работы с целыми числами и управления кэшированием) позволили улучшить качество и быстродействие работы CPU с мультимедийными приложениями и приложениями для работы в Интернете.

Кроме того, в CPU реализован блок конвейерной обработки чисел с плавающей запятой (FPU), поддерживающий 32- и 64-разрядные форматы, описанные в стандарте IEEE 754, а также 80-разрядный формат.

Объем адресуемой (64 Гбайт) и кэшируемой памяти (4 Гбайт) остался без изменения. В отличие от Celeron Tualatin, процессор Celeron Willamette устанавливается в гнездо Soket 478.

Northwood

В сентябре 2002 г. CPU Celeron с ядром Northwood достиг тактовой частоты 2 ГГц, а в ноябре - 2,2 ГГц. В остальном он не отличался от своего предшественника Celeron Willamette.

3.4.4.5. AMD K6-2

Процессор AMD K6-2 (K6-3D, Chompers) был анонсирован фирмой AMD в 1998г, В отличие от предшественника AMD Кб, в ядро CPU К6-2 добавлен новый модуль с конвейерной структурой для обработки 24 новых ЗО-инструкций для ускорения обработки трехмерной графики, аудио- и видеоданных. Этот модуль получил название 3DNow!

В отличие от технологии ММХ, основанной на работе с целыми числами, в набор инструкций 3DNow! включены команды, работающие с вещественными числами, что важно при расчете трехмерных сцен. Теоретически 3DNow! должен заменить сопроцессор при расчете трехмерных объектов. Модуль может выполнять одновременно до четырех SIMD-инструкций, что заметно увеличивает производительность процессора.

Теоретически производительность AMD K6-2 при расчете трехмерных объектов превышает возможности современных Pentium II, однако для этого необходимо, чтобы приложения использовали те же самые 24 инструкции с учетом конвейерной структуры модуля 3DNow!. По заявлениям фирм-изготовителей многие популярные видеокарты будут иметь поддержку 3DNow!. Появились также компьютерные игры, ориентированные на работу с этим модулем. Однако из-за трудоемкости оптимизации приложений под модуль 3DNow! этот процесс продвигается медленно, а для ММХ2 уже разработан специальный компилятор, который призван помочь разработчикам программного обеспечения.

Процессор AMD K6-2 устанавливается в разъем Socket 7 и работает на тактовой частоте 266-400 МГц.

Разъем Super 7, разработанный при активном участии компании AMD, является развитием недорогой и проверенной платформы Socket 7. В отличие от Socket 7 платформа Super 7 поддерживает:

  • тактовые частоты системной шины 95 и 100 МГц;
  • AGP (Accelerated Graphics Port);
  • РС100 SDRAM, Ultra DMA, ACPI и требования спецификации PC 98;
  • кэш-память второго уровня (L2), работающую на частоте процессора, и поддержку внешнего, дополнительного кэша третьего уровня (L3).

Процессоры AMD K6-2 работают на тактовой частоте от 266 до 450 МГц, при этом тактовая частота системной шины составляет 66, 95 или 100 МГц. Рабочее напряжение ядра - 2,2 В.

3.4.4.6. AMD K6-3

В отличие от процессора AMD K6-2, в ядро процессора AMD K6-3 (K6+3D) интегрировано 256 Кбайт кэш-памяти второго уровня, работающей на частоте процессора. Объем кэш-памяти первого уровня (как и в AMD K6-2) составляет 64 Кбайт. Кроме того, на материнской плате располагается кэш-память третьего уровня (L3) объемом от 512 до 2048 Кбайт. CPU поддерживает тактовую частоту системной шины 100 МГц и устанавливается в разъем Super 7.

3.4.4.7. VIA Cyrix III

Процессор VIA Cyrix III разработан компанией VIA, которая приобрела компанию Cyrix. CPU устанавливается в разъем Socket 370. Кэш-память первого уровня составляет 64 Кбайт (объединенный), а второго уровня - 256 Кбайт. Кэш-память интегрирована в ядро. Тактовая частота системной шины - 66/100/133 МГц. CPU поддерживает технологии ММХ и 3DNow!. По своим характеристикам CPU VIA Cyrix III не уступает CPU Intel. Данный CPU известен также под именем Joshua (ранее он назывался Jedi и Gobi).

Таблица 6.24. Характеристики CPU VIA Cyrix III
Характеристика VIA Cyrix III Intel Pentium III  Intel CeleronT 
Тактовая частота системной шины, МГц 66/100/133 100/133  66/100 
SIMD-инструкции ММХ, 3DNow! SSE ММХ 
Кэш-память L1 , Кбайт  64 (объединенная)  16 + 16  16 + 16
Кэш-память L2, Кбайт 256 (на частоте ядра)  512 (на половине частоты ядра)  128 (на частоте ядра)

3.4.4.8. Athlon (AMD K-7)

23 июня 1999 г. корпорация AMD анонсировала свои первые процессоры седьмого поколения AMD Athlon (K-7) с тактовой частотой 500, 550 и 600 МГц, которые появились в августе 1999 г., а 6 марта 2000 г. был объявлен CPU с тактовой частотой 1000 МГц. Микроархитектура седьмого поколения и системная шина с высокой пропускной способностью позволили процессору AMD Athlon достигнуть уровня производительности, превосходящий Intel PentiumR III.

Это превосходство было обусловлено следующими технологическими новшествами:

  • CPU AMD Athlon оснащен девятью конвейерами: три из них предназначены для вычислений адреса, три для целочисленных операций и три для выполнения операции с плавающей точкой, а также инструкций из наборов 3DNow! и ММХ;
  • в CPU AMD Athlon впервые используется системная шина с тактовой частотой 266 МГц (с возможностью увеличения до 400 МГц). Таким образом, максимальная пропускная способность шины составляет 1,6 Гбайт/с (до 3,2 Гбайт/с);
  • CPU AMD Athlon впервые оснащен полностью конвейеризированным суперскалярным блоком операций с плавающей точкой. В результате возможности дм вычислений с плавающей точкой у этого х86-совместимого процессора выросли I настолько, что ставят его в один ряд с RISC-процессорами (RISC - Reduced In-1 straction Set Computing - вычисления с сокращенным набором команд), которыми оснащают мощные рабочие станции и серверы;
  • с выходом Athlon набор команд 3DNow! был расширен (Enhanced 3DNow!), чтобы I соответствовать SSE корпорации Intel. В Athlon были введены 19 новых инструкций SIMD, а их общее число доведено до 40. Новые инструкции помогают при об-1 работке целых чисел и предназначены для повышения производительности кэша. I Также были добавлены 5 новых DSP-расширений для ускорения процесса декодирования файлов, сжатых по стандарту МРЗ или по алгоритмам, применяющимся! I коммуникациях, подобных ADSL (Asymmetrical Digital Subscriber Line);
  • кэш-память первого уровня (L1): составила 128 (64 + 64) Кбайт. Для управления кэш-памятью AMD Athlon оснащен высокоскоростным 64-разрядным кэш-контроллером кэш-памяти второго уровня (L2), объем которой составляет! 256 Кбайт и может быть увеличен до 8 Мбайт. Тактовая частота функционирования кэш-памяти L2 зависит от частоты CPU.

Все CPU Athlon первого поколения были основаны на 0,22 мкм технологии (площадь ядра 184 мм2). Они имели тактовые частоты 500, 550, 600, 650 и 700 МГц.

CPU Athlon второго поколения, получившие название Thunderbird, создаются по 0,18 мкм технологии (площадь ядра 120 мм2) и работают на тактовых частотах до 1,1 ГГц. Кристаллы изготавливаются на заводах Fab 25 (г. Остин, штат Техас, США) и Fab 30 (г. Дрезден, Германия).

Для CPU K-7 фирма AMD лицензировала шину Alpha EV6 от Digital, использующую процессорный интерфейс Slot А. Внешне Slot А похож на Slot 1, но они несовместимы. CPU Athlon первого поколения устанавливались в разъем Slot А, затем было разработано гнездо Socket А для "горизонтальной" установки процессора.


Рис.3.16. CPU Athlon: а - вид спереди; б - вид сзади; в - CPU в картридже

3.4.4.9. Athlon XP

Процессор AMD Athlon XP представляет собой дальнейшую разработку CPU в семействе AMD Athlon. Маркировка "XP" в названии AMD Athlon XP призвана подчеркнуть, что применение данного процессора обеспечивает максимально эффективное его использование для многозадачного режима и мультимедийных возможностей, предлагаемых операционной системой Windows XP. Однако это отнюдь не означает, что данный CPU не будет работать с другими операционными системами.

Так же как и Athlon, процессор AMD Athlon XP:

  • устанавливается в разъем Socket A;
  • поддерживает технологию 3DNow! Professional. В этой технологии набор команд увеличен на 52 новые инструкции, служащих для повышения производительности при работе с приложениями обработки цифрового мультимедиа, таких как редакторы фотоизображений, видео и аудио;
  • поддерживает память DDR.
В отличие от своего предшественника, процессор AMD Athlon XP имеет новую архитектуру QuantiSpeed, которая призвана существенно увеличить быстродействие выполнения различных приложений (офисные приложения, трехмерные игры и программы обработки видео и звука). Архитектура QuantiSpeed включает в себя:
  • суперскалярную, суперконвейерную микроархитектуру с возможностью обработки 9 инструкций за такт;
  • суперскалярный полностью конвейерный блок вычислений с плавающей точкой (FPU);
  • аппаратную предвыборку данных, которая позволяет считывать данные, прежде чем они понадобятся процессору. Блок предвыборки данных позволяет предсказывать на основе анализа потока исполняемых команд, какие данные потребуются процессору в дальнейшем, и заносить эти данные в высокоскоростной интегрированный кэш процессора, откуда данные могут быть считаны с большей скоростью.

В CPU используется системная шина с частотой 333 МГц и поддержкой ЕСС-коррекции и полноскоростной кэш общим объемом 384 Кбайт.

Первоначально тактовая частота процессора составляла 2,7 и 2,8 ГГц, а в марте 2003 г. появились CPU с тактовой частотой 3 ГГц.

Процессоры AMD Athlon XP 2800+, 2700+ и 3000+ выполнены по 0,13 мкм технологии на базе ядра, известного под именем Thoroughbred. Процессоры устанавливаются в корпуса OPGA (Organic Pin Grid Array). Корпуса этих процессоров изготавливаются из стеклопластика (похожий материал используется для изготовления печатных плат).

Для гарантии надежной работы систем, базирующихся на процессоре Athlon XP, компания AMD рекомендует использовать стандартные блоки питания, которые удовлетворяют требованиям по качеству и по электрическим характеристикам (подающие на соответствующие шины напряжение +5, +3,3, +12 и +5 В для режима "Standby").

Duron

CPU Duron, как и CPU Intel Celeron, разработан как недорогой процессор для массового использования - это дешевая версия процессора Athlon с урезанной до 64 Кбайт кэш-памятью второго уровня, который устанавливается в разъем Slot 370. Ядро Duron (Spitfire) изготовлено по 0,18 мкм технологии. Первоначально тактовая частота Duron составляла - 700, 650 и 600 МГц, впоследствии с переходом на 0,13 мкм технологию (ядро Morgan) она была увеличена до 1,3 ГГц (1,3/1,2/1,1/ 1,0 ГГц).

CPU Duron ориентирован на рынок недорогих систем; его цена в 1,5 раза ниже цены Athlon с соответствующей тактовой частотой. Вот некоторые из основных характеристик процессора AMD Duron.

CPU AMD Duron оснащен системной шиной с тактовой частотой 200 МГц (табл. 6.28), что более чем в три раза превышает стандартную тактовую частоту процессоров Intel Celeron (66 МГц). Эта высокоскоростная шина обеспечивает прекрасную производительность при работе с приложениями, требующими интенсивного обмена данными, такими, например, как МРЗ-плееры, программы для просмотра DVD-дисков, пакеты для редактирования цифрового видео.

CPU AMD Duron оснащен размещенным на кристалле кэшем, общий объем которого достигает 192 Кбайт, что более чем на 20% больше, чем у Intel Celeron.

Процессор AMD Duron оснащен тремя конвейерами для вычислений с плавающей точкой, в то время, как Intel Celeron - только одним. Кроме того, процессор имеет разработанную фирмой AMD технологию Enhanced 3DNow!

Таблица 6.28. Сравнение характеристик процессоров Celeron и Duron
Характеристика AMD Duron  Intel Celeron 
Тактовая частота, ГГц 1,3/1,2/1,1/1,0 1,2/1,1 /1,0/0,95/0,9/0,85
Кэш-память (L1), Кбайт 128 32
Кэш-память (L2), Кбайт 64 128(1,1 ГГц) 
288 (1,2 ГГц) 
Тактовая частота системной шины 200 100/66


Рис.3.17. Процессор Duron

3.4.4.10. Pentium 4

В начале 2000 г. фирма Intel представила новый процессор, который имел сан большое изменение в архитектуре 32-разрядных CPU Intel начиная с Pentium P (1995) - Pentium 4. Ядро процессора, получившее название Willamette (по назвали реки в шт. Орегон), было выполнено по 0,18 мкм технологии и имело площадь 217 мм2. Модернизация позволила не только значительно увеличить тактовую част ту процессора, но и увеличить количество команд, обрабатываемых за один так Первые процессоры Pentium 4 появились на рынке в ноябре 2000 г. и работали в тактовых частотах 1,4 и 1,5 ГГц.

Willamette

Увеличение мощности процессора Pentium 4 обусловлено существенным изменением его архитектуры, которая позволила процессору работать с более высокой тактовой частотой и обрабатывать большее количество инструкций за один такт. Данная архитектура, получившая название NetBurst, отличается применением следующих инновационных технологий Intel:

  • технологии гиперконвейерной обработки микроархитектуры IntelR NetBurst, которая позволяет удвоить глубину конвейера по сравнению с микроархитектурой Р6, используемой в процессорах IntelR PentiumR III. Конвейер предсказания ветвлений/возвратов реализован в микроархитектуре IntelR NetBurst с глубиной конвейерной обработки в 20 шагов (в Р6 - в 10 шагов);
  • кэш-памяти (L1), включающей в дополнение к 8 Кбайт кэш-памяти данных 12 Кбайт кэш-памяти расшифрованных х86 инструкций (micro-ops), уменьшая таким образом время ожидания, связанное с декодированием инструкции;
  • двух блоков ALU, работающих с частотой, превышающей тактовую частоту процессора в 2 раза. Это позволяет выполнять основные целочисленные команды (сложение, вычитание, логическое И, логическое ИЛИ) с двойной тактовой частотой CPU;
  • кэш-памяти (L2) объемом 256 Кбайт, передающей данные по 256-разрядной шине. Таким образом, если тактовая частота CPU составляет 2 ГГц, то скорость передачи данных к/от кэш-памяти L2 составит 64 Гбайт/с ((256:8) байт х 2 ГГц);
  • с появлением SSE2 в микроархитектуре Intel NetBurst к набору SIMD-расширений, представленному технологиями ММХ и SSE, были добавлены еще 144 инструкции. Эти инструкции включают 128-разрядные операции над целочисленными выражениями и 128-разрядные операции над числами с плавающей запятой двойной точности и уменьшают общее количество инструкций, требуемых для выполнения определенной задачи в программе;
  • тактовой частоты системной шины 400 МГц, благодаря применению технологии Quard Pumped, передающей по 4 пакета данных за один такт (100 МГц х 4 = = 400 МГц);
  • тактовой частоты CPU - 1,80А/2,ОА/2,20/2,40/2,50 и 2,60 ГГц (буква "А" в значении частоты обозначает, что данный процессор устанавливается в разъем Socket 423, чтобы различать их с аналогичными CPU Pentium 4, устанавливаемыми в разъем Socket 478).

Первоначально Chipset для CPU Pentium 4 был ориентирован на память Rambus DRAM. Это сделало системы с CPU Pentium 4 значительно более дорогими, чем системы на основе процессора AMD, Chipset которого использовал обычный SDRAM. Система на процессоре AMD Athlon и памятью DDR SDRAM опередила системы на базе Pentium 4 за счет более низкой стоимости.

В течение первой половины 2001 г. известные компании SiS и VIA выпустили для Pentium 4 Chipset с поддержкой DDR SDRAM, а летом этого же года Intel выпустила Chipset J845 с поддержкой РС133 SDRAM, а в начале 2002 - Chipset i845 с поддержкой DDR SDRAM и РС133 SDRAM.

Первоначально процессор Pentium 4 выпускался в корпусе типа PGA, имел 423 контакта и устанавливался в разъем Socket 423.

Летом 2001 г. фирма Intel перешла на выпуск CPU Pentium 4 в новом форм-факторе mPGA, что позволило уменьшить размер CPU, но привело к увеличению количества контактов: теперь для установки процессора требовалось гнездо Socket 478. Некоторые процессоры с тактовой частотой 1,8 МГц и 2,0 МГц, выпущенные в течение 2001 г., имели разные форм-факторы.

Northwood

В течение 2001 г. Intel и AMD боролись за лидерство иметь на рынке самый быстрый процессор, но явного победителя не было. Однако к концу 2001 г. корпорация AMD вырвалась вперед, выпустив CPU Athlon XP.

Фирма Intel "приняла вызов" и уже в начале 2002 г. на рынке появился CPU Pentium 4 с ядром Northwood, изготовленным по 0,13 мкм технологии и имеющим площадь 146 мм2.

В отличие от предшественника, в CPU Pentium 4 Northwood.произошли следующие изменения:

  • размер кэш-памяти второго уровня (L2) был увеличен в два раза и составил 512 Кбайт;
  • тактовая частота системной шины была увеличена до 533МГц (133x4 = = 533 МГц);
  • использование 0,13 мкм технологии позволило уменьшить напряжение от 1,75 В до 1,5 В, таким образом значительно уменьшая нагрев процессора. Так, если Pentium 4 Willamette с тактовой частотой 2 ГГц излучает 69 Ватт, то Pentium 4 Northwood, работающий на той же частоте, излучает 41 Ватт тепла;
  • тактовая частота CPU составляет 2,0/2,26/2,40/2,53/2,66/2,80 и 3,06 ГГц;
  • процессоры с тактовой частотой 3,06 ГГц поддерживают технологию Hyper-Threading.

Появление нового ядра завершило переход от интерфейса Socket 423 к Socket 478. Для CPU Pentium 4 Northwood корпорация Intel разработала Chipset i850/850E с поддержкой DDR SDRAM и RDRAM, кроме того, можно использовать Chipset i845/i845PE/ i845GE/i845G/i845E/i845GV, а также Chipset других производителей - SiS и VIA.

При выборе того или иного типа процессора прежде всего следует учитывать тип задач, которые вы собираетесь решать с помощью PC (набирать текст, играть, разрабатывать программы и т. д.). Для решения различных задач требуется соответствующая конфигурация PC и CPU определенного типа.

Нет особой необходимости "стрелять из пушки по воробьям": например, покупать PC с "крутым" Pentium 4, чтобы играть в DOOM или готовить документ в Word (это лишняя трата денег). При выборе CPU следует помнить закон, который еще в 1965 г. открыл Гордон Мур (один из основателей фирмы Intel): "Мощность CPU удваивается каждые полтора года при сохранении его стоимости".

3.4.4.11. Процессоры для серверов и рабочих станций

Xeon

Процессоры семейства Xeon разработаны специально для использования в серверах и многопроцессорных системах. Эти процессоры повышают производительность системы только при одновременном выполнении нескольких сложных задач. Для работы на обычных однопользовательских рабочих станциях процессор Хеоn не нужен, т. к. существенного выигрыша в производительности системы не наблюдается, а его цена значительно выше цены "одночастотных" процессоров семейства Pentium.

Pentium II Хеоn

Первый процессор Pentium II Хеоn был анонсирован Intel 29 июня 1998 г. Он использует ядро Deschutes. Основное отличие этого процессора от Pentium II с ядром Deschutes заключается в том, что он взаимодействует на тактовой частоте работы ядра с кэш-памятью второго уровня, расположенной на плате процессора. Объем кэшпамяти (L2) может составлять 512 Кбайт, 1 и 2 Мбайт. Кэш-память изготовлена на более быстрых элементах CSRAM.

Тактовая частота, на которой работает процессор Pentium II Хеоn, составляет 400 и 450 МГц, а тактовая частота системной шины - 100 МГц.

Конструктивно процессоры Хеоn выполнялись для установки в Slot 1 и Slot 2. Slot 2 разработан для многопроцессорных систем.

В следующем процессоре семейства Хеоn используется ядро Tanner. Оно выполнено по 0,25 мкм технологии, поддерживает функции SSE и работает на тактовой частоте 450 МГц и более.

Pentium III Xeon

В январе 1999 г. Intel анонсировала новый CPU семейства Хеоn с ядром Cascades, выполненным по 0,18 мкм технологии и содержащим 28 млн транзисторов. Этот CPU получил собственное название Pentium II Xeon.

В ядро Cascades интегрирована кэш-память (L2) объемом 256 Кбайт. Внутренняя тактовая частота процессора составляла более 600 МГц, тактовая частота системной шины - 133 МГц. К апрелю 2001 г. тактовая частота Pentium III Xeon составила уже 900 МГц, и процессор мог поддерживать уже не 2-процессорные серверы, а 4- и 8-процессорные системы.

Pentium Xeon MP

В марте 2002 г. Intel представил на рынок новый процессор для серверов, получивший название Pentium Xeon MP на кристалле, выполненном по 0,13 мкм технологии и содержащем 108 млн транзисторов. Процессор позаимствовал от CPU Pentium 4:

  • микроархитектуру Intel NetBurst, обеспечивающую поддержку многопроцессорных конфигураций с тактовыми частотами до 2 ГГц, тактовой частотой системной шины 400 МГц, гиперконвейерную обработку и др.;
  • технологию Hyper-Thearding.

Кроме того, в процессоре используется встроенная кэш-память третьего уровня (L3) объемом 2 или 1 Мбайт, которая обеспечивает более быстрый доступ к большим массивам данных, для увеличения пропускной способности при высоких серверных нагрузках.

Кэш-память второго уровня (L2) объемом 512 Кбайт имеет скоростной (256-битный) канал, который обеспечивает передачу данных между ней и ядром процессора.

Кэш-память первого уровня (L1) включает в себя 8 Кбайт кэш-данных и кэш-команд и хранит до 12 000 декодированных микроопераций в порядке их выполнения. Это увеличивает производительность за счет исключения декодера из системы основных команд и делает более эффективным использование кэш-памяти.

Для CPU Pentium Xeon MP был разработан Chipset IntelR E7500, поддерживающий память типа DDR.

IntelR ItaniumR

Процессор Itanium появился в мае 2001 г. и был анонсирован как процессор для серверов масштаба предприятий и компьютеров для работы со специальными приложениями (большими базами данных, приложениями для бизнес-анализа и сбора данных, систем автоматизации проектирования, при проведении высокопроизводительных вычислений и т. п.).

Создание архитектуры Itanium стало самым значительным усовершенствованием архитектуры IntelR со времени создания процессора 80386. Процессор Itanium стал первым 64-разрядным процессором.

Основное преимущество 64-разрядной адресации - это объем адресуемой памяти, к которой процессор должен обратиться. Если процессоры Pentium Pro/1 I/I 11/4 могут обращаться максимум к 64 Гбайт оперативной памяти, то Itanium - к 16 Тбайт, что в 268 435 456 раз больше. Данный факт можно проиллюстрировать простым примером, если составить базу данных, где информация о каждом жителе земли представлена двумя байтами, то 64 Гбайт достаточно, чтобы хранить информацию о людях, населяющих планету в настоящее время (68 719 476 736 : 16 = 4 294 967 296 человек), 16 Тбайт - данные о всех людях, когда-либо населявших землю, и имена их любимых животных (18 446 744 073 709 551 616 : 16 = 1 152 921 504 606 846 976 человек).

Кроме того, архитектура ItaniumR построена на основе технологии EPIC (Explicitly Parallel Instruction Computing - технологии явного параллелизма на уровне команд) Технология EPIC позволяет повысить эффективность параллельной обработки команд по сравнению с существующими процессорными архитектурами, обеспечивая таким образом значительное повышение производительности при работе с определенными типами приложений. Архитектура Itanium изначально оптимизирована для применения в корпоративных компьютерных системах и для проведения технических расчетов.

Тактовая частота CPU Itanium составляет 733 и 800 МГц, а тактовая частота системной шины - 266 МГц. На кристалле, помимо кэш-памяти первого уровня (L1) объемом 32 Кбайт и кэш-памяти второго уровня (L2) объемом 96 Кбайт, располагается кэш-память третьего уровня (L3) объемом 2 и 4 Мбайт. Системная шина обеспечивает высокую пропускную способность 6,4 Гбайт/с.

IntelR ItaniumR 2

Начиная с середины 2002 г., на рынке появился второй представитель семейства процессоров ItaniumR - CPU Itanium 2 с тактовой частотой 900 МГц и 1 ГГц и с объемом интегрированной кэш-памяти третьего уровня (L3), равным 1,5 и 3 Мбайт. Так же как и его предшественник, он был создан по 0,18 мкм технологии.

В отличие от CPU Itanium, процессор Itanium 2 обладает большим объемом интегрированной в кристалл кэш-памяти и дополнительным количеством вычислительных единиц. Ожидается, что серверы и рабочие станции на основе процессоров Itanium 2 будут обладать в 1,5-2 раза большей производительностью, чем системы на базе процессоров Itanium.

Кроме того, в процессоре Itanium 2 применяется новаторская архитектура Machine Check Architecture (MCA), позволяющая отслеживать и обрабатывать случайные системные ошибки, что повышает общую надежность систем.

Для достижения системами на базе CPU Itanium/Itanium 2 максимальной производительности необходимо использовать 64-разрядное программное обеспечение; на аппаратном уровне эти процессоры совместимы и с 32-разрядным кодом.

Процессоры Intel Itanium вовсе не заменяют процессоры Хеоп, которые являются лучшими по соотношению цена/производительность при работе с существующими 32-разрядными приложениями.

Madison

Madison - это кодовое название третьего процессора семейства процессоров Intel Itanium, созданного с использованием технологического процесса 0,13 мкм. Этот процессор оснащен интегрированной кэш-памятью третьего уровня объемом 6 Мбайт. CPU Madison совместим с процессором Itanium 2 на аппаратном и программном уровне, что позволит OEM-компаниям и конечным пользователям не менять программное и аппаратное обеспечение систем при установке нового процессора.

3.4.4.12. Многопроцессорные системы

В последнее время широкое распространение получили многопроцессорные системы, т.е. такие, в которых установлено несколько процессоров.

Используя, например, два процессора, вы теоретически в два раза увеличиваете производительность системы, однако на практике это не так. Одновременное использование нескольких процессоров эффективно лишь при параллельном решении сложных задач.

Для создания многопроцессорной системы необходимо выполнение следующих условий:

  • материнская плата должна поддерживать несколько процессоров, т.е. иметь дополнительные разъемы для установки процессоров и соответствующий Chipset (например, 440ВХ, 450GX);
  • процессор должен поддерживать работу в многопроцессорной системе (Pentium Pro, Pentium II Хеоn и др.);
  • операционная система должна поддерживать работу с несколькими процессорами (Windows NT, UNIX).

Кроме того, многопроцессорная система эффективна, если используются соответствующие программные приложения.

В процессе одновременной работы нескольких процессоров операционная система распределяет различные задачи между процессорами. Существуют два режима работы многопроцессорных систем - асимметричный и симметричный.

В режиме асимметричной обработки один процессор выполняет только задачи операционной системы, а другой - прикладные программы.

В режиме симметричной обработки (Symmetric Multi-Processing, SMP) задачи операционной системы и пользовательские приложения могут выполняться любым процессором в зависимости от его загрузки. Этот режим является более гибким и по этому более производительным.

Процессоры и Chipset, применяемые в многопроцессорных системах, должны поддерживать соответствующий SMP-протокол обмена данными, называемый APIC. Процессоры CPU Pentium и Pentium II, например, поддерживают такой режим только для двух процессоров, Intel Pentium Pro - для четырех.

Поскольку APIC запатентован корпорацией Intel, фирмы AMD и Cyrix не могут выпускать свои процессоры с поддержкой SMP для установки их на материнские платы с Chipset Intel. Фирмы AMD и Cyrix разработали собственный SMP-стандарт, названный OpenPIC. Однако в настоящее время лишь немногие производители материнских плат поддержали этот стандарт. Именно поэтому в настоящее время корпорация Intel является мировым лидером в производстве процессоров и Chipset для многопроцессорных систем.


Предыдущий раздел | Содержание | Следующий раздел

 


 

Рейтинг@Mail.ru