Pentium Pro - Pentium Pro

Pentium Pro
Главная Информация
Запущен1 ноября 1995 г.
Снято с производстваИюнь 1998 г.
Общий производитель (ы)
  • Intel
Спектакль
Максимум. ЦПУ тактовая частотаОт 150 МГц до 200 МГц
ФСБ скоростиОт 60 МГц до 66 МГц
Архитектура и классификация
Мин. размер элементаОт 0,35 мкм до 0,50 мкм
МикроархитектураP6
Набор инструкцийx86
Физические характеристики
Ядра
  • 1
Розетки)
История
ПреемникPentium II Xeon

В Pentium Pro это шестое поколение x86 микропроцессор разработан и изготовлен Intel и введена 1 ноября 1995 г.[1] Он представил Микроархитектура P6 (иногда обозначается как i686) и изначально предназначался для замены оригинального Pentium в полном спектре приложений. В то время как Pentium и Pentium MMX имели 3,1 и 4,5 миллиона транзисторы соответственно, Pentium Pro содержал 5,5 млн транзисторов.[2] Позже он был сокращен до более узкой роли как сервер и высокопроизводительный настольный процессор и использовался в суперкомпьютеры любить ASCI Красный, первый компьютер, достигший терафлопс знак производительности.[3] Pentium Pro мог работать как в двух-, так и в четырехпроцессорной конфигурации. Он был только в одном форм-факторе: относительно большой прямоугольный Розетка 8. На смену Pentium Pro пришел Pentium II Xeon в 1998 г.

Микроархитектура

Pentium Pro 200 МГц с кэш-памятью L2 512 КБ в PGA пакет
Pentium Pro 200 МГц с кэш-памятью второго уровня 1 МБ в PPGA пакет.
Pentium Pro без ограничений 256 КБ
Pentium II Overdrive со снятым радиатором. Ядро Flip-chip Deschutes находится слева. Кэш 512 КБ находится справа.[4]

Ведущим архитектором Pentium Pro был Фред Поллак кто специализировался на суперскалярность а также работал ведущим инженером Intel iAPX 432.[5]

Резюме

Pentium Pro включает новый микроархитектура, отличается от Pentium P5 микроархитектура. Он имеет развязанную 14-ступенчатую суперпайпайн-архитектуру, в которой используется пул инструкций.P6 ) содержал множество продвинутых концепций, отсутствующих в Pentium, хотя это был не первый или единственный x86 процессор для их реализации (см. NexGen Nx586 или Cyrix 6x86 ). В конвейере Pentium Pro были дополнительные этапы декодирования для динамического преобразования IA-32 инструкции в буфер микрооперация последовательности, которые затем могут быть проанализированы, переупорядочены и переименованы для обнаружения распараллеливаемых операций, которые могут выполняться более чем одним исполнительная единица однажды. Таким образом, Pentium Pro показал вышедшее из строя исполнение, в том числе спекулятивное исполнение через зарегистрировать переименование. Он также имел более широкий 36-битный адресная шина (может использоваться PAE ), что позволяет получить доступ к 64 ГБ памяти.

Pentium Pro имеет 8 КБ кеш инструкций, из которых до 16 байт доставлен на каждом цикле и отправлены в декодеры инструкций. Есть три декодера инструкций. Возможности декодеров не равны: только один может декодировать любую инструкцию x86, а два других могут декодировать только простые инструкции x86. Это ограничивает способность Pentium Pro одновременно декодировать несколько инструкций, ограничивая суперскалярное выполнение. инструкции x86 декодируются в 118-битные микрооперации (микрооперации). Микрооперации RISC -любить; то есть они кодируют операцию, два источника и место назначения. Обычный декодер может генерировать до четырех микроопераций за цикл, тогда как простые декодеры могут генерировать по одной микрооперации за цикл. Таким образом, инструкции x86, которые работают с памятью (например, добавляют этот регистр в это место в памяти), могут обрабатываться только обычным декодером, так как эта операция требует минимум трех микроопераций. Точно так же простые декодеры ограничены инструкциями, которые могут быть переведены в одну микрооперацию. Инструкции, требующие большего количества микроопераций, чем четыре, транслируются с помощью секвенсора, который генерирует необходимые микрооперации за несколько тактовых циклов. Pentium Pro был первым процессором в семействе x86, поддерживающим возможность обновления. микрокод под BIOS и / или управление операционной системой.[6]

Микрооперации выходят из буфер переупорядочения (ROB) и войдите на резервную станцию ​​(RS), где они ждут отправки в подразделения исполнения. В каждом тактовом цикле до пяти микроопераций могут быть отправлены на пять исполнительных устройств. Pentium Pro имеет шесть исполнительных блоков: два целочисленных блока, один блок с плавающей запятой (FPU), блок загрузки, блок адреса магазина и блок данных магазина.[7] Один из целочисленных блоков использует те же порты, что и FPU, и поэтому Pentium Pro может отправлять только одну целочисленную микрооперацию и одну микрооперацию с плавающей запятой или две целочисленные микрооперации за цикл в дополнение к микрооперациям. операций для остальных трех исполнительных единиц. Из двух целочисленных модулей только тот, который разделяет путь с FPU на порту 0, имеет полный набор функций, таких как баррель шифтер, множитель, делитель и поддержка инструкций LEA. Второй целочисленный блок, подключенный к порту 1, не имеет этих возможностей и ограничен простыми операциями, такими как сложение, вычитание и вычисление целевых адресов ветвления.[7]

FPU выполняет операции с плавающей запятой. Сложение и умножение являются конвейерными и имеют задержку в три и пять циклов соответственно. Деление и извлечение квадратного корня не конвейеризируются и выполняются в отдельных модулях, которые совместно используют порты FPU. Деление и извлечение квадратного корня имеют задержку 18–36 и 29–69 циклов соответственно. Наименьшее число предназначено для чисел с плавающей запятой одинарной точности (32-бит), а наибольшее - для чисел с увеличенной точностью (80-бит). Деление и извлечение квадратного корня могут работать одновременно со сложением и умножением, предотвращая их выполнение только тогда, когда результат должен быть сохранен в ROB.

После выпуска микропроцессора в блок с плавающей запятой, обычно называемая «ошибкой FPU Pentium Pro и Pentium II», а Intel - «ошибкой флага». Ошибка возникает при некоторых обстоятельствах во время преобразования с плавающей запятой в целое число, когда число с плавающей запятой не помещается в меньший целочисленный формат, что приводит к отклонению FPU от задокументированного поведения. Ошибка считается незначительной и возникает при таких особых обстоятельствах, что затрагиваются очень немногие программы, если таковые имеются.

Pentium Pro Микроархитектура P6 в той или иной форме использовался Intel более десяти лет. Трубопровод будет масштабироваться от начальных 150 МГц до 1,4 ГГц с "Tualatin". Pentium III. После этого различные черты дизайна сохранятся в производном ядре под названием "Баниас " в Pentium M и Intel Core (Йона ), который сам превратился бы в Основная микроархитектура (Ядро 2 процессор) в 2006 году и далее.[8]

Набор инструкций

Pentium Pro (P6) представил новые инструкции в линейке Intel; инструкции CMOVxx («условное перемещение») могут перемещать значение, которое является либо содержимым регистра, либо ячейкой памяти, в другой регистр или нет, в соответствии с некоторым логическим условием предиката xx в регистре флагов, где xx является кодом предиката флагов, как указано в условии для инструкций условного перехода. Так, например, CMOVNE перемещает указанное значение в регистр или нет в зависимости от того, истинно ли условие NE (не равно) в регистре флагов, т.е. Z flag = 0. Это позволяет оценивать операции if-then-else и, например, ? : операция в C. Эти инструкции повышают производительность, позволяя избежать дорогостоящих инструкций перехода и перехода. Например, в CMOVxx destreg1, source_operand2 первый операнд - это регистр назначения, второй - регистр источника или ячейка памяти. К сожалению, второй операнд не может быть непосредственным (встроенным постоянным) значением, и такая константа должна быть сначала помещена в регистр. Код предиката xx может принимать полный диапазон значений, разрешенных в условных переходах.

Вторым событием стало документирование незаконной инструкции UD2. Этот код операции зарезервирован и гарантированно вызовет исключение недопустимой инструкции на P6 и всех последующих процессорах. Это позволяет разработчикам легко вывести из строя текущую программу с учетом требований будущего, когда ошибка обнаружена программным обеспечением.

Спектакль

Несмотря на то, что в то время была продвинута, архитектура переименования регистров Pentium Pro не по порядку имела проблемы с запуском 16-битного кода и смешанного кода (8/16 бит или 16/32 бит), поскольку использование частичных регистров вызывает частый конвейер промывание.[9] Конкретное использование частичных регистров было обычной оптимизацией производительности в то время, поскольку не приводило к снижению производительности процессоров Intel до P6; Кроме того, доминирующими операционными системами на момент выпуска Pentium Pro были 16-битные ДОС и смешанный 16/32-битный Windows 3.1x и Windows 95 (хотя для последнего требуется 32-битный процессор 80386, большая часть его кода по-прежнему 16-битная по причинам производительности, например USER.exe ). Это вместе с высокой стоимостью систем Pentium Pro вызывало в то время довольно слабый прием среди энтузиастов ПК. Чтобы воспользоваться всеми преимуществами Pentium Pro Микроархитектура P6, полностью 32-битный Операционные системы необходимо, например, Windows NT, Linux, Unix, или OS / 2. Проблемы с производительностью унаследованного кода позже были частично устранены Intel с помощью Pentium II.

По сравнению с микропроцессорами RISC, Pentium Pro, когда был представлен, немного превосходил самые быстрые микропроцессоры RISC по целочисленной производительности при запуске теста SPECint95,[10] но производительность с плавающей запятой была значительно ниже, чем у некоторых RISC-микропроцессоров.[10] Преимущество Pentium Pro в целочисленной производительности быстро исчезло, сначала его уступили MIPS Technologies R10000 в январе 1996 г., а затем Корпорация цифрового оборудования EV56 вариант Альфа 21164.[11]

Рецензенты быстро отметили очень медленную запись в видеопамять как слабое место платформы P6, при этом производительность здесь составляет всего 10% от системы Pentium с идентичной тактовой частотой в таких тестах, как VIDSPEED. Способы обхода этого включали установку отрисовки VESA в системную память вместо видеопамяти в таких играх, как Землетрясение,[12] а позже появились такие утилиты, как FASTVID, которые могли удвоить производительность в некоторых играх за счет включения писать комбинировать особенности процессора.[13][14] MTRR устанавливаются автоматически видеодрайверами Windows, начиная с ~ 1997 г., и улучшенная подсистема кэш-памяти и производительность FPU позволили ей превзойти тактовую частоту Pentium в новых трехмерных играх середины-конца 1990-х годов, особенно когда используя NT4. Однако его отсутствие MMX реализация снижает производительность в мультимедийных приложениях, использующих эти инструкции.

Кеширование

Вероятно, самым заметным дополнением Pentium Pro было наличие на упаковке Кэш L2, который варьировался от 256 КБ на момент внедрения до 1 МБ в 1997 году. В то время производственная технология не позволяла интегрировать большой кэш L2 в ядро ​​процессора. Вместо этого Intel поместила кристалл (ы) L2 отдельно в корпус, что по-прежнему позволяло ему работать с той же тактовой частотой, что и ядро ​​ЦП. Кроме того, в отличие от большинства схем кэширования на материнских платах, которые разделяют основную системную шину с ЦП, кэш Pentium Pro имел свой собственный задний автобус (называется двойная независимая шина от Intel). Из-за этого ЦП мог одновременно читать основную память и кэш, что значительно уменьшало традиционное узкое место. Кэш также был «неблокирующим», что означало, что процессор мог выдавать более одного запроса кеша за раз (до 4), уменьшая штрафы за промахи в кэше. (Это пример MLP, Параллелизм уровней памяти Сочетание этих свойств привело к созданию кэша L2, который был намного быстрее, чем кеш-память на материнских платах старых процессоров. Один только этот кеш давал ЦП преимущество в производительности ввода / вывода по сравнению с более старыми x86 ЦП. В многопроцессорных конфигурациях производительность встроенного кэша Pentium Pro резко возросла по сравнению с архитектурами, в которых каждый процессор имел общий центральный кэш.

Однако этот гораздо более быстрый кеш L2 имел некоторые сложности. Устройство Pentium Pro «кэш-память на упаковке» было уникальным. Процессор и кэш находились на отдельных кристаллах в одном корпусе и были тесно связаны полноскоростной шиной. Две или три матрицы должны были быть скреплены вместе на раннем этапе производственного процесса, прежде чем стало возможным проведение испытаний. Это означало, что из-за одного крошечного дефекта в любой из кристаллов пришлось выбросить всю сборку, что было одной из причин относительно низкой производительности Pentium Pro и высокой стоимости. Все версии чипа были дорогими, особенно с 1024 КБ, поскольку для этого требовалось два кристалла кэш-памяти по 512 КБ, а также кристалл процессора.

Доступные модели

Тактовые частоты Pentium Pro составляли 150, 166, 180 или 200 МГц с частотой 60 или 66 МГц. внешняя шина Часы. Некоторые пользователи решили разгон их чипы Pentium Pro, при этом версия 200 МГц часто работает на частоте 233 МГц, версия 180 МГц часто работает на частоте 200 МГц, а версия 150 МГц часто работает на частоте 166 МГц. Микросхема была популярна в конфигурациях с симметричной многопроцессорной обработкой, где обычным явлением были двух- и четырехъядерные SMP-серверы и рабочие станции.

В схеме Intel «Семейство / Модель / Степпинг» Pentium Pro относится к семейству 6, модели 1, а его код продукта Intel - 80521.

ЧасыАвтобусКэш L2Макс. TDP
150 МГц60 МГц256 КБ29,2 Вт
166 МГц66 МГц512 КБ35 Вт
180 МГц60 МГц256 КБ31,7 Вт
200 МГц66 МГц256 КБ35 Вт
200 МГц66 МГц512 КБ37,9 Вт
200 МГц66 МГц1024 КБ44 Вт

Изготовление

Процесс изготовления кристалла процессора Pentium Pro и его отдельного кристалла кэш-памяти изменился, что привело к сочетанию процессов, используемых в одном пакете:

  • Кристалл прототипа процессора Pentium Pro 133 МГц был изготовлен с использованием процесса BiCMOS размером 0,6 мкм.[15][16]
  • Кристалл процессора Pentium Pro 150 МГц был изготовлен с размером 0,50 мкм. BiCMOS процесс.[16][17]
  • Кристалл процессора Pentium Pro 166, 180 и 200 МГц был изготовлен с использованием процесса BiCMOS 0,35 мкм.[16][17]
  • Кристалл кэш-памяти L2 объемом 256 КБ был изготовлен с использованием процесса BiCMOS размером 0,50 мкм.[16][17]
  • Кристалл кэша L2 512 и 1024 КБ был изготовлен с использованием процесса BiCMOS 0,35 мкм.[16][17]

Упаковка

Pentium Pro (до 512 КБ кэш-памяти) упакован в керамический многокристальный модуль (MCM). MCM содержит две полости на нижней стороне, в которых находится кристалл микропроцессора и сопутствующий кристалл кэш-памяти. Матрицы прикреплены к тепловому стержню, открытая верхняя часть которого помогает теплу от матриц более напрямую передаваться охлаждающему устройству, например радиатору. Матрицы соединяются с корпусом с помощью обычного проводного соединения. Полости закрывают керамической пластиной.

Pentium Pro с 1 МБ кэш-памяти использует пластиковый MCM. Вместо двух полостей есть только одна, в которой находятся три матрицы, прикрепленные к корпусу вместо теплового стержня. Полости залиты эпоксидной смолой.

MCM имеет 387 контактов, из которых примерно половина расположена в матрице сетки выводов (PGA), а половина - в матрице сетки промежуточных выводов (IPGA). Упаковка предназначена для Розетка 8.

Пути обновления

В 1998 году 300/333 МГц Pentium II Overdrive был выпущен процессор для Socket 8. Обладая 512 КБ полноскоростной кэш-памяти, он был произведен Intel в качестве дополнительного варианта обновления для владельцев систем Pentium Pro. Однако он поддерживал только двустороннюю бесклеевой многопроцессорность, а не четырехпроцессорная или выше, что не делало ее пригодной для использования апгрейдом для четырехпроцессорных систем. Эти специально упакованные процессоры Pentium II Xeon использовались для обновления ASCI Красный, который стал первым компьютером, достигшим отметки в терафлопсах с процессором Pentium Pro, а затем первым, который превысил 2 терафлопс после обновления до процессоров Pentium II Xeon.

Так как Слот 1 материнские платы получили распространение, несколько производителей выпустили щель адаптеры, такие как Tyan M2020, Asus C-P6S1, Tekram P6SL1 и Abit KP6. Слоты позволяли использовать процессоры Pentium Pro с материнскими платами Slot 1. Intel 440FX набор микросхем явно поддерживает процессоры Pentium Pro и Pentium II, но Intel 440BX и более поздние наборы микросхем Slot 1 явно не поддерживали Pentium Pro, поэтому слоты Socket 8 не получили широкого распространения. Медальоны - в виде Розетка 370 в адаптеры Slot 1 - вновь стали популярными, когда Intel представила Socket 370 Celeron и Pentium III процессоры.

Основные характеристики

Pentium Pro

  • Кэш L1: 8, 8 КБ (данные, инструкции)
  • Кэш L2: 256, 512 КБ (одна матрица) или 1024 КБ (две матрицы по 512 КБ) в одном многокристальный модуль тактовая частота процессора
  • Разъем: Розетка 8
  • Автобус спереди: 60 и 66 МГц
  • VCore: 3,1–3,3 В
  • Изготовление: 0,50 мкм или 0,35 BiCMOS[18]
  • Тактовая частота: 150, 166, 180, 200 МГц (на некоторых материнских платах может достигать 233 МГц)
  • Первый выпуск: ноябрь 1995 г.

Pentium II Overdrive

  • Кэш L1: 16, 16 КБ (данные + инструкции)
  • Кэш L2: внешний чип 512 КБ на модуле ЦП с тактовой частотой процессора
  • Разъем: Разъем 8
  • Множитель: зафиксирован на уровне 5 ×
  • Фронтальная шина: 60 ​​и 66 МГц
  • VCore: 3,1–3,3 В (имеет встроенный регулятор напряжения)
  • Изготовление: 0,25 мкм
  • Тактовая частота: на основе Deschutes -поколения Pentium II
  • Первый выпуск: 1997 г.
  • Поддерживает MMX технологии

Возможности шины и мультипроцессора

Pentium Pro использовал GTL + сигнализация в своей передней шине.[19] Pentium Pro может использоваться сам по себе с четырьмя процессорами. Были также построены восьмиядерные компьютеры Pentium Pro, но они использовали несколько шин.[20]

На дизайн шины Pentium Pro повлияли Futurebus, то Intel iAPX 432 автобус и элементы Intel i960 автобус.[21] Futurebus задумывался как усовершенствованный автобус для замены VMEbus используется с Motorola 68000 с конца 1970-х годов, но в комитете по стандартизации он находился в застое более десяти лет, если вы посчитаете все перипетии.[21] Инициатива Intel iAPX 432 также была коммерческой неудачей, но в процессе они узнали, как построить шину с разделенными транзакциями для поддержки многопроцессорной системы без кеширования. В i960 была усовершенствована шина iAPX 432 с разделенными транзакциями, чтобы включить протокол когерентности кэша, получив в итоге набор функций, очень напоминающий первоначальные амбиции Futurebus.[21]

Ведущим архитектором i960 был специалист по суперскалярности Фред Поллак, который также был ведущим инженером Intel iAPX 432 и ведущим архитектором процессора i686, Pentium Pro. Без сомнения, он был хорошо знаком со всей этой историей. Pentium Pro был разработан, чтобы включить 4-стороннюю SMP-шину с когерентной кэш-памятью с разделением транзакций в качестве обязательной функции каждого производимого чипа.[21] Это также послужило препятствием для конкурентного доступа к сокету для производства клонированных процессоров.[21]

Несмотря на то, что Pentium Pro не был успешным в качестве машины для масс из-за плохой поддержки 16-разрядной версии Windows 95, он действительно стал очень успешным в области файловых серверов благодаря своей продвинутой интегрированной конструкции шины.[21] внедрение на товарный рынок многих расширенных функций, которые ранее были доступны только в сегменте дорогих рабочих станций.

Конкуренты Pentium Pro / 6-го поколения

Смотрите также

использованная литература

  1. ^ Фишер, Лоуренс М. (2 ноября 1995 г.). «Intel предлагает Pentium Pro для рынка рабочих станций». Нью-Йорк Таймс. Получено 4 января, 2012.
  2. ^ Брей, Барри (2006). Микропроцессоры Intel. п. 12.
  3. ^ "ASCI Red: Сандианская национальная лаборатория". ТОП500 суперкомпьютерных сайтов ».
  4. ^ Шнурер, Георг. «Следующий выход: Мендосино». Архивировано из оригинал 19 февраля 2006 г.. Получено 24 апреля, 2009.
  5. ^ Дворжак, Джон С. «Что случилось с iAPX432 - чипом мечты Intel?». Дворжак без цензуры.
  6. ^ Стиллер, Андреас; Пол, Матиас Р. (12 мая 1996 г.). "Prozessorgeflüster". c't - магазин компьютерной техники. Тенденции и новости (на немецком языке). Heise Verlag. В архиве с оригинала 28 августа 2017 г.. Получено 28 августа, 2017.
  7. ^ а б «Руководство по оптимизации архитектуры Intel» (PDF). 1997. стр. 2-8. Архивировано из оригинал (PDF) 21 января 2007 г.
  8. ^ Стоукс, Джон (5 апреля 2006 г.). «В ядро: микроархитектура Intel нового поколения». Получено 24 апреля, 2009.
  9. ^ «Предупреждение о частичном останове реестра». Онлайн-справка VTune Performance Analyzer.
  10. ^ а б Слейтер, Майкл (13 ноября 1995 г.). «Intel увеличивает Pentium Pro до 200 МГц». Отчет микропроцессора.
  11. ^ Гвеннап, Линли (1996-07-08). «Digital 21164 достигает 500 МГц». Отчет микропроцессора.
  12. ^ https://github.com/id-Software/Quake/blob/master/WinQuake/data/TECHINFO.TXT
  13. ^ "Файл технической информации по Quake".
  14. ^ "Полное руководство по MDGx UMBPCI.sys".
  15. ^ Папворт, Дэвид Б. (апрель 1996 г.). «Настройка микроархитектуры Pentium Pro». IEEE Micro С. 14–15.
  16. ^ а б c d е «Процессоры Intel Pentium Pro - Информационный бюллетень». Intel. Архивировано из оригинал 7 декабря 2013 г.
  17. ^ а б c d Слейтер, Майкл (13 ноября 1995 г.), «Intel увеличивает Pentium Pro до 200 МГц», Отчет микропроцессора, Ресурсы MicroDesign, т. 9 нет. 15
  18. ^ sandpile.org В архиве 1999-09-01 в Archive.today - Реализация IA-32 - Intel P6
  19. ^ Шенли, Том (1998). Системная архитектура Pentium Pro и Pentium II. Эддисон-Уэсли Профессионал. п. 199. ISBN  978-0-201-30973-7.
  20. ^ Гуруге, Анура (17 мая 2000 г.). Подключение Web-to-Host. CRC Press. п. 405. ISBN  978-0-203-99747-5.
  21. ^ а б c d е ж Харденберг, Хэл В. (1 июня 1997 г.). «Назад в автобус будущего». drdobbs.com. Журнал доктора Добба. Получено 19 сентября, 2020.

внешние ссылки