Процессоры нового поколения и перспективы их развития — страница 7

  • Просмотров 3619
  • Скачиваний 318
  • Размер файла 44
    Кб

команд (одному регистру может соответс- - 7 - твовать несколько дублей). Реальный набор регистров контролирует- ся устройством отката, и результаты выполнения команд отражаются на состоянии вычислительной системы только после того, как выпол- ненная команда удаляется из пула команд в соответствии с истинным порядком команд в программе. Таким образом, принятая в P6 технология динамического выпол- нения может быть описана как

оптимальное выполнение программы , основанное на предсказании будущих переходов, анализе графа пото- ков данных с целью выбора наилучшего порядка исполнения команд и на опережающем выполнении команд в выбранном оптимальном порядке.  2Архитектура P6 На рисунке 2 приведена более подробная блок-схема P6, вклю- чающая кэши и интерфейс с основной памятью. Далее мы будем понимать под "упорядоченным" устройство, ко- торое

работает в соответствии с исходным порядком команд в прог- рамме, а под "беспорядочным" - устройство, которое не обращает внимания на исходный порядок команд в программе. Устройство выборки/декодирования является "упорядоченным" устройством, которое воспринимает на входе поток команд из прог- раммы пользователя и декодирует их, превращая в последователь- ность микрокоманд, соответствующих потоку данных в программе

пользователя. Устройство диспетчирования/выполнения является "беспорядоч- ным" устройством, которое воспринимает поток данных и планирует выполнение микрокоманд с учетом зависимостей по данным и доступ- ности ресурсов, а также временно сохраняет результаты опережающе- го выполнения в пуле команд. Устройство отката - "упорядоченное" устройство, которое зна- ет, как и когда завершить выполнение команды, то есть

перевести временные результаты опережающего выполнения в постоянное состоя- ние вычислительной системы. Интерфейс шины является "частично упорядоченным" устройс- твом, отвечающим за связь трех вышеупомянутых устройств с внешним миром. Интерфейс шины взаимодействует непосредственно с кэшем 2-го уровня и поддерживает до 4 параллельных обращений к кэшу. Интерфейс шины также управляет обменом данными с основной па- мятью,

который происходит с использованием протокола MESI [1].  2Устройство выборки/декодирования Структура этого устройства приведена на рисунке 3. Команды из кэша команд могут быть быстро выбраны для после- дующей обработки. Указатель на следующую команду - это индекс кэ- ша команд, содержимое которого определяется буфером переходов, состоянием процессора и сообщениями о неправильном предсказании перехода, поступающими из