Научная литература
booksshare.net -> Добавить материал -> Физика -> Александров Е.К. -> "Микропроцессорные системы" -> 519

Микропроцессорные системы - Александров Е.К.

Александров Е.К., Грушвицкий Р.И., Купрянов М.С., Мартынов О.Е. Микропроцессорные системы — Спб.: Политехника, 2002. — 935 c.
ISBN 5-7325-0516-4
Скачать (прямая ссылка): mikroprocessorniesistemi2002.djvu
Предыдущая << 1 .. 513 514 515 516 517 518 < 519 > 520 521 522 523 524 525 .. 528 >> Следующая

структуру, где узлы соединялись с соседями по двум или трем измерениям.
Такая технология для более ранних машин была важна, потому что только
соседние процессоры могли быть использованы в качестве адресата в
операциях приема/посылки. Процесс-отправитель посылал сообщение, а
процесс-получатель получал сообщение через канал-link. FIFO было
маленьким, так что отправитель не успевал закончить формирование
сообщения до момента, когда получатель начинал его читать, поэтому
посылка блокировалась до момента начала приема (на современном языке это
называется синхронной передачей сообщений, так как два события совпадают
по времени). Детали передачи данных были скрыты от программиста в
специальной библиотеке, формирующей слой программного обеспечения между
запросами на прием и передачу и реальным аппаратным обеспечением.
Такое внимание к сетевой топологии было значительно ослаблено в связи с
появлением гораздо более универсальных сетей, которые поплайнизировали
передачу сообщения через каждый коммутатор, формирующий внутреннюю сеть.
В наиболее современных машинах с распределенной памятью нарастающая
задержка, вносимая каждым этапом передачи (скачком), достаточно мала. Это
существенно упрощает программную модель. Обычно процессор рассматривается
как простой формирователь линейной последовательности с одинаковыми
затратами на коммуникацию. Другими словами, коммуникационная абстракция
отражает главным образом организационную структуру, показанную на рис.
9.6. Один из важных примеров такой машины является IBM SP-2 (рис. 9.10).
Это масштабируемый параллельный компьютер, состоящий из узлов на базе
рабочих станций RS6000, масштабируемой сети и сетевым интерфейсом Nl
(network interface card - NIC), содержащим специализированный процессор
(i860). NIC соединен с MicroChannel I/O bus и содержит драйверы сетевого
линка, память (DRAM) для буферирования сообщений. Для реализации DMA
модуль содержит процессор i860, управляющий перемещением данных между
памятью и сетью. Сеть представляет собой каскадное 8x8 коммутируемое
перекрестное соединение (crossbar switches) (см. рис. 9.3, а). Скорость
передачи сообщений по линкам составляет 40 Мб/с в каждом направлении.
Рис. 9.9. Типовая структура первых систем
с распределенной областью памяти
920
АРХИТЕКТУРЫ с распределенной областью памяти
Рис. 9.10. Параллельный суперкомпьютер IBM SP-2
Другим примером является параллельный компьютер Intel Paragon, показанный
на рис. 9.11.
Intel Paragon иллюстрирует наиболее плотное аппаратное пакетирование в
узлах. Каждая плата (узел) представляет собой SMP с двумя или более
процессорами (i860) и кристалл сетевого интерфейса (NI), связанный с
шиной памяти (Memory bus). Один из процессоров специализируется на
обслуживании сети. Узел имеет механизм DMA для передачи блоков данных
через сеть высокого уровня. Сеть представляет собой 3D-Ky6, аналогичный
структуре сети компьютера CRAY ТЗЕ. Линки имеют пропускную способностью
175 Мб/с в каждом направлении.
МРА и разделяемое адресное пространство являются двумя очевидно
различными программными моделями, каждая из которых обеспечивает ясную
парадигму для разделения коммуникации и синхронизации. Тем не менее
лежащие в основе данных машин базовые структуры постепенно объединяются в
рамках общей организации, представляемой набором законченных компьютеров,
усиленных специальным контроллером, соединяющим каждый узел с расширяемой
коммуникационной сетью. Подробнее обобщенная архитектура параллельных
систем будет рассмотрена в п. 9.6.
921
АРХИТЕКТУРЫ ПАРАЛЛЕЛЬНЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ
Рис. 9.11. Параллельный суперкомпьютер Intel Paragon
9.3. МАТРИЧНЫЕ СИСТЕМЫ
Третий важный класс параллельных машин - матричные системы - относятся к
классу single-instruction-multiple-data machines (SIMD) или data parallel
architectures. Ключевой характеристикой этой модели программирования data
parallel programming model является то, что операция может быть выполнена
параллельно на каждом элементе большой регулярной структуры данных, таких
как массивы и матрицы.
Компьютерная таксономия, известная как Flynn's taxonomy (Flynn, 1972),
появившаяся в изданиях начала 1970-х годов, определяет структуру системы
в терминах числа одновременно выполняемых различных инструкций и числа
обрабатываемых элементов данных. В этом случае обычные последовательные
компьютеры определяются как сис-
922
МАТРИЧНЫЕ СИСТЕМЫ
темы с одиночным потоком команд и одиночным потоком данных - single-
instruction-single-date (SISD), а параллельные машины, построенные из
множества обычных процессоров как системы с множественным потоком команд
и множественным потоком данных - multiple-instruction-multiple-data
(MIMD). Альтернативой им стали системы класса одиночного потока команд и
множественного потока данных - single-instruction-multiple-data (SIMD).
Исторически такой подход появился в середине 1960-х. Идея была в том, что
вся последовательность инструкций могла бы быть консолидирована в
Предыдущая << 1 .. 513 514 515 516 517 518 < 519 > 520 521 522 523 524 525 .. 528 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed