Скачать презентацию 1 Многомашинные и многопроцессорные ВС Суперкомпьютеры и кластерные Скачать презентацию 1 Многомашинные и многопроцессорные ВС Суперкомпьютеры и кластерные

Информатика Лекция09.ppt

  • Количество слайдов: 31

1 Многомашинные и многопроцессорные ВС Суперкомпьютеры и кластерные системы 1. Определение и классификация вычислительных 1 Многомашинные и многопроцессорные ВС Суперкомпьютеры и кластерные системы 1. Определение и классификация вычислительных систем 2. Архитектура вычислительных систем 3. Многопроцессорные структуры ВС – пример построения 4. Суперкомпьютеры 5. Кластерные системы

ВС - цели создания и принципы построения 2 Вычислительная система (ВС) - совокупность взаимосвязанных ВС - цели создания и принципы построения 2 Вычислительная система (ВС) - совокупность взаимосвязанных и взаимодействующих процессоров или ЭВМ, периферийного оборудования и ПО, предназначенная для сбора, хранения, обработки и распределения информации Основные цели создания ВС Основные принципы построения ВС Возможность работы в разных режимах Повышение производительности системы за счет ускорения процессов обработки данных Повышение надежности и достоверности вычислений Предоставление пользователям дополнительных сервисных услуг Модульность структуры технических и программных средств – возможность совершенствования и модернизации ВС Унификация и стандартизация технических и программных решений Иерархия в организации управления процессами Способность систем к адаптации, самонастройке и самоорганизации Обеспечение необходимым сервисом пользователей при выполнении вычислений

Классификация ВС ВС Классификационные принципы 3 Универсальные ВС Специализированные ВС Многомашинная ВС Многопроцессорная ВС Классификация ВС ВС Классификационные принципы 3 Универсальные ВС Специализированные ВС Многомашинная ВС Многопроцессорная ВС Однородная ВС Неоднородная ВС Совмещенная ВС Распределенная ВС По назначению По типу построения По типу ЭВМ или процессоров По степени территориальной разобщенности вычислительных модулей Централизованная ВС Децентрализованная ВС ВС со смешанным управлением По методам управления элементами ВС По принципу закрепления вычислительных функций По временному режиму работы ВС с жестким закреплением функций ВС оперативного режима ВС с плавающим закреплением функций ВС неоперативного режима

Варианты работы многомашинных ВС Вариант 1 ЭВМ 1 Вариант 2 ЭВМ 1 Вариант 3 Варианты работы многомашинных ВС Вариант 1 ЭВМ 1 Вариант 2 ЭВМ 1 Вариант 3 ЭВМ 1 4 Пульт функционального управления Электронный ключ ЭВМ 2 Пульт функционального управления ЭВМ 2 Электронный ключ

Схема взаимодействия компьютеров в многомашинных ВС ОС 1 Процессор 1 Оперативная память 1 ОС Схема взаимодействия компьютеров в многомашинных ВС ОС 1 Процессор 1 Оперативная память 1 ОС 2 Уровень 1 Уровень 2 Каналы связи 1 Внешние устройства 1 Процессор 2 Оперативная память 2 Каналы связи 2 Уровень 3 Внешние устройства 2 5

Схема взаимодействия процессоров в многопроцессорных ВС Операционная система Процессор 1 Процессор 2 Общее поле Схема взаимодействия процессоров в многопроцессорных ВС Операционная система Процессор 1 Процессор 2 Общее поле оперативной памяти Каналы связи Общее поле внешних устройств 6

ОКОД - структура однопроцессорных ВС Память команд Поток команд Процессор 1 Поток данных Результаты ОКОД - структура однопроцессорных ВС Память команд Поток команд Процессор 1 Поток данных Результаты Память данных 7

ОКМД - структура векторных многопроцессорных ВС Память команд Поток данных Процессор N Процессор 2 ОКМД - структура векторных многопроцессорных ВС Память команд Поток данных Процессор N Процессор 2 Процессор 1 Память данных Результаты 8

МКОД - структура конвейерных (магистральных) многопроцессорных ВС 9 Память команд Поток команд Процессор 1 МКОД - структура конвейерных (магистральных) многопроцессорных ВС 9 Память команд Поток команд Процессор 1 Процессор 2 Поток данных Процессор N Результаты Память данных

МКМД - структура матричных многопроцессорных ВС 10 Память команд Поток команд Процессор n 1 МКМД - структура матричных многопроцессорных ВС 10 Память команд Поток команд Процессор n 1 Процессор n 2 Процессор n. N Процессор 21 Процессор 22 Процессор 2 N Процессор 11 Процессор 12 Процессор 1 N Память данных Поток данных Результаты

Многопроцессорные серверы IBM на базе процессоров Power 7 11 Многопроцессорные серверы IBM на базе процессоров Power 7 11

Понятие суперкомпьютера 12 Суперкомпьютер - высокопараллельная многопроцессорная ВС Быстродействие От 100 000 MFlo. PS Понятие суперкомпьютера 12 Суперкомпьютер - высокопараллельная многопроцессорная ВС Быстродействие От 100 000 MFlo. PS Объем оперативной памяти Объем дисковой памяти От 10 Тбайт Разрядность Современные суперкомпьютеры От 10 Гбайт 64 -128 бит Терафлоп (терафлопс) (триллион операций с плавающей запятой в секунду) Петафлоп (петафлопс) (квадрильон операций с плавающей запятой в секунду)

Три варианта архитектуры многопроцессорных ВС (МПВС) Многопроцессорная ВС (МПВС) Классический вариант МКМД - структура Три варианта архитектуры многопроцессорных ВС (МПВС) Многопроцессорная ВС (МПВС) Классический вариант МКМД - структура Mножественный поток Команд – Множественный поток Данных Параллельно - конвейерная модификация МКОД- структура Mножественный поток Команд – Одиночный поток Данных ОКМД- структура Параллельно - векторная модификация Одиночный поток Команд – Mножественный поток Данных 13

История создания суперкомпьютеров 14 США 1960 г. Начало разработки ILLIAC-IV Создание 20 MFlo. PS История создания суперкомпьютеров 14 США 1960 г. Начало разработки ILLIAC-IV Создание 20 MFlo. PS СССР 70 -е годы ХХ века ЕС 1195 50 MFlo. PS США Sandia Декабрь 1996 г. (Intel) ЕС 1191. 01 500 MFlo. PS 1974 г. «Эльбрус ЗБ» 20 000 MFlo. PS ЕС 1191 1200 MFlo. PS ЕС 1191. 10 2000 MFlo. PS 7000 процессоров Pentium Pro (200 МГц) ОЗУ 454 (573) Гбайт 2250 Гбайт дисковой памяти 86 шкафов -160 кв. м. Впервые преодолел терафлопный барьер быстродействия и затем достиг 1, 4 TFLo. PS

Эволюция суперкомпьютеров 2007 2008 2009 15 Cray XT 4 Содержал 30 тыс. двуядерных процессоров Эволюция суперкомпьютеров 2007 2008 2009 15 Cray XT 4 Содержал 30 тыс. двуядерных процессоров Opteron фирмы AMD Blue. Gene/L Имел производительность 478, 2 терафлопа -самый быстрый суперкомпьютер того времени Dawning 5000 Китай второй после США создает суперкомпьютер мощностью более 100 терафлоп (до 230 терафлоп) Планы - создание до 2011 года петафлопового Шугуан-5000 Pleiades NASA начинает создание и планирует к 2012 году нарастить мощность до 10 петафлоп Blue Water IBM начинает создание и планирует к 2011 году нарастить мощность до 1 петафлопа (200 тыс. процессорных ядер , свыше 1 петабайта ОЗУ Емкость дисковых накопителей -10 петабайт) Sequoia IBM к 2012 году планирует создание суперкомпьютера мощностью в 20 петафлоп (1, 6 млн. процессоров, объем ОЗУ - 1, 6 петабайта)

16 Jugene (Германия) Производительность 0, 825 петафлопс (2010 г) Основан на проекте компьютерной архитектуры 16 Jugene (Германия) Производительность 0, 825 петафлопс (2010 г) Основан на проекте компьютерной архитектуры IBM – «Blue Gene / P» 292 000 процессоров частотой 850 мегагерц Центр Суперкомпьютеров Jülich

Kraken (США) 17 Производительность 0, 831 петафлопс (2010 г) БАЗА -более 100 000 двухъядерных Kraken (США) 17 Производительность 0, 831 петафлопс (2010 г) БАЗА -более 100 000 двухъядерных процессоров Opteron AMD Национальная Лаборатория штата Теннеси Национального института вычислительной науки США

Пример задачи, решенной суперкомпьютером Kraken Прогноз сдвига разлома Сан-Андреас в Калифорнии - самое подробное Пример задачи, решенной суперкомпьютером Kraken Прогноз сдвига разлома Сан-Андреас в Калифорнии - самое подробное моделирование землетрясений, когда-либо сделанное наукой 18

Roadrunner (США) 19 Производительность 1, 04 (1, 37) петафлопс Первый суперкомпьютер, превысивший барьер 1 Roadrunner (США) 19 Производительность 1, 04 (1, 37) петафлопс Первый суперкомпьютер, превысивший барьер 1 петафлоп - 1. 000 операций в секунду Базовый вариант: 6948 двухъядерных процессоров AMD и 12960 девятиядерных процессоров Cell (от Sony Play. Station 3) Объем ОЗУ - 80 терабайт В настоящее время общее число ядер - 138368 Лос-Аламосская Национальная Лаборатория в Нью-Мексико

Condor Claster - суперкомпьютер из приставок Play. Station 3 (2010 г. ) 20 Идея Condor Claster - суперкомпьютер из приставок Play. Station 3 (2010 г. ) 20 Идея создания суперкомпьютера из игровых приставок впервые была реализована в 2003 году учеными из Университета Иллинойса. Суперкомпьютер в 500 гигафлопсов был собран из 70 шт. игровых приставок PS 2 Производительность 0, 5 петафлопса позволила Condor Claster занять 33 -ю строку в мировом рейтинге суперкомпьютеров 2010 года 1 760 консолей PS 3 168 отдельных графических процессоров 84 координирующих сервера Суперкомпьютер будет обслуживать потребности аэрокосмической разведки (использоваться для получения спутниковых снимков в сверхвысоком разрешении), исследования в области искусственного интеллекта, радиолокации и распознавания образов

IBM и Баварская академия наук (Германия) строят мощнейший суперкомпьютер Европы Система Super. MUC в IBM и Баварская академия наук (Германия) строят мощнейший суперкомпьютер Европы Система Super. MUC в Суперкомпьютерном центре имени Лейбница (Гархинг, Германия) будет использоваться европейскими учёными проведении комплексных исследований в области медицины, астрофизики и пр. Основа Super. MUC - 14 тыс. чипов Intel Xeon. Производительность системы достигнет 3 петафлопсов (квадриллионов операций с плавающей запятой в секунду) Особенность Super. MUC - фирменная система водяного охлаждения, позволяющая добиться 40 -процентного снижения энергопотребления по сравнению с аналогичными суперкомпьютерами на воздушном охлаждении 21

Jaguar (США) 22 БАЗА - 84 блока Cray XT 4 на двухядерных процессорах AMD Jaguar (США) 22 БАЗА - 84 блока Cray XT 4 на двухядерных процессорах AMD Opteron и 200 блоков Cray XT 5 (по 192 четырехядерных процессора AMD Opteron) § Общее количество процессоров – 45 000 § Суммарное количество ядер -181000 § Объем ОЗУ 362 терабайта § Емкость дисковых накопителей 10 петабайт После замены части процессоров на шестиядерные AMD Opteron суммарное количество ядер составило 224162 Производительность 1, 7 (2, 3) петафлопс Национальная Лаборатория Департамента энергетики США

Пример задачи, решенной суперкомпьютером Jaguar Моделирование потоков двуокиси углерода (CO 2), выпущенных и поглощенныхв Пример задачи, решенной суперкомпьютером Jaguar Моделирование потоков двуокиси углерода (CO 2), выпущенных и поглощенныхв момент восхода солнца над восточной Европой 23

Tianhe-1 А (Китай) 24 Производительность 2, 57 (4, 7) петафлопса 6 -ядерные CPU Intel Tianhe-1 А (Китай) 24 Производительность 2, 57 (4, 7) петафлопса 6 -ядерные CPU Intel Xeon 5670 и 512 -ядерные GPU n. Vidia Tesla M 2050 Общее число ядер - 186368 Национальный центр Суперкомпьютеров в Тяньцзине

K computer — японский суперкомпьютер производства компании Fujitsu (ноябрь 2011 г. ) 25 Производительность K computer — японский суперкомпьютер производства компании Fujitsu (ноябрь 2011 г. ) 25 Производительность 10, 51 (11, 28) петафлопс База - 88 128 восьмиядерных процессоров SPARC 64 VIIIfx (общее число ядер – 705024) Институт физико-химических исследований (город Кобе)

Начало разработки экзафлопсного суперкомпьютера в 2012 году в США Проект предполагает разработку суперкомпьютера, обладающего Начало разработки экзафлопсного суперкомпьютера в 2012 году в США Проект предполагает разработку суперкомпьютера, обладающего производительностью на уровне экзафлопса (квинтиллион операций с плавающей запятой в секунду) Для сравнения: самый мощный современный вычислительный комплекс — японский K computer — обладает быстродействием в 11, 28 петафлопса (квадриллиона операций с плавающей запятой в секунду) Необходимо разработать как новую аппаратную часть, так и инновационное программное обеспечение, способное управлять миллионами вычислительных ядер 1 000 000 000 = квадриллион 1 000 000 000 = квинтиллион K computer 26

Рейтинг суперкомпьютеров ТОР-50 (2011 год) Производительность Макс/Пик (Рflops) Название Число Производитель процессорных ядер Процессоры Рейтинг суперкомпьютеров ТОР-50 (2011 год) Производительность Макс/Пик (Рflops) Название Число Производитель процессорных ядер Процессоры 1 10, 51 / 11, 28 K computer 705024 SPARC 64 VIIIfx Fujitsu 2 2, 56 / 4. 7 Tianhe-1 A 186368 (Xeon /Nvidia Tesla NUDT 3 1, 75 / 2, 33 Jaguar 224162 (Opteron) Cray 4 5 1, 27 / 2, 98 1, 19 / 2, 28 Nebulae Tsubame 2. 0 120640 Dawning TC 3600 Blade System 55680 Xeon 6 C X 5670 + 64960 Nvidia Tesla HP Pro. Liant SL 390 s G 7 Dawning NEC / HP Место, страна, год Институт физикохимических исследований RIKEN (г. Кобэ) Япония 2011 Национальный суперкомпьютерный центр (г. Тяньцзин) Китай 2010 Окриджская национальная лаборатория США, 2009 Национальный суперкомпьютерный центр (Шэньчжэнь) Китай, 2010 Институт технологий, Токио Япония, 2010 27

Современные суперкомпьютеры России Суперкомпьютер «Ломоносов» МГУ имени М. В. Ломоносова 1, 3 Пфлопс Рейтинг Современные суперкомпьютеры России Суперкомпьютер «Ломоносов» МГУ имени М. В. Ломоносова 1, 3 Пфлопс Рейтинг 500 Июнь 2011 года 13 -е место 28 База: T-Platforms T-Blade 2/1. 1 ( CPU Intel Xeon X 5570/X 5670 2. 93 GHz, GPU Nvidia 2070) реальная производительность : 674. 105 Тфлопс пиковаяпроизводительность: 1373. 060 Тфлопс отношение реальной и пиковой производительности: 49 % Суперкомпьютер Российский федеральный ядерный центр „Всероссийский научно-исследовательский институт экспериментальной физики“ (ВНИИЭФ) в Сарове 0, 780 Пфлопс (1 Пфлопс) Суперкомпьютер Курчатовский институт 0, 123 Пфлопс Суперкомпьютер Южно-Уральский государственный университет 0, 117 Пфлопс Суперкомпьютерами также располагают: Уфимский авиатехнический университет , Сибирский федеральный университет, Томский государственный университет

Суперкомпьютер мощностью 1 Пфлопс в Саровском ядерном центре (Россия) Супер. ЭВМ базируется, в том Суперкомпьютер мощностью 1 Пфлопс в Саровском ядерном центре (Россия) Супер. ЭВМ базируется, в том числе, на оригинальных разработках ВНИИЭФ и оснащен программным обеспечением, основные компоненты которого также разработаны и адаптированы специалистами ВНИИЭФ Пиковая производительность - 1 Пфлопс Реальная производительность системы - 0, 780 Пфлопс 29

Персональный суперкомпьютер STSS Flagman WX 240 T. 2, 30 Минимальная конфигурация • 4 -х Персональный суперкомпьютер STSS Flagman WX 240 T. 2, 30 Минимальная конфигурация • 4 -х ядерный процессор Intel Xeon 5630 2. 53 GHz • два суперкомпьютерных вычислителя NVIDIA Tesla C 2040 • стоимость около 8500 у. е. Максимальная конфигурация • два 6 -ти ядерных процессора Intel Xeon 5690 3. 73 GHz • четыре суперкомпьютерных вычислителя NVIDIA Tesla C 2070 • до 96 GB оперативной памяти DDR 3 • дисковая подсистема (8 жёстких дисков SATA 3000 GB -общая емкость 24 ТВ) с поддержкой «горячей замены» • стоимость около 30000 у. е. (данные – декабрь 2011 года) Графические процессоры (вычислители) NVIDIA Tesla объединяют 1792 параллельных процессорных ядра и способны обрабатывать тысячи параллельных потоков, достигая суммарной пиковой производительности 4 Терафлопа на операциях с одинарной точностью 2 Терафлопа на операциях с двойной точностью.

Кластеризация Цели построения кластеров Кластеризация - объединение нескольких серверов в единую ВС более высокого Кластеризация Цели построения кластеров Кластеризация - объединение нескольких серверов в единую ВС более высокого ранга для повышения эффективности функционирования Улучшение масштабируемости (способность к наращиванию мощности) Коэффициент готовности систем КТ = Тр1(Тр+Т 0) Повышение надежности и готовности системы в целом Увеличение суммарной производительности Эффективное перераспределение нагрузок между компьютерами кластера Эффективное управление и контроль работы системы и т. п. 31 Где Тр - полезное время работы системы То - время отказа и восстановления системы, в течение которого она не могла выполнять свои функции