Скачать презентацию Высокопроизводительные вычислительные системы применения в биологии и практические Скачать презентацию Высокопроизводительные вычислительные системы применения в биологии и практические

d5df9a4c9b0c2c28967fb7eb0e9760fe.ppt

  • Количество слайдов: 24

Высокопроизводительные вычислительные системы: применения в биологии и практические аспекты решения некоторых задач Высокопроизводительные вычислительные системы: применения в биологии и практические аспекты решения некоторых задач

ВВЕДЕНИЕ: Высокопроизводительные вычисления в биологических науках ВВЕДЕНИЕ: Высокопроизводительные вычисления в биологических науках

Суперкомпьютеры используются для моделирования природных молекулярных машин MDGRAPE, специализированный Компьютер для молекулярной динамики Производительность Суперкомпьютеры используются для моделирования природных молекулярных машин MDGRAPE, специализированный Компьютер для молекулярной динамики Производительность ~ 1000 TFLOP >Выяснение фундаментальных механизмов работы живой клетки >Разработка лекарственных препаратов ASC Q, Los Alamos National Laboratory ~ 30 TFLOP >Разработка искусственных молекулярных машин (ДНКкомпьютеры, нанороботы…)

Моделирование систем нейронов и фрагментов мозга > Выяснение принципов функционирования мозга > Механизмы и Моделирование систем нейронов и фрагментов мозга > Выяснение принципов функционирования мозга > Механизмы и способы лечения расстройств работы мозга > «Нейронные протезы» Blue Gene/L

Часть первая Сам себе суперкомпьютер Часть первая Сам себе суперкомпьютер

GPU vs CPU GPU vs CPU

Лучшее соотношение производительность/потребляемая мощность Лучшее соотношение производительность/потребляемая мощность

Немного о задаче Атом 1 Атом 3 Атом 2 Номер атома 1 1 2 Немного о задаче Атом 1 Атом 3 Атом 2 Номер атома 1 1 2 3 4 5 6 … X X X X

Архитектура графического процессора SIMD – архитектура 128 4 сложить 132 73 9 18 2 Архитектура графического процессора SIMD – архитектура 128 4 сложить 132 73 9 18 2 82 20 возвести 17424 6724 в квадрат 400

Разделяемая память и кэш процессора GPU CPU Регистры процессора Кэш Разделяемая память Регистры 2 Разделяемая память и кэш процессора GPU CPU Регистры процессора Кэш Разделяемая память Регистры 2 такта на доступ к разделяемой памяти или регистрам 200 -300 тактов На чтение или запись значения в глобальную память Глобальная память ОЗУ

Примеры простых алгоритмов Для CPU Для GPU I, j – номера атомов I=Номер. Блока*Число. Примеры простых алгоритмов Для CPU Для GPU I, j – номера атомов I=Номер. Блока*Число. Потоков+Номер. Потока Пока i<число_атомов Цикл Пока j<число_атомов Цикл Если i<>j Тогда F[i]=выч_град(i, j) F[j]=-Fi Пока j

Сравнение производительности Сравнение производительности

Лучше, выше, быстрее Лучше, выше, быстрее

Как выглядит молекулярная динамика (молекула белка в растворе) 35000 атомов. Траектория рассчитана программой GPAMP Как выглядит молекулярная динамика (молекула белка в растворе) 35000 атомов. Траектория рассчитана программой GPAMP на видеокарте Ge. Force 8800 GTS

Часть вторая распределенные вычисления с использованием готового программного пакета Часть вторая распределенные вычисления с использованием готового программного пакета

Немного о задаче – сайт-специфичная химия для молекулярного производства Особенности : >Используется готовый программный Немного о задаче – сайт-специфичная химия для молекулярного производства Особенности : >Используется готовый программный пакет >Значительное число элементов задачи может считаться независимо друг от друга К настоящему времени произведено более 150 000 процессор/часов расчетов ~ 17 процессор/лет

Выбор программного пакета и аппаратной конфигурации Факторы взаимосвязаны между собой сложным образом Тип процессора Выбор программного пакета и аппаратной конфигурации Факторы взаимосвязаны между собой сложным образом Тип процессора (программный пакет должен поддерживать и желательно быть оптимизирован для имеющегося оборудования) Производительность и масштабируемость (скорость расчетов в различных пакетах часто различается в десятки раз!) Метод распараллеливания вычислений Стоимость (коммерческий пакет не всегда работает быстрее бесплатного) Доступность исходного кода (возможность изменить программу для своих нужд) Поддерживаемая ОС

Ориентировочная производительность различных процессоров Ориентировочная производительность различных процессоров

Особенности вычислений в многопользовательских кластерных системах Настройки системы управления задачами на конкретном кластере может Особенности вычислений в многопользовательских кластерных системах Настройки системы управления задачами на конкретном кластере может не подходить для решения некоторых задач Загруженный кластер может дать меньшую производительность чем один современный компьютер Производительность, GFLOP Системы управления задачами: MVS -PBS http: //www. pbsgridworks. com/ -SLURM https: //computing. llnl. gov/linux/slurm/

Почему важно выбрать правильную программу? Скорость вычислений в различных программных пакетах различается в десятки, Почему важно выбрать правильную программу? Скорость вычислений в различных программных пакетах различается в десятки, а иногда в сотни раз. Факторы, влияющие на быстродействие программы: * Алгоритм Язык программирования Оптимизация под конкретный процессор (использование SSE) Двойная/одинарная точность Компилятор Специализированные библиотеки функций Метод распараллеливания вычислений

Распределенные вычисления в локальной сети и Интернет – GRID системы Программа исполняется в фоновом Распределенные вычисления в локальной сети и Интернет – GRID системы Программа исполняется в фоновом режиме на рабочих и домашних ПК, обмен данными через Интернет Готовые решения: • BOINC • Condor • Alchemi GRID (для. Net приложений) Готовые решения как правило требуют модификации исходного кода программы, что для готовых пакетов часто невозможно Проблема возобновления расчетов в готовом пакете Компьютер в GRID системе обычно работает в режиме 8*5

Как создать свой клиент для распределенных вычислений TCP/IP клиент Модуль управления программой для расчетов Как создать свой клиент для распределенных вычислений TCP/IP клиент Модуль управления программой для расчетов Программа, для проведения расчетов из готового пакета Анализ результатов, сжатие данных Сервер Передача данных через сеть База данных

Заключение: Как повысить производительность вычислений: Использовать специализированные аппаратные архитектуры (GPU, FPGA, MDGRAPE, CELL…). Выбрать Заключение: Как повысить производительность вычислений: Использовать специализированные аппаратные архитектуры (GPU, FPGA, MDGRAPE, CELL…). Выбрать более эффективный алгоритм (сменить используемый программный пакет). Использовать новые многоядерные процессоры вместо старых кластеров Использовать распределенные вычисления