251899fed292311066e0989b6303acff.ppt
- Количество слайдов: 25
Выпускная квалификационная работа Исследование аппаратной предвыборки данных в кэш второго уровня микропроцессора Студент: Гребенкин А. П. , 816 гр. Научный руководитель: Черепанов С. А.
Основные классы алгоритмов аппаратной предвыборки Использующие принцип локальности данных Применение: исходный код с динамическими структурами данных. Использующие корреляционный анализ адресов последовательных обращений Применение: крупные линейные участки кода; циклы, не зависящие явно от итератора. Использующие корреляционный анализ адресов обращений для отдельно взятых инструкций Применение: циклы, зависящие явно от итератора.
Цель исследования Разработка методологии и оценка эффективности основных методов аппаратной предвыборки данных в кэш второго уровня
Исследуемые методы: Выделение постоянного шага (Stride) Класс инструкций ”с постоянным шагом”: Current. Address – Previous. Address = Stride = const != 0 Reference Prediction Table (RPT) Диаграмма состояний записей RPT
Исследуемые методы: Построение и анализ цепей Маркова
Исследуемые методы: Построение и анализ цепей Маркова Проблема хранения истории обращений.
Исследуемые методы: Хранение истории в Global History Buffer (GHB) Нотация алгоритмов на основе GHB: <Тип Index Table>/<Метод анализа истории>
Исследуемые методы: Алгоритм PC/DC: Program Counter / Delta Correlation
Исследуемые методы: Алгоритм G/DC: Global address / Delta Correlation
Методология Выбор инструмента для исследования Исследование на ПЛИС + Высокая скорость тестирования - Сложность реализации алгоритмов Потактовый симулятор + Тестирование на любом ПК - Крайне низкая скорость тестирования - Сложность реализации алгоритмов Симулятор подсистемы памяти + Достаточно быстрое тестирование + Тестирование на любом ПК + Простота реализации алгоритмов в терминах симулятора + Простота реализации инструмента - Погрешность результатов
Методология Получение трасс обращений
Методология Обработка трасс на событийной модели
Методология Параметры симуляции Для симуляции были спользованы следующие параметры: Тайминги: t. AL = 2, BL = 8, t. CL = 5, t. CAS = 5, t. FAW = 20, t. RAS = 18, = 5, t. RTP = 2, t. RRD = 4, t. RP = 4, t. WTR = 3, t. WR = 6 Отношение частоты памяти к частоте ядра = 2. 5 Размер L 1 — 32 Кб, ассоциативность - 4 Размер L 2 — 2 Мб, ассоциативность — 8 Время поиска по L 2 — 15 тактов, по L 1 — 2 такта. Размер слова — 64 бита, Количество miss registers в кэшах — 4 Размер очереди обращений в память — 16 Стратегия вытеснения - Pseudo-LRU t. RCD
Полученные данные Метод выделения постоянного шага (Stride)
Полученные данные Метод цепей Маркова на структуре GHB (G/AC: Global address / Address Correlation) Для алгоритма с параметром ширины предвыборки = 4
Полученные данные Метод G/DC Для алгоритма с параметром ширины предвыборки = 4
Полученные данные Метод PC/DC Для алгоритма с параметром ширины предвыборки = 2
Полученные данные Сравнение методов
Полученные данные Сравнение методов: случай эффективного программного кода Опасность использования метода G/DC
Полученные данные Сравнение методов: случай эффективного программного кода
Выводы Stride и PC/DC + хорошая точность обнаружения целевого кода + малое количество неиспользованных предвыборок – проектирование дополнительной логики ядра для получения PC G/AC + малое количество неиспользованных предвыборок + возможность использовать алгоритм обособленно от ядра – узкая направленность метода G/DC + возможность использовать алгоритм обособленно от ядра + широкая направленность метода – генерация большого числа ненужных предвыборок
Результаты Разработана методология исследования: создана система автоматизации получения исходных данных для симуляции и обработки результатов, симулятор подсистемы памяти. Исследованы 4 класса алгоритмов на симуляционной модели
Направления дальнейшей работы Осуществление корреляции симулятора с различными реализациями процессоров путем использования в симуляторе соответствующих параметров и аппаратных решений Разработка эффективных методов предвыборки, оценивая их по разработанной методологии.
Спасибо за внимание
Приложение
251899fed292311066e0989b6303acff.ppt