AArch64 - AArch64

AArch64 или ARM64 это 64-битное расширение ARM архитектура.

Платформа ARMv8-A с процессором Cortex A57 / A53 MPCore big.LITTLE

Впервые он был представлен с ARMv8-A архитектура.

ARMv8-A

Объявлено в октябре 2011 г.,^[1] ARMv8-A (часто называемый просто ARMv8, хотя существует также 32-разрядная версия ARMv8-R) представляет собой фундаментальное изменение архитектуры ARM. Он добавляет дополнительную 64-битную архитектуру (например, Cortex-A32 - это 32-битный процессор ARMv8-A.^[2] в то время как большинство процессоров ARMv8-A поддерживают 64-разрядную версию (в отличие от всех ARMv8-R), названную «AArch64», и соответствующий новый набор инструкций «A64». AArch64 предоставляет пользовательское пространство совместимость с ARMv7-A, 32-битной архитектурой, именуемой здесь «AArch32», и старым 32-битным набором команд, теперь именуемым «A32». Набор команд Thumb упоминается как «T32» и не имеет 64-битного аналога. ARMv8-A позволяет запускать 32-разрядные приложения в 64-разрядной ОС, а 32-разрядная ОС находится под управлением 64-разрядной ОС. гипервизор.^[3] ARM анонсировала свои ядра Cortex-A53 и Cortex-A57 30 октября 2012 года.^[4] яблоко был первым, кто выпустил ядро, совместимое с ARMv8-A (Apple A7 ) в потребительском продукте (айфон 5с ). AppliedMicro, используя FPGA, был первым, кто продемонстрировал ARMv8-A.^[5] Первый ARMv8-A SoC из Samsung Exynos 5433 используется в Galaxy Note 4, который состоит из двух кластеров по четыре ядра Cortex-A57 и Cortex-A53 в конфигурации big.LITTLE; но он будет работать только в режиме AArch32.^[6]

Как для AArch32, так и для AArch64, ARMv8-A делает VFPv3 / v4 и расширенный стандарт SIMD (Neon). Он также добавляет инструкции по криптографии, поддерживающие AES, SHA-1 /SHA-256 и арифметика конечных полей.^[7]

AArch64 особенности

Новый набор инструкций, A64
- Имеет 31 64-битный регистр общего назначения.
- Имеет специальный регистр нуля или указателя стека (SP) (в зависимости от инструкции).
- Счетчик программ (ПК) больше не доступен напрямую как регистр.
- Инструкции по-прежнему имеют длину 32 бита и в основном такие же, как A32 (с удаленными инструкциями LDM / STM и большей частью условного выполнения).
  - Имеет парные нагрузки / магазины (вместо LDM / STM).
  - Нет предикация для большинства инструкций (кроме веток).
- Большинство инструкций могут принимать 32-битные или 64-битные аргументы.
- Адреса считаются 64-битными.
Advanced SIMD (Neon) улучшенный
- Имеет 32 × 128-битных регистров (вместо 16), также доступен через VFPv4.
- Поддерживает формат с плавающей запятой двойной точности.
- От корки до корки IEEE 754 совместимый.
- Эти регистры также используются в инструкциях шифрования / дешифрования AES и SHA-1 / SHA-2.
Новая система исключений
- Меньшее количество регистров и режимов в банках.
Преобразование памяти из 48-битных виртуальных адресов на основе существующего расширения большого физического адреса (LPAE), которое было разработано с возможностью простого расширения до 64-битного.

AArch64 был представлен в ARMv8-A и включен в последующие версии ARMV8-A. AArch64 не входит в ARMv8-R или ARMv8-M, поскольку они обе являются 32-разрядными архитектурами.

ARMv8.1-A

В декабре 2014 года ARMv8.1-A,^[8] было объявлено об обновлении с «дополнительными преимуществами по сравнению с v8.0». Усовершенствования делятся на две категории: изменения набора инструкций и изменения модели исключений и преобразование памяти.

Усовершенствования набора инструкций включали следующее:

Набор атомарных инструкций чтения-записи AArch64.
Дополнения к набору инструкций Advanced SIMD для AArch32 и AArch64, чтобы обеспечить возможности для оптимизации некоторых библиотек:
- Знаковое округление с насыщением, удвоение, умножение, накопление, возврат высокой половины.
- Знаковое округление с насыщением, удвоение, умножение, вычитание, возвращение высокой половины.
- Инструкции добавляются в векторной и скалярной формах.
Набор инструкций загрузки и сохранения AArch64, которые могут обеспечить порядок доступа к памяти, который ограничен настраиваемыми адресными областями.
Дополнительные инструкции CRC в v8.0 становятся обязательными в ARMv8.1.

Улучшения для модели исключений и системы перевода памяти включали следующее:

Новый бит состояния Privileged Access Never (PAN) обеспечивает контроль, который предотвращает привилегированный доступ к данным пользователя, если он явно не включен.
Увеличенный диапазон VMID для виртуализации; поддерживает большее количество виртуальных машин.
Необязательная поддержка аппаратного обновления флага доступа к таблице страниц и стандартизация необязательного, обновляемого оборудования, механизма грязных битов.
Расширения хоста виртуализации (VHE). Эти усовершенствования повышают производительность гипервизоров 2-го типа за счет снижения нагрузки на программное обеспечение, связанной с переходом между хостовой и гостевой операционными системами. Расширения позволяют ОС хоста работать на EL2, в отличие от EL1, без существенных изменений.
Механизм, освобождающий некоторые биты таблицы трансляции для использования операционной системой, когда аппаратная поддержка не требуется ОС.
Игнорировать верхний байт за маркировка памяти.^[9]

ARMv8.2-А

В январе 2016 года был анонсирован ARMv8.2-A.^[10] Его улучшения делятся на четыре категории:

Необязательный с плавающей запятой половинной точности обработка данных (половинная точность уже поддерживалась, но не для обработки, а только как формат хранения.)
Улучшения модели памяти
Представление о Расширение надежности, доступности и удобства обслуживания (Расширение RAS)
Введение статистического профилирования

Масштабируемое векторное расширение (SVE)

Расширение масштабируемых векторов (SVE) - это «дополнительное расширение архитектуры ARMv8.2-A и новее», разработанное специально для векторизации высокопроизводительные вычисления научные нагрузки.^[11]^[12] Спецификация позволяет реализовать переменную длину вектора от 128 до 2048 бит. Расширение дополняет, но не заменяет НЕОН расширения.

512-битный вариант SVE уже реализован на Суперкомпьютер Fugaku с использованием Fujitsu A64FX ARM процессор. Он нацелен на то, чтобы стать самым производительным суперкомпьютером в мире с «целью начать полноценную работу примерно в 2021 году».^[13]

SVE поддерживается GCC компилятор, с GCC 8, поддерживающим автоматическую векторизацию^[12] и GCC 10, поддерживающий встроенные функции C. По состоянию на июль 2020 г. LLVM и лязгать поддержка встроенных функций C и IR. Собственный форк LLVM от ARM поддерживает автоматическую векторизацию.^[14]

ARMv8.3-А

В октябре 2016 года был анонсирован ARMv8.3-A. Его улучшения делятся на шесть категорий:^[15]

Указатель аутентификации^[16] (Только AArch64); обязательное расширение (на основе нового блочного шифра, КАРМА^[17]) к архитектуре (компиляторы должны использовать функцию безопасности, но, поскольку инструкции находятся в пространстве NOP, они обратно совместимы, хотя и не обеспечивают дополнительной безопасности на старых чипах).
Вложенная виртуализация (только AArch64)
Расширенный SIMD комплексное число поддержка (AArch64 и AArch32); например повороты кратны 90 градусам.
Новый FJCVTZS (с плавающей точкой Javascript Преобразовать в инструкцию с фиксированной точкой со знаком, округление в сторону нуля).^[18]
Изменение модели согласованности памяти (только AArch64); для поддержки (не по умолчанию) более слабой модели RCpc (согласованный с релизом процессор) модели C ++ 11 /C11 (модель согласованности C ++ 11 / C11 по умолчанию уже поддерживалась в предыдущей версии ARMv8).
Поддержка механизма ID для больших видимых системой кешей (AArch64 и AArch32)

Архитектура ARMv8.3-A теперь поддерживается (по крайней мере) GCC 7 компилятор.^[19]

ARMv8.4-А

В ноябре 2017 года был анонсирован ARMv8.4-A. Его улучшения попали в следующие категории:^[20]^[21]^[22]

"SHA3 / SHA512 / SM3 / SM4 криптографические расширения "
Улучшенная поддержка виртуализации
Возможности разделения и мониторинга памяти (MPAM)
Новое состояние Secure EL2 и мониторы активности
Инструкции для целочисленного скалярного произведения со знаком и без знака (SDOT и UDOT).

ARMv8.5-А

В сентябре 2018 года был анонсирован ARMv8.5-A. Его улучшения попали в следующие категории:^[23]^[24]

Расширение тегов памяти (MTE),
Индикаторы целей ветвления (BTI) для уменьшения «способности злоумышленника выполнить произвольный код»
Инструкции генератора случайных чисел - «предоставление детерминированных и истинных случайных чисел, соответствующих различным национальным и международным стандартам».

2 августа 2019 г. Google объявил Android принял бы Memory Tagging Extension (MTE).^[25]

ARMv8.6-A

В сентябре 2019 года был анонсирован ARMv8.6-A. Он добавляет:^[26]

Общее матричное умножение (GEMM)
Формат Bfloat16 поддержка
Инструкции по манипулированию матрицей SIMD, BFDOT, BFMMLA, BFMLAL и BFCVT
улучшения для виртуализации, системного управления и безопасности

Например, мелкие прерывания, инструкции ожидания события (WFE), EnhancedPAC2 и FPAC. Расширения Bfloat16 для SVE и Neon в основном предназначены для глубокого обучения.^[27]

Будущие особенности архитектуры ARM

В мае 2019 года ARM анонсировала свои грядущие расширения Scalable Vector Extension 2 (SVE2) и Transactional Memory Extension (TME).^[28]

Расширение масштабируемых векторов 2 (SVE2)

SVE2 основан на масштабируемой векторизации SVE для повышения детализации Параллелизм на уровне данных (DLP), чтобы можно было выполнять больше работы по инструкции. SVE2 стремится предоставить эти преимущества более широкому спектру программного обеспечения, включая DSP и мультимедийный код SIMD, которые в настоящее время используют Неон.^[28] В LLVM /Лязг 9.0 и GCC Коды разработки 10.0 были обновлены для поддержки SVE2.^[29]

Расширение транзакционной памяти (TME)

Следующий расширения x86, TME поддерживает Аппаратная транзакционная память (HTM) и снятие транзакционной блокировки (TLE). TME стремится предоставить масштабируемый параллелизм для повышения уровня детализации Параллелизм на уровне потоков (TLP), чтобы можно было выполнять больше работы за поток.^[28] В LLVM /Лязг 9.0 и GCC Коды разработки 10.0 были обновлены для поддержки TME.^[29]

Рекомендации

^ «ARM раскрывает технические подробности следующей версии архитектуры ARM» (Пресс-релиз). Arm Holdings. 27 октября 2011. Архивировано с оригинал 1 января 2019 г.. Получено 20 сентября 2013.
^ «Процессор Cortex-A32 - ARM». Получено 18 декабря 2016.
^ Гризентуэйт, Ричард (2011). «Предварительный просмотр технологии ARMv8-A» (PDF). Получено 31 октября 2011.
^ «ARM запускает серию Cortex-A50, самые энергоэффективные 64-битные процессоры в мире» (Пресс-релиз). Arm Holdings. Получено 31 октября 2012.
^ «AppliedMicro демонстрирует первое в мире 64-битное ядро ARM v8» (Пресс-релиз). AppliedMicro. 28 октября 2011 г.. Получено 11 февраля 2014.
^ "Exynos 5433 от Samsung - это ARM SoC A57 / A53". АнандТех. Получено 17 сентября 2014.
^ "Справочное техническое руководство по процессору ARM Cortex-A53 MPCore: расширение криптографии". РУКА. Получено 11 сентября 2016.
^ Браш, Дэвид (2 декабря 2014 г.). «Архитектура ARMv8-A и ее постоянное развитие». Получено 23 января 2015.
^ «TBI».
^ Браш, Дэвид (5 января 2016 г.). «Эволюция архитектуры ARMv8-A». Получено 7 июн 2016.
^ «Масштабируемое векторное расширение sve для архитектуры Armv8 a». Арм Сообщество. 22 августа 2016 г.. Получено 8 июля 2018.
^ ^а ^б «Серия выпусков GCC 8 - Изменения, новые функции и исправления - Проект GNU - Фонд свободного программного обеспечения (FSF)». gcc.gnu.org. Получено 9 июля 2018.
^ «Fujitsu завершила создание прототипа процессора суперкомпьютера Post-K и начала функциональные испытания - Fujitsu Global». www.fujitsu.com (Пресс-релиз). Получено 8 июля 2018.
^ «⚙ D71712 Реализация нисходящего потока SVE / SVE2 (LLVM)». reviews.llvm.org.
^ Дэвид Браш (26 октября 2016 г.). «Архитектура ARMv8-A - дополнения 2016 года».
^ "[Ping ~, AArch64] Добавить поддержку командной строки для -march = armv8.3-a". расширение аутентификации указателя определено как обязательное расширение на ARMv8.3-A и не является необязательным
^ «Qualcomm выпускает технический документ с подробным описанием аутентификации указателя на ARMv8.3».
^ "A64 Инструкции с плавающей запятой: FJCVTZS". arm.com. Получено 11 июля 2019.
^ «Серия выпусков GCC 7 - Изменения, новые функции и исправления». Теперь поддерживается архитектура ARMv8.3-A. Его можно использовать, указав параметр -march = armv8.3-a. [..] Параметр -msign-return-address = поддерживается для включения защиты обратного адреса с помощью расширений аутентификации указателя ARMv8.3-A.
^ «Представляем расширения архитектуры Arm в 2017 году». community.arm.com. Получено 15 июн 2019.
^ "Изучение машинного обучения точечного продукта". community.arm.com. Получено 15 июн 2019.
^ "ARM готовит поддержку ARMv8.4-A для компилятора GCC - Phoronix". www.phoronix.com. Получено 14 января 2018.
^ "Объявление Arm Architecture Armv8.5-A - Блог процессоров - Процессоры - Сообщество Arm". community.arm.com. Получено 26 апреля 2019.
^ ООО, Арм. "Справочное руководство по архитектуре Arm Armv8, для профиля архитектуры Armv8-A". ARM Разработчик. Получено 6 августа 2019.
^ «Внедрение расширения тегов памяти Arm в Android». Блог Google Online Security. Получено 6 августа 2019.
^ «Обновление архитектуры профиля Arm A 2019». community.arm.com. Получено 26 сентября 2019.
^ «Расширения BFloat16 для Armv8-A». community.arm.com. Получено 30 августа 2019.
^ ^а ^б ^c "Arm выпускает SVE2 и TME для архитектуры A-профиля - Блог процессоров - Процессоры - Сообщество Arm". community.arm.com. Получено 25 мая 2019.
^ ^а ^б "Поддержка Arm SVE2, выравнивание для GCC 10, LLVM Clang 9.0 - Phoronix". www.phoronix.com. Получено 26 мая 2019.

[armv8-a-announcement-1] «ARM раскрывает технические подробности следующей версии архитектуры ARM» (Пресс-релиз). Arm Holdings. 27 октября 2011. Архивировано с оригинал 1 января 2019 г.. Получено 20 сентября 2013.

[2] «Процессор Cortex-A32 - ARM». Получено 18 декабря 2016.

[v8arch-3] Гризентуэйт, Ричард (2011). «Предварительный просмотр технологии ARMv8-A» (PDF). Получено 31 октября 2011.

[cortex-a50_announce-4] «ARM запускает серию Cortex-A50, самые энергоэффективные 64-битные процессоры в мире» (Пресс-релиз). Arm Holdings. Получено 31 октября 2012.

[AppliedMicro-First_64-bit_ARM_v8_Core-5] «AppliedMicro демонстрирует первое в мире 64-битное ядро ARM v8» (Пресс-релиз). AppliedMicro. 28 октября 2011 г.. Получено 11 февраля 2014.

[6] "Exynos 5433 от Samsung - это ARM SoC A57 / A53". АнандТех. Получено 17 сентября 2014.

[7] "Справочное техническое руководство по процессору ARM Cortex-A53 MPCore: расширение криптографии". РУКА. Получено 11 сентября 2016.

[8] Браш, Дэвид (2 декабря 2014 г.). «Архитектура ARMv8-A и ее постоянное развитие». Получено 23 января 2015.

[9] «TBI».

[10] Браш, Дэвид (5 января 2016 г.). «Эволюция архитектуры ARMv8-A». Получено 7 июн 2016.

[2016-08-22-arm-blog-11] «Масштабируемое векторное расширение sve для архитектуры Armv8 a». Арм Сообщество. 22 августа 2016 г.. Получено 8 июля 2018.

[gcc8changelog-12] а ^б «Серия выпусков GCC 8 - Изменения, новые функции и исправления - Проект GNU - Фонд свободного программного обеспечения (FSF)». gcc.gnu.org. Получено 9 июля 2018.

[13] «Fujitsu завершила создание прототипа процессора суперкомпьютера Post-K и начала функциональные испытания - Fujitsu Global». www.fujitsu.com (Пресс-релиз). Получено 8 июля 2018.

[14] «⚙ D71712 Реализация нисходящего потока SVE / SVE2 (LLVM)». reviews.llvm.org.

[15] Дэвид Браш (26 октября 2016 г.). «Архитектура ARMv8-A - дополнения 2016 года».

[16] "[Ping ~, AArch64] Добавить поддержку командной строки для -march = armv8.3-a". расширение аутентификации указателя определено как обязательное расширение на ARMv8.3-A и не является необязательным

[17] «Qualcomm выпускает технический документ с подробным описанием аутентификации указателя на ARMv8.3».

[18] "A64 Инструкции с плавающей запятой: FJCVTZS". arm.com. Получено 11 июля 2019.

[19] «Серия выпусков GCC 7 - Изменения, новые функции и исправления». Теперь поддерживается архитектура ARMv8.3-A. Его можно использовать, указав параметр -march = armv8.3-a. [..] Параметр -msign-return-address = поддерживается для включения защиты обратного адреса с помощью расширений аутентификации указателя ARMv8.3-A.

[20] «Представляем расширения архитектуры Arm в 2017 году». community.arm.com. Получено 15 июн 2019.

[21] "Изучение машинного обучения точечного продукта". community.arm.com. Получено 15 июн 2019.

[22] "ARM готовит поддержку ARMv8.4-A для компилятора GCC - Phoronix". www.phoronix.com. Получено 14 января 2018.

[23] "Объявление Arm Architecture Armv8.5-A - Блог процессоров - Процессоры - Сообщество Arm". community.arm.com. Получено 26 апреля 2019.

[24] ООО, Арм. "Справочное руководство по архитектуре Arm Armv8, для профиля архитектуры Armv8-A". ARM Разработчик. Получено 6 августа 2019.

[25] «Внедрение расширения тегов памяти Arm в Android». Блог Google Online Security. Получено 6 августа 2019.

[26] «Обновление архитектуры профиля Arm A 2019». community.arm.com. Получено 26 сентября 2019.

[27] «Расширения BFloat16 для Armv8-A». community.arm.com. Получено 30 августа 2019.

[sve2-tme-28] а ^б ^c "Arm выпускает SVE2 и TME для архитектуры A-профиля - Блог процессоров - Процессоры - Сообщество Arm". community.arm.com. Получено 25 мая 2019.

[:1-29] а ^б "Поддержка Arm SVE2, выравнивание для GCC 10, LLVM Clang 9.0 - Phoronix". www.phoronix.com. Получено 26 мая 2019.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]