В бесцеремонном представлении Intel разместила архитектуру на своём веб-сайте. Освещены некоторые мелкие детали нового графической подсистемы Intel, которая дебютирует с будущими 10-нм процессорами Ice Lake.
Нам сообщили, что команда инженеров, занимающихся Gen11 графикой, сосредоточились на создании значительного улучшения производительности по сравнению с графическим ядром предыдущего поколения, заявив, что целью было добиться одного терафлопса 32-bit и два терафлопса 16-bit в операциях с плавающей запятой в придачу с низким энергопотреблением. Первые признаки, что Gen11 обеспечит существенное повышение производительности в реальном мире.
Принимая во внимание факты и цифры, представленные компанией, мы можем разумно оценить производительность этих новых интегрированных графических адаптеров и сравнить их с линейкой Radeon Vega 8, которые поставляются с Ryzen 2200g. Если графика будет такой, какой её ожидают, то это несомненно нанесёт удар по Nvidia и Amd.
Документация Intel гласит, что графика основана на 10-нм техпроцессе FinFET третьего поколения, который поддерживает все основные API.
В графике Gen9 использовалась знакомая модульная схема со срезами, в которых размещались 24 исполнительных юнита (EUs). Intel поработала над дизайном и улучшила этот показатель до 64 юнитов. Это значительное улучшение по сравнению с Gen9, а именно в 2,67 раза больше вычислительных возможностей. Обновленный движок также обрабатывает два пикселя за такт.
Как видно выше, конструкция SoC (System on a chip), которая используется в процессорах серии Core i, подключается через кольцевую шину, которая связывает вместе ядра процессора, кэш последнего уровня и Pci-E контроллеры памяти и дисплея.
Примечательно, что кэш последнего уровня распределяется между графикой и ядрами процессора. Конструкция SoC имеет множество тактовых доменов, разделённых на ядро для каждого процессора, тактовую частоту процессора и синхронизирующие домены кольцевой шины.
Движок поддерживает рендеринг на основе плиток в дополнении к режиму немедленного рендеринга, что помогает снизить требования к памяти во время рабочих нагрузок.
Intel улучшила подсистему памяти, увеличив кэш третьего уровня до 3МБ и разделив локальную память. Новый дизайн также имеет улучшенные алгоритмы сжатия памяти.
Прочие же улучшения включают в себя движок HEVC Quick Sync Video, который обеспечивает сжатие битрейта до 30% по сравнению с Gen9 (с тем же визуальным или лучшим визуальным качеством), поддержку нескольких видеопотоков 4k и 8k и поддержку Adaptive Sync. Глубина декодирования VP9 увеличена до 10-бит (было 8) для поддержки HDR.
В исполнительном блоке (EU), мы видим пару SIMD-блоков с плавающей точкой (ALU), но эти блоки фактически поддерживают операции как с плавающей запятой, так и целочисленные. Intel утверждает, что ALU способны выполнять 16 операций FP32 или 32 операции FP16 за такт.
При более детальном рассмотрении конструкции используемой локальной памяти (SLM), которая питает восемь EU, обнаруживается, что Intel уменьшила конструкцию через порт данных при одновременном доступе L3. Более тесная близость SLM's и EUs помогает снизить задержки и повышает эффективность.
Здесь, с высоты птичьего полёта, мы видим иерархию памяти. Переход Intel а LPDDR4 представляет собой значительный шаг вперёд в пропускной способности в купе с низким энергопотреблением, но истинное новшество заключается в дизайне разделяемой памяти, что помогает уменьшить необходимость копирования данных в буфер.
Также вы можете авторизоваться через социальные сети: