Нові процесори alder lake поєднують повноцінні потужні ядра з маленькими енергоефективними і сьогодні intel поділилися подробицями про принципи роботи нових гібридних процесорів. Нові гібридні процесори і численні оптимізації intel дозволять підвищити ipc (instructions per clock) за рахунок декількох факторів, включаючи:

  • кеш підсистеми передбачення розгалужень на 5 тисяч записів для більш точного результату;
  • 64-кілобайтний кеш інструкцій оптимізований зберігати найбільш часті інструкції ближче, не звертаючись до зовнішньої пам’яті;
  • перший декодер довжини інструкцій intel, який проводить попередню інформацію для запиту;
  • кластеризованный позачергової (out-of-order) декодер, який дозволяє декодувати до 6 інструкцій за такт із збереженням рівня енергоефективності;
  • розширений виконавчий модуль з 5 регістрами перепризначення і 8 регістрами завершення інструкцій, буфером на 256 позачергових інструкцій і 17 виконавчими портами;
  • надійні функції безпеки, включаючи апаратний захист від кібератак intel ® control-flow enforcement technology (cet) і захист від перенаправлень intel ® virtualization technology;
  • реалізація розширення системи команд avx поряд з новими доповненнями для підтримки цілочисельних операцій ші.

У порівнянні з ядром skylake, в сингл-треді енергоефективне ядро alder lake надає на 40% більше продуктивності при однаковому енергоспоживанні, або аналогічну продуктивність при зменшеному на 40% енергоспоживанні. Чотири енергоефективних ядра без використання технології hyper threading мають продуктивність на 80% вище, ніж 2 ядра і 4 потоки skylake, споживаючи при цьому менше енергії або схожу продуктивність при використанні лише 20% енергії від skylake.

Продуктивні ядра alder lake, раніше відомі як golden cove спроектовані для зменшення затримок і високої продуктивності в сингл-треді. Нові продуктивні ядра забезпечують великий стрибок у продуктивності і кращу додатків з великим обсягом коду.

Архітектура продуктивних ядер розширилася в наступних напрямках:

  • ширше: 6 декодерів (раніше 4), кеш на 8 мікрооперацій (раніше до 6), 6 портів перейменування/розподілу (раніше 5), 12 виконавчих портів (раніше 10);
  • глибше: більше файли регістрів, більше файли фізичних регістрів, більш глибокий буфер переупорядковування інструкцій на 512 записів;
  • ефективніше: підвищена точність передбачення розгалужень, зменшена ефективна латентність кешу l1, повна предикативная оптимізація запису кеша l2.

У поєднанні з іншими оптимізаціями і нововведеннями intel обіцяють:

  • зростання продуктивності до 19% при тестах на великій кількості популярних додатків в порівнянні з архітектурою intel ® core ™ 11-го покоління (cypress cove) при порівнянній тактовій частоті (загальний показник зростання вважається як середнє геометричне);
  • упор на паралелізм і нарощування виконавчого паралелізму;
  • розширення intel ® advanced matrix-вбудовані засоби прискорення ші нового покоління, призначені для інференсу глибокого навчання і підвищення ефективності навчання. Вони включають виділені апаратні модулі і нову архітектуру набору інструкцій для значного прискорення операцій перемноження матриць;
  • оптимізації роботи з додатками, що мають великий обсяг даних і коду, в тому числі c точки зору зменшення затримок.

Раджа кодурі розповів про нову графіку intel arc і перше покоління продуктивних дискретних рішень під кодовою назвою alchemist.

Soc alchemist на базі мікроархітектури xe hpg спроектовані для забезпечення високої масштабованості і обчислювальної ефективності з наступними ключовими можливостями:

  • до 8 шарів рендеринга з фіксованою функцією для directx 12 ultimate;
  • нові ядра xe з 16 векторними і 16 матричними двигунами (званими xmx-xe matrix extensions), кешем і загальною локальною пам’яттю;
  • нові модулі трасування променів з підтримкою технологій directx raytracing (dxr) і vulkan ray tracing;
  • збільшення частоти в 1,5 рази і співвідношення продуктивності на ват в 1,5 рази в порівнянні з мікроархітектурою xe lp за рахунок поєднання нової архітектури, логічної побудови, схемотехніки, технології виробництва та оптимізації програмного забезпечення1;
  • виробництво з нормами технологічного процесу tsmc n6.

При розробці графіки intel використовує підхід, орієнтований на програмне забезпечення:

  • архітектура xe створюється в тісній співпраці з розробниками відповідно до галузевих стандартів;
  • перший високопродуктивний ігровий графічний процесор intel ставить на чільне продуктивність і якість завдяки розробці драйвера з єдиним уніфікованим вихідним кодом для інтегрованих і дискретних графічних продуктів;
  • intel завершила рефакторинг ключових компонентів графічного драйвера, в тому числі диспетчера пам’яті і компілятора, що призвело до підвищення продуктивності в процесорозалежних іграх до 18% і зменшення часу завантаження гри до 25%.

Технологія xess

Xess використовує перевагу реалізованих в alchemist прискорювачів ші для нової технології масштабування, яка забезпечує високу продуктивність і високу якість зображення. Технологія використовує глибоке навчання для синтезу зображень, близьких за якістю до рендерингу з високою роздільною здатністю. Завдяки xess, ігри, в які можна грати тільки при низьких налаштуваннях якості або дозволу, можуть демонструвати плавний ігровий процес з більш високими настройками якості і дозволу.

  • робота xess полягає в реконструкції деталей на субпіксельному рівні з сусідніх пікселів, а також з попередніх кадрів з компенсацією руху;
  • реконструкцію виконує нейронна мережа, навчена забезпечувати високу продуктивність і якість, зі збільшенням продуктивності в 2 рази;
  • xess забезпечує суперсемплінг на базі ші за допомогою набору інструкцій dp4a на широкому списку обладнання, включаючи інтегровану графіку;
  • кілька розробників ігор задіяні в роботі над xess. Sdk для першої версії xmx буде доступний незалежним розробникам програмного забезпечення вже цього місяця, а версія з dp4a буде доступна пізніше цього року.