Basierend auf der ARMv9-Architektur präsentiert ARM heute die Komponenten der nächsten Generation von Systems on a Chip, wie sie in den nächsten Smartphones, Tablets und Computern zum Einsatz kommen werden. Das Update für Arm Cortex-X3, A715 und A510 bietet mehr Leistung, reduzierten Stromverbrauch und ermöglicht neue Konfigurationen.
TCS22 bietet 28 Prozent mehr Spieleleistung
Cortex-X3, Cortex-A715 und Cortex-A510 Refresh sind die neuen 2022-CPU-Kerne von Arm und Teil des Rechenleistungsabschnitts von Total Compute Solutions 2022 (TCS22), der auch den Zugriff für Entwickler und „Sicherheit“ umfasst. So nennt Arm in diesem Jahr die ganzheitliche Lösung des eigenen IP. Die entsprechenden Produkte, also Prozessoren, sollen erst 2023 auf den Markt kommen. In einer typischen 1+3+4-Konfiguration verspricht der TCS22 gegenüber dem TCS21 mit Cortex-X2, Cortex-A710 und Cortex-X2 eine durchschnittlich 28-prozentige Steigerung der Gaming-Performance. A510.
Beispielkonfiguration für TCS22 (Bild: Arm)
In diese Betrachtung fließen aber nicht nur die neuen Cortex-Kerne ein, sondern insbesondere auch die neue Immortalis G715-GPU und Optimierungen am „DynamIQ Shared Drive“. Neben der Immortalis-G715 mit Hardware-Raytracing hat Arm heute auch Mali-G715 und Mali-G615 als neue Grafikeinheiten vorgestellt. ComputerBase behandelt die drei neuen GPUs auf Basis der Valhall-Architektur in einem separaten Artikel.
Entwicklung der Premiere von Armv9 im letzten Jahr
Mit dem TCS21 fand vor rund einem Jahr die Armv9-Premiere mit den dazugehörigen Präsentationen von Cortex-X2, Cortex-A710 und Cortex-A510, sowie DSU-110 und Mali-G710 statt. Der TCS22 baut darauf auf und bleibt daher ISA-konform. Neben der Steigerung der Spieleleistung um durchschnittlich 28 Prozent soll TCS22 in diesem Szenario den DRAM-Traffic um bis zu 23 Prozent und den Stromverbrauch um bis zu 16 Prozent im Vergleich zu einer typischen Konfiguration für High-End-Smartphones reduzieren. Mit der neuen IP, der Unterstützung von Komponenten wie dem Cortex-M85 und Softwareoptimierungen gewinnt der TCS22 auch im Bereich des maschinellen Lernens deutlich. Arm stellte auch prozentuale Veränderungen einzelner Komponenten von TCS22 im Vergleich zum Vorjahr vor, auf die später im Artikel eingegangen wird.
-
Übersicht der Änderungen an TCS22 (Bild: Arm)
Bild 1 von 4
DSU ist bereit für schnelle Arm-Laptops
Ein Novum im Bereich der möglichen Konfigurationen ist die Unterstützung von bis zu zwölf Kernen innerhalb des Clusters der „DynamIQ Shared Unit-110“ (DSU-110), die Arm im vergangenen Jahr vorgestellt hat. Diese Änderung ermöglicht neue High-End-Konfigurationen, die für zukünftige Arm-Computer benötigt werden. Als Teil des Tech Day Clients nannte Arm als Beispiel eine Konfiguration mit acht Cortex-X3 und vier Cortex-A715, aber ohne Cortex-A510-Upgrade. Ebenso ließe sich mit ihm ein SoC mit zwölf kleinen Kernen ausschließlich wirtschaftlich realisieren. Mit dem TCS22 will Arm nicht nur Spieler, sondern auch besonders ansprechen und hat die neuen Kerne deshalb auf eine konstant hohe Leistung in diesem Bereich ausgelegt, ohne den Spielspaß einzuschränken.
Die Mikroarchitektur des DSU-110 hat sich nicht wesentlich verändert, Arm spricht von einem „Tuning“, das nötig sei, um das Design der zusätzlichen Kerne vorzubereiten. Außerdem gab es Updates für Bereiche, die von der Anzahl der Kerne abhängen, wie gemappte Speichereinträge pro Kern, sowie Testmethoden für die physikalische Umsetzung bei einer neuen Anlage.
Theoretisch können Partner mit dem aufgerüsteten DSU-110 nun auch bis zu zwölf IP-Kerne aus dem Vorjahr einbauen. Wenn jedoch die neuesten ISA-Features wie asymmetrisches MTE und EPAN (wie im nächsten Abschnitt erläutert) verwendet werden sollen, muss die letzte IP verwendet werden.
-
Laptops und Arm-Computer erwarten eine neue 8 + 4 + 0-Konfiguration (Bild: Arm)
Bild 1 von 3
Der Arm erweitert die Sicherheitsfunktionen
In puncto Sicherheit bietet der neue Rechencluster Unterstützung für Asymmetric MTE als Erweiterung der im vergangenen Jahr mit ARMv9 eingeführten Memory Labelling Extension (MTE). Speicherbereiche und zugehörige Zeiger werden mit dem gleichen Label versehen und die CPU prüft auf Übereinstimmung. Bei einer Abweichung unterbricht die CPU die Bearbeitung. Mit asymmetrischem MTE kann die CPU diesen Fehler während eines Ladebefehls aktivieren und einen Speicherbereich während eines Speicherbefehls asynchron aktualisieren.
TCS22 erhält Sicherheitsverbesserungen (Bild: Arm)
Mit EPAN („Enhanced PAN“) verfolgt ARM auch das bisherige PAN („Never Privileged Access“), das darauf abzielt, den Zugriff auf weniger privilegierte Speicherbereiche im User-Modus beispielsweise auf Kernel-Ebene zu verhindern. Die Sicherheitsfunktion soll einen Angriff im Benutzermodus durch einen ausgetricksten Kernel verhindern. Ein Fehler in den ARM-Spezifikationen verhinderte jedoch nicht den Zugriff auf die als “run-only” gekennzeichneten User-Mode-Speicherseiten. „Improved PAN“ soll genau diesen Umstand korrigieren.
Die Immortalis-GPU dominiert das Hardware-Raytracing
Mit dem TCS22 stellt Arm neue Grafikeinheiten für das Flaggschiff- und Premiumsegment vor. Das neue Flaggschiff ist die Immortalis G715, die mit bis zu 16 GPU-Kernen integriert werden kann. Die beiden Hauptinnovationen der Immortalis-G715 sind Hardware-Raytracking mit einer neuen RTU („Ray Tracing Unit“) im Shading-Kern und Unterstützung für „Variable Rate Shading“ (VRS). Neben der Immortalis-G715 ist auch die Mali-G715 neu und bietet die gleichen Änderungen wie VRS und Laufzeit-Engine-Optimierungen, mit Ausnahme der RTU. Gleiches gilt für die Mali-G615, die mit weniger Schattenkernen konfiguriert werden kann und optional weniger L2-Cache besitzt.
-
Drei neue GPUs, eine davon mit Hardware-Raytracing (Bild: Arm)
Bild 1 von 2
CoreLink CI-700 und NI-700 bleiben fast gleich
Arm hat Cache-Optimierungen für CoreLink CI-700- und NI-700-Verbindungen vorgenommen, die verwendet werden, um System-IPs und IPs von Drittanbietern zu verbinden, die von anderen Herstellern selbst entwickelt wurden. Zum Beispiel bei der Verwendung von MTE (asymmetrisch), um eine bessere Skalierbarkeit zu gewährleisten. An den CoreLink CI-700 können weiterhin ein bis acht DSU-Cluster und acht Speichercontroller angeschlossen werden, von denen jeweils eine Komponente in Smartphones üblich ist. Ein CoreLink CI-700 ist mit sogenannten XP-Knoten konfiguriert, die in einem Netz von bis zu 4 × 3 Punkten existieren können, von denen jeder maximal acht Teile des System-Level-Cache von bis zu 4 MB haben kann. Arm verwendet SLC auch zum Speichern von MTE-Tags.
Optimierungen für moderne Fertigungsprozesse
Arm hat die physische IP so optimiert, dass sie besser in Kombination mit modernsten Herstellungsverfahren wie 5nm und 4nm, wie sie von Samsung und TSMC angeboten werden, verwendet werden kann. Der TCS22 unterstützt jetzt auch die Cortex-M85-Verbindung, die sich für Embedded-Lösungen wie Smart Speaker eignet, aber auch als Always-On-Prozessor mit seinen DSP- und Machine-Learning-Funktionen fungieren kann, um beispielsweise Sprachbefehle auf einem Smartphone zu verarbeiten . Wenn der kleinere Cortex-M55 verwendet wird, können Sie jetzt auch benutzerdefinierte Armanweisungen ausführen, die bei der Einführung auf den Cortex-M33 beschränkt waren.
-
Optimierungen für moderne Fertigungsprozesse (Bild: Arm)
Bild 1 von 2
Neue Tools für Entwickler
Im Bereich Software und Tools für Entwickler bietet Arm TCS22-Support für das neuste Android, voraussichtlich im Herbst Version 13, und wird in Kürze eine neue Fixed Virtual Platform (FVP) zur Verfügung stellen, mit der ein kompletter Das auf den neuen Komponenten basierende Armsystem soll in etwa die Geschwindigkeit der tatsächlichen Hardware simulieren können. FVP bietet ARM für Windows- und Linux-Betriebssysteme. Zu den Entwicklertools gehören auch das Hardware Success Kit und das Software Success Kit, die Arm in Kürze in einer neuen, an TCS22 angepassten Generation zur Verfügung stellen will.
Neue Tools und Kits für Entwickler (Bild: Arm) Seite 1/3 Nächste SeiteCortex-X3: In Texas ist alles größer