Arm Cortex-A77: todo lo que necesitas saber

Autor: Randy Alexander
Fecha De Creación: 2 Abril 2021
Fecha De Actualización: 1 Mes De Julio 2024
Anonim
¿Qué es ARM? - ¡Todo lo que necesitas saber !
Video: ¿Qué es ARM? - ¡Todo lo que necesitas saber !

Contenido


Junto con su nuevo procesador de gráficos Mali-G77 y el procesador de pantalla Mali-D77, Arm ha presentado su último diseño de CPU de alto rendimiento: el Cortex-A77. Al igual que el Cortex-A76 del año pasado, el Cortex-A77 está diseñado para aplicaciones de nivel superior que exigen el exclusivo consumo de bajo consumo de energía de Arm. Todo, desde teléfonos inteligentes hasta computadoras portátiles y muy probablemente más allá.

Con el Cortex-A77, Arm ha apuntado a las máximas instrucciones por ciclo / reloj (IPC) de aumento de rendimiento que podría manejar sobre el Cortex-A76. Las frecuencias de reloj, el consumo de energía y el área están diseñados para permanecer aproximadamente en el mismo estadio, pero el nuevo núcleo puede atravesar más instrucciones a la vez. Para hacer esto, Arm ha diseñado un núcleo aún más amplio que el año pasado y ha realizado una serie de mejoras para mantener al núcleo de la CPU alimentado con cosas que hacer. Pero antes de llegar a eso, profundicemos en la descripción general de alto nivel y los números de rendimiento.


Alcanzar objetivos de rendimiento

En agosto de 2018, Arm compartió de manera inusual una hoja de ruta de la CPU hasta 2020. Desde el Cortex-A73 de 2016 hasta el diseño "Hércules" de 2020, la compañía promete un aumento de 2.5 veces en el rendimiento de cómputo. Una buena parte de esta gran proyección se logró con el gran cambio de microarquitectura con el Cortex-A76, velocidades de reloj modernas más altas y el movimiento de 16 a 10 y ahora fabricación de 7 nm con 5 nm a seguir. Aproximadamente 1.8x de las ganancias de la hoja de ruta ya se lograron el año pasado, y el Cortex-A77 proporciona aproximadamente un 20 por ciento más de impulso de IPC. Esto nos pone en el camino hacia el objetivo 2.5x de Arm, aunque los dispositivos móviles con presupuestos limitados de energía y térmicos no esperan ver todas estas ganancias.

En comparación, el Cortex-A76 del año pasado proporcionó un aumento de alrededor del 30-35 por ciento sobre el Cortex-A75. Este año estamos viendo una ganancia de IPC más apagada, pero aún significativa, del 20 por ciento entre el A77 y el A76. Esta es una buena noticia porque significa un mayor rendimiento mientras se adhiere a limitaciones térmicas y de potencia similares a las anteriores. La compensación es que el A77 es aproximadamente un 17 por ciento más grande que el A76, por lo que costará un poco más en términos de área de silicio. Si desea una comparación con los líderes de escritorio, AMD logró un aumento del IPC del 15 por ciento entre Zen2 y Zen +, mientras que el IPC de Intel se ha mantenido prácticamente estático durante años.Por supuesto, estamos hablando de diferentes segmentos del mercado aquí, pero esto demuestra cómo el equipo de diseño de CPU de Arm ha logrado avances impresionantes en las últimas generaciones.


Se ofrece un aumento del rendimiento del 20% para los SoC basados ​​en Cortex-A77 de próxima generación

La conclusión aquí es que el A76 marcó un cambio importante en la microarquitectura con enormes ganancias de rendimiento, mientras que volvimos a las mejoras en el nivel de optimización con el A77. Con eso fuera del camino, vamos a sumergirnos en las novedades del Arm Cortex-A77.

Cortex-A77 se basa en la microarquitectura A76

La clave para comprender la diferencia entre el Cortex-A77 y el A76 es comprender lo que se entiende por un diseño central "más amplio". Esencialmente, estamos hablando de la capacidad de ejecutar más instrucciones para cada ciclo de reloj, lo que aumenta el rendimiento del núcleo. Hay dos partes importantes para hacer esto bien: aumentar el número de unidades de ejecución para realizar el procesamiento y garantizar que estas unidades se mantengan bien alimentadas con datos. Comencemos con la última parte y centrémonos en las partes de despacho, caché y predictores de ramificación del SoC.

El Cortex-A77 ve un aumento del 50 por ciento en el ancho de envío, hasta seis instrucciones por ciclo de cuatro con el A76. Eso significa más instrucciones dirigidas al núcleo de ejecución para cada ciclo de reloj para un mayor potencial de rendimiento. La ventana de ejecución fuera de orden también es más grande como resultado, aumentando a 160 entradas para exponer más paralelismo. Hay una memoria caché de instrucciones de 64K conocida, mientras que el búfer de destino de rama (BTB), que contiene direcciones para el predictor de rama, es un 33 por ciento más grande que antes para manejar el crecimiento en instrucciones paralelas. Nada inusual aquí, es esencialmente una versión más amplia del diseño del año pasado.

La adición de front-end más intrigante es el nuevo caché MOP de 1.5K, que almacena macro-Ops (MOP) que se retroalimentan desde la unidad de decodificación. La arquitectura de CPU de Arm descodifica las instrucciones de la aplicación de un usuario en macrooperaciones más pequeñas y luego las microoperaciones que el núcleo de ejecución comprende. Puedes ver esto en el diagrama de arriba en la sección de decodificación. El caché de MOP se usa para reducir la penalización de costos de las ramas y los enjuagues perdidos, ya que mantiene las operaciones macro en lugar de decodificarlas nuevamente y aumenta el rendimiento general del núcleo. Las capturas del MOP en lugar de i-cache omiten la etapa de decodificación, ahorrando un ciclo. Arm afirma que el caché de MOP puede alcanzar una tasa de éxito del 85 por ciento o más en un rango de cargas de trabajo, por lo que es una adición muy útil al caché i estándar.

Al pasar a la parte central de ejecución de la CPU, observe la adición de una cuarta ALU y una segunda unidad Branch. Esta cuarta ALU aumenta el ancho de banda general de procesamiento de números del procesador en un 50 por ciento. Esta ALU adicional es capaz de instrucciones básicas de un ciclo (como ADD y SUB) más operaciones con números enteros de dos ciclos como una multiplicación. Dos de las otras ALU solo pueden manejar instrucciones básicas de un ciclo, mientras que la unidad final se carga con operaciones matemáticas más avanzadas como división, acumulación múltiple, etc. La segunda unidad de rama dentro del núcleo de ejecución duplica el número de saltos de rama simultáneos. core puede manejar, lo cual es útil en casos donde dos de las seis instrucciones despachadas son saltos de bifurcación. Esto suena un poco extraño, pero las pruebas internas en Arm revelaron beneficios de rendimiento al adoptar esta segunda unidad.

El Cortex-A77 ofrece un paralelismo mejorado y una nueva versión de los cachés de búsqueda previa

Otros ajustes al núcleo de la CPU incluyen la adición de una segunda tubería de cifrado AES. Los canales de almacenamiento de datos ahora cuentan con puertos de emisión dedicados para duplicar el ancho de banda de emisión de memoria. Estos puertos se compartieron previamente con las ALU, que a veces podrían convertirse en un cuello de botella. También hay un perfeccionador de datos de próxima generación para mejorar la eficiencia energética y al mismo tiempo aumentar el ancho de banda para la DRAM del sistema.

Parte de este sistema en el Cortex-A77 también presenta un nuevo sistema de captación previa "consciente del sistema". Esto mejora el rendimiento de la memoria en función de la amplia gama de recuentos de núcleos de CPU, capacidades y latencias de caché y configuraciones de subsistema de memoria dentro de los dispositivos finales. El hardware dedicado para comunicarse con la Unidad de programación dinámica (DSU) como parte de un clúster de CPU DynamIQ, que monitorea el uso del caché L3 compartido. El núcleo presenta niveles dinámicos de distancia y agresividad para reducir la utilización de caché en situaciones en las que el ancho de banda L3 está limitado por otros núcleos de CPU. Los núcleos de mayor rendimiento como el Cortex-A77 tienen más probabilidades de saturar el acceso DSU a la memoria, mientras que los núcleos de menor potencia como el A55 tienen pocas probabilidades de hacerlo.

Ajustandolo todo

Hay muchos pequeños cambios en el Cortex-A77 que se suman a algunas diferencias sustanciales con respecto a su predecesor. En pocas palabras, la nueva caché de MOP del A77 combinada con una ventana de instrucciones más amplia y más larga ayuda a mantener a las unidades de ALU, Branch y memoria reforzadas ocupadas con cosas que hacer. El potente diseño Cortex-A76 se ha ampliado para mejorar aún más su rendimiento con el A77, sin depender de velocidades de reloj más altas.

Los mayores aumentos de rendimiento para el Cortex-A77 llegan en forma de un número entero y matemática de coma flotante. Esto es confirmado por los puntos de referencia internos de Arm, que muestran un aumento del rendimiento del 20 al 35 por ciento en los puntos de referencia de SPEC enteros y de coma flotante, respectivamente. Las mejoras en el ancho de banda de la memoria se ubican en algún lugar entre el 15 y el 20 por ciento, destacando nuevamente que las mayores ganancias vienen en forma de reducción de números. En general, estas mejoras le dan al A77 un aumento promedio del 20 por ciento sobre la generación anterior. También podemos ver algunas ganancias más marginales como resultado de procesos de fabricación más avanzados de 7 nm a finales de este año o principios de 2020.

En términos de teléfonos inteligentes, los SoC con alimentación Cortex-A77 están destinados a productos emblemáticos de alto rendimiento. Arm espera que el diseño de la central eléctrica utilice 4 + 4 bits. Dado el aumento del rendimiento y el ligero aumento del tamaño del área del A77, es probable que veamos a los diseñadores de SoC continuar con la tendencia 1 + 3 + 4 o 2 + 2 + 4. Con uno o dos núcleos grandes y potentes con cachés más grandes y relojes más altos, respaldados por 2 o 3 núcleos A77 con tamaños de caché más pequeños y relojes más bajos para ahorrar energía y área. En última instancia, el Cortex-A77 explica cosas buenas para los chips de teléfonos inteligentes y el creciente mercado de computadoras portátiles basadas en Arm siempre conectadas. Esté atento a los anuncios de silicio a finales de este año.

Android ha evolucionado coniderablemente a lo largo de lo año, preentando un nuevo redieño de la interfaz de uuario y obteniendo mucha caracterítica y optimizacione única en el cam...

Parece que lo juego de Android on cada vez má grande y mejore cada me y iempre hay una gran cantidad de nuevo título en Google Play. Ya ea que ea un jugador caual o quiera algo con un poco m...

Popular En El Sitio