Nuevas arquitecturas de computador para la industria del entretenimiento
Con la introducción de las familias de estaciones de trabajo O2
y OCTANE, Silicon Graphics ha definido la arquitectura para la nueva generación
de visualización de escritorio. Estos nuevos sistemas de gran
ancho de banda y baja latencia permite a los usuarios realizar tareas nunca
antes posibles en computadores de escritorio. Las tendencias futuras de
la industria del entrenenimiento exigirán capacidades tales como
edición descomprimida no lineal y animaciones extremadamente complejas,
ricas en secuencias 3D. Estas nuevas arquitecturas serán los vehículos
para entregar capacidades excepcionales a profesionales creativos, permitiendo
que realicen tareas complejas con facilidad.
Las limitaciones de una arquitectura tradicional de computador
La tecnología de los microprocesadores ha experimentado un notable
y constante aumento en funcionamiento durante la década pasada.
Aproximadamente cada cinco años hemos visto un aumento por 10 en
el poder del procesador. En el mismo tiempo, las mejoras en ancho de banda
convencional del sistema han aumentado mucho más lento, por 2 cada
cuatro años. La brecha cada vez mayor entre el funcionamiento del
microprocesador y el anchuro de banda del sistema se ilustra en el cuadro
1. El resultado de esta brecha del funcionamiento es que la velocidad y
la interactividad de la aplicación del usuario final es limitada
no por el procesador o la capacidad del acelerador de gráficos de
procesar, sino por la capacidad del sistema de manejar cantidades grandes
de movimiento de datos. Muchos de los procesadores pertenecientes a la
actual generación de aceleradores gráficos tienen métricas
de funcionamiento independiente impresionantes, pero el funcionamiento
de estos dispositivos en un sistema de bajo ancho de banda deja a los usuarios
con una sensación de bajo rendimiento.
Figura Nº 1: La brecha cada vez mayor entre los
procesadores y los buses de sistema
Un bus compartido ha estado en el corazón de las arquitecturas
de computador tradicionales desde la introducción de los primeros
computadores en la universidad de Chicago en los años 50. El bus
compartido tiene dos desventajas primarias. La primera es velocidad sin
procesar. El acercamiento a aumentar la velocidad del bus tradicional ha
sido aumentar el número de las líneas de datos a partir de
8 a 16-bits y entonces a partir de 32 a 64-bits. El paso de progresión
lógico siguiente sería alcanzar 128-bits. El problema con
este acercamiento es que un bus de 128-bits llega a ser innecesariamente
costoso e impráctico de implementar. Además, un bus de 128-bits
aumenta el performance solamente al doble, que se retrasa detrás
del aumento en potencia de 10 del poder del procesador. La otra limitación
del bus compartido es que todo el tráfico del sistema tiene lugar
al mismo tiempo en una sola línea. Las aplicaciones de hoy en día
tienen múltiples procesos ocurriendo al mismo tiempo, y a menudo
dos procesos separados dentro de la máquina harán colisión,
haciendo que ambos procesos ejecuten más lento y compartan la línea.
Arquitectura De Uno-a-Uno
En vez de la competición por un bus compartido, un computador ideal
permite que cada elemento del él se comunique directamente con cada
otro elemento, usando una línea privada que se ejecuta solamente
entre esos dos elementos. Esto permite que el índice de transferencia
de datos sea incrementado dramáticamente. También hace la
transferencia de datos extremadamente predecible, puesto que la conexión
entre elementos de procesamiento no se comparte. Esta previsibilidad permite
a una secuencia de datos, tales como la reproducción de un video
desde un disco, evitar el riesgo de ser interrumpido por otro proceso al
azar como la llegada de un E-mail.
El desafío entonces se convierte en cómo tomar las conexiones
individuales uno-a-uno entre los componentes y obtener un sistema completo.
La respuesta a este problema es el CROSSBAR SWITCH. Un crossbar
switch utiliza una avanzada tecnología de conmutación de
paquetes para rutear mensajes directamente desde un elemento de procesamiento
del computador, por ejemplo la CPU, a otro elemento tal como el sistema
gráfico. Un crossbar verdaderamente no bloqueante permite que múltiples
secuencias de datos fluyan desde un punto a otro en forma totalmente independiente;
no se bloquearán ni interferirán con otros. La estación
de trabajo OCTANE de Silicon Graphics incorpora esta clase de crossbar
switch en su arquitectura del sistema. El corazón de la estación
de trabajo OCTANE se construye alrededor de un crossbar no bloqueante de
ocho ports. Mientras que la inteligencia de dispositivos periféricos
crece, la arquitectura del crossbar permite que los dispositivos se comuniquen
"peer-to-peer". Esto significa que los dispositivos tales como una tarjeta
de entrada y salida de video enviará los datos directamente al disco,
y no consumirá ancho de banda de la memoria. Las transferencias
peer-to-peer son una característica que llegará a ser cada
vez más importante -- por ejemplo la transición desde resolución
de video a resolución HDTV. La estación de trabajo OCTANE
tiene la capacidad de utilizar estos dispositivos peer-to-peer a medida
que vayan estando disponibles.
La estación de trabajo OCTANE utiliza elementos de hardware de
procesamiento dedicado para optimizar el funcionamiento de las tareas claves
tales como procesamiento de gráficos o compresión de video.
Cada uno de estos los motores dedicados residen en diferentes brazos del
crossbar switch, tal como se muestra en la figura Nº 2.
Figura Nº 2: La Arquitectura De OCTANE XIO
Esto permite que el software de aplicación divida las tareas
necesarias y asigne cada una al elemento de proceso apropiado (gráficos,
CPU, compresión, etc.) para la ejecución paralela. OCTANE
puede soportar actualmente dos CPUs así que la tarea actual
se puede dividir entre los dos procesadores y entonces ejecutar al doble
de velocidad. Esto es especialmente importante para las tareas tales como
rendering de múltiples cuadros de una secuencia animada. La arquitectura
del crossbar permite que estos distintos elementos de proceso se comuniquen
tan rápidamente como puedan procesar datos, y por lo tanto nunca
tienen que esperar debido al tráfico en el bus para continuar.
Memoria Unificada
El sistema OCTANE descrito anteriormente utiliza hardware dedicado que
está optimizado para ejecutar funciones específicas tales
como memoria especial para texturas. Para complementar este acercamiento,
la estación de trabajo O2 utiliza un hardware más flexible
para traer las características de última generación
a un precio bajo sin precedentes. El sistema O2 se construye alrededor
de una Arquitectra de Memoria Unificada (UMA). UMA pone una memoria de
gran ancho de banda en el corazón del sistema. Esta memoria substituye
con eficacia al bus compartido de los sistemas tradicionales. Cinco bloques
de procesamiento dedicado tienen acceso a esta memoria principal. Estos
bloques de procesamiento incluyen la CPU, el motor de proyección
de imágenes, el motor de los gráficos, el motor de compresión,
el sistema de video, y el Input/Output de O2. Todos estos elementos de
procesamiento acceden a los datos de un solo banco de memoria unificada
de altísima velocidad. Esto significa que una variedad de tipos
de datos puede pasar a través del sistema con facilidad. El motor
de compresión se puede procesar una secuencia de video para después
ser accesada fácilmente por la CPU, el motor de proyección
de imágenes, o despliegue gráfico, todo a completa resolución
y frame rate. Mejor que copiar los datos de un subsistema a otro, los subsistemas
de O2 pueden intercambiar simplemente punteros, reduciendo así enormemente
la penalización en el desempeño impuesta por la copia de
datos. Esta arquitectura se ilustra en la figura Nº 3.
Figura Nº 3: La Arquitectura de Memoria Unificada de O2
La arquitectura UMA proporciona la conectividad uno-a-uno
y un incremento mayor en ancho de banda del sistema, necesario para
ejecutar las aplicaciones del emergente nuevo software de entretenimiento.
Además de los beneficios en el desempeño de este sistema,
la arquitectura UMA trae un nuevo nivel de flexibilidad a los computadores
digitales de multimedia con su capacidad de manejar muchos tipos diversos
de medios y de realizar muchas funciones diversas. Una estación
de trabajo O2 puede manejar las secuencias de multimedia de virtualmente
cualquier tamaño y resolución, extendiéndose desde
el video basado en Web hasta el CCIR-601 a tiempo real sin comprimir para
filmar imágenes de resolución. Una estación de trabajo
O2 puede procesar los video JPEG y MPEG. La memoria de texturas de los
gráficos es limitada solamente por la cantidad de memoria de sistema
disponible, y el sistema de texturas puede aceptar un video como textura
para efectos 3D verdaderos en rendering a tiempo real.
La combinación de performance y flexibilidad es lo que hace de
la estación de trabajo O2 muy poderosa.
Nuevas capacidades en EDICIÓN
OCTANE es la plataforma ideal para edición no lineal, sin comprimir.
Proporciona dos canales de video de 10-bit CCIR-601 IN y OUT, así
como una interface de disco (por ejemplo UltraSCSI y el canal de la fibra)
suficientemente rápido para grabar dos secuencias al disco en tiempo
real. El sistema base viene equipado con dos buses Ultra-SCSI, y tres drive
bays de 3.5 pulgadas que puedan almacenar hasta 27GB de datos. Las interfaces
de canales adicionales UltraSCSI o de fibra se pueden agregar a través
del PCI o a través del bus de alta velocidad XIO. Procesamiento
de video se puede realizar en el subsistema gráfico del OCTANE.
El motor gráfico puede tratar el videos de resolución completa
como textura y asociarlo sobre un polígono para efectos 3D verdaderamente
únicos. Proporciona así de efectos 3D reales, no una simulación
de 3D como la que ofrecen otros sistemas.
Alternativomente, la estación de trabajo O2 es la plataforma
de la opción para edición comprimida edición off-line
sin comprimir. O2 tiene la capacidad de procesar video JPEG en tiempo real.
Los editores no se limitan a un número conjunto de secuencias; el
sistema O2 se puede programar para procesar uno, dos, tres, incluso cuatro
o más secuencias de video. Obviamente, a medida que el número
de secuencias aumenta, la resolución o el funcionamiento en tiempo
real comienza a disminuir. O2 puede también procesar video sin comprimir,
así que los editores pueden realizar el trabajo creativo off-line
y finalizar con el rendering en una plataforma on-line.
Nuevas capacidades en GRÁFICOS
O2 demuestra puro performance de Silicon Graphics. Con 32-bit de color,
z-buffering, y texturas aceleradas por hardware, la estación de
trabajo O2 es la plataforma ideal para la creación de páginas
gráficas. Los poderosísimos gráficos de O2 permiten
al usuario obtener verdadera 3D en la creación gráfica, y
en tiempo real.
La estación de trabajo OCTANE es la plataforma ideal para gráficos
on-air. Con 2 puertos de I/O de video de 10-bit CCIR-601, los gráficos
on-air pueden ser generados en tiempo real, mezclado con video en vivo.
Usando un cluster de estaciones O2 conectadas por una red de alta velocidad
se puede tener múltiples estaciones para la creación de gráficos
alimentando un sistema OCTANE on-air. OCTANE puede generar elementos de
conjunto virtual, realzando así la programación local.
Nuevas capacidades en audio
Todas las estaciones de trabajo de Silicon Graphics poseen el más
avanzado sistema de I/O de audio en la industria de la computación.
OCTANE tiene por base 8 pistas de audio optico digital ADAT de 24-bit,
dos canales de I/O serial digital AES3-ID, y dos puertos de I/O análogos.
Las capacidades de I/O digital estan también disponibles en una
tarjeta PCI que puede ser agregada a las estcaiones OCTANE u O2. Agregando
múltiples tarjetas permite a los usuarios poseer 32 o mas pistas
de I/O de audio. Combinando esto con el poder del procesamiento DSP nativo
del procesador R10000 se obtiene obtienen las estaciones de trabajo con
el más avanzado audio digital en la industria.
Nuevas capacidades en la animación 3d
OCTANE es la máquina soñada para la creación de animaciones
3D, gracias a sus procesadores R10000 y a su altamente poderoso sistema
gráfico OCTANE/MXI. Los procesadores duales permiten a los animadores
trabajar con modelos en wireframe y obtener imagenes finales renderizadas
con calidad fotográfica en preview a tiempo real. Mientras una CPU
se ocupa de la animación interactiva, la otra esta libre para hacer
los updates de las imagenes renderizadas fotorealistas. La segunda CPU
solo necesita re-renderizar la imagen final que es cambiada por el animador
y asi la ventana de preview fotorealista puede ser refrescada en tiempo
real, o casi tiempo real.
La sincronización de la animación no compromete desempeño
del sistema. Videos puedes ser texturizados en tiempo real y alli insertados
dentro de una escena para proveer de detalles ricos sin una animación
extensa.
O2 ofrece muchas de estas capacidades a un precio menor.
Con O2 y OCTANE un animador puede crear una secuencia animada, componerla
dentro de un video y editar la pieza final, todo en una sola plataforma.
Nuevas capacidades en el desarrollo del juego
Los desarrolladores de juegos pueden crear secuencias animadas y modelos,
los juegos pueden ser pre evaluados a través de prototipos que requieren
de un esfuerzo mucho menor, y la brecha entre diseñadores y programadores
se hace mucho menor con estos sistemas. Agrgando además las capacidades
comentadas en puntos anteriores podemos asegurar que que esta forma se
hace mucho más agil el desarrollo de juegos.