Redacción 3 septiembre, 2019

El Tecnológico Nacional de México / Instituto Tecnológico de Tijuana es una institución de educación superior ubicada en Tijuana, Baja California, México, que ha investigado problemas del mundo real con técnicas de aprendizaje automático (machine learning)

Así como patrones de inmigración humana y otros temas de ciencias sociales tratados en el Tecnológico Nacional de México, que son relevantes para las ciudades fronterizas entre México y los Estados Unidos.

El Tecnológico Nacional de México utiliza IBM POWER8 HPC
El Tecnológico Nacional de México utiliza IBM POWER8 HPC

Esta organización cuenta con un conjunto de datos muy grande con base en el cual busca desarrollar algoritmos propietarios que se utilizen para hacer predicciones sobre los patrones de migración humana y otros problemas que afectan a la sociedad.

Debido a la magnitud del proyecto, el instituto comenzó a analizar la capacidad de su infraestructura existente para realizar investigaciones sobre estos temas al más alto nivel.

El equipo llegó a la conclusión de que ésta no tendría el ancho de banda ni la eficiencia necesarias para realizar la investigación con base en Big Data, en particular para realizar procesos complejos de aprendizaje y optimización.

Necesitaban servidores acelerados con GPU para manejar cargas de trabajo informáticas de alto rendimiento. Estos servidores también tendrían que ampliarse para satisfacer las demandas de sus conjuntos de datos.

Por ello, el Dr. Leonardo Trujillo, profesor de investigación en el Departamento de Ingeniería Eléctrica y Electrónica del Tecnológico Nacional de México / Instituto Tecnológico de Tijuana, comenzó a investigar qué infraestructura de TI para computación de alto rendimiento les permitiría realizar investigaciones al más alto nivel.

Consciente de la relación entre IBM y NVIDIA en Inteligencia Artificial (IA) empresarial y computación de alto rendimiento, comenzó a buscar opciones para desarrollar su infraestructura de investigación en Power Systems.

Después de hablar con IBM sobre esta plataforma, el equipo confió en que ésta era la dirección que necesitaban tomar.

Tiempo de computación más rápido y mayor escalabilidad

A través de un proyecto de la convocatoria Fronteras de la Ciencia de CONACYT, llamado “Cómputo Evolutivo a Gran Escala”, el Tecnológico Nacional de México / Instituto Tecnológico de Tijuana adquirió un servidor IBM Power Systems S822LC 8335GTB, adoptando IBM Cloud Private en Power Systems para Cómputo de Alto Rendimiento.

Estos servidores cuentan con aceleradores GPU NVIDIA Tesla y la tecnología NVLink para una comunicación más rápida de la CPU a la GPU. IBM Cloud Private on Power es una plataforma abierta de Kubernetes que ayuda a los desarrolladores a crear y desplegar fácilmente aplicaciones en contenedores.

Con IBM Cloud Private on Power, el Dr. Trujillo, junto con su equipo, implementó sus aplicaciones informáticas de alto rendimiento rápidamente y en un entorno de nube privada local, de forma segura y con la mejor disponibilidad.

El instituto también utilizó contenedores Docker en la nueva infraestructura de IBM Power Systems.

Docker proporciona software de contenedor empresarial que es ideal para los desarrolladores que desean comenzar con las aplicaciones basadas en contenedor.

Al utilizar Docker en IBM Power Systems, el Dr. Trujillo y su equipo pueden contener sus algoritmos de IA para realizar búsquedas específicas en grandes conjuntos de datos.

Pueden dividir una búsqueda dentro de un gran conjunto de datos en segmentos y lanzar un contenedor de Docker que se centrará sólo en esa búsqueda específica, lo que disminuye el tiempo dedicado a buscar información específica y les permite realizar sofisticados patrones de búsqueda de vanguardia, de manera sencilla y eficiente.

Con IBM Cloud Private y Docker en Power Systems, el equipo ha podido reducir el tiempo de cómputo para sus cargas de trabajo de investigación de aproximadamente 4 horas (con su antigua infraestructura) a sólo uno o dos minutos, un aumento de velocidad de más de 100 veces.

Al usar la tecnología NVIDIA NVLink en IBM Power Systems, los datos se transfieren entre la CPU y la GPU más rápido que con una arquitectura tradicional.

IBM Power Systems tiene hasta 5.6 veces más ancho de banda de E/S que los servidores x86, para reducir los cuellos de botella en cargas de trabajo de computación de alto rendimiento.

El Dr. Trujillo y su equipo también pueden compartir RAM a través de CPU y GPU para un rendimiento aún mayor.

El enfoque basado en contenedores también reduce el tiempo de implementación y la curva de aprendizaje para los jóvenes investigadores y estudiantes que se unen a su laboratorio.

También pueden escalar más rápido y más lejos en comparación con su antigua infraestructura.

La escalabilidad es fundamental para el trabajo que realizan, ya que les permite caracterizar la dinámica de sus modelos de búsqueda de una manera más precisa para las aplicaciones de investigación.

Con su antigua infraestructura tradicional, sólo podían ejecutar estaciones de trabajo con entre 1,000 y 2,000 muestras en problemas de muchas dimensiones.

Ahora pueden escalar a más de un millón de muestras de datos con Power Systems.

Esta escalabilidad les permite obtener nuevos conocimientos sobre los problemas que intentan resolver.

“Trabajamos en la intersección de la computación evolutiva y el aprendizaje automático, un campo llamado Programación Genética, en el que es posible generar automáticamente impresionantes herramientas de predicción utilizando sofisticados métodos de búsqueda y optimización, pero para lograrlo se requiere de mucha potencia computacional.

Afortunadamente la plataforma IBM POWER8 HPC con GPU NVIDIA ofrece más que suficiente”, señaló el Dr. Leonardo Trujillo.

 

Por Marcelo Lozano – General Publisher IT Connect Latam

A %d blogueros les gusta esto: