Almacenamiento híbrido: motivadores 2020 del mercado

El almacenamiento híbrido reúne las ventajas de SSD (baja latencia) y HDD (almacenamiento económico). 

Las cartas de triunfo del almacenamiento híbrido: alto rendimiento, fácil escalado, precio asequible.

Los arreglos all-flash son aún más productivos, pero mucho más costosos y no cubren las tareas de entregar grandes cantidades de datos.

Los híbridos pueden estar definidos por software o basados ​​en hardware, con almacenamiento en caché flash de unidades lentas o arquitectura en capas, con y sin transferencia de datos automatizada entre medios. 

Aparecieron en el mercado del almacenamiento durante mucho tiempo, como respuesta al crecimiento explosivo del volumen de activos digitales. 

Petabyte no sorprende hoy

Los datos son desiguales y las aplicaciones los exigen en diversos grados. Los datos brutos (datos masivos) se almacenan en discos mecánicos, la capa SSD evita la carga de aplicaciones críticas. El tráfico híbrido se describe claramente en términos de frío / calor.

Datos de “termodinámica”

La temperatura se refiere metafóricamente a la velocidad a la que las aplicaciones sondean los datos. La matriz de información almacenada es como una pirámide. 

En su punto máximo – datos de circulación frecuente, “caliente”. Son pocos, son modificables, la velocidad de acceso a ellos es fundamental. 

Cuantas menos solicitudes de datos y menor frecuencia se actualicen, más frías son. 

Las masas enfriadas descansan en la parte inferior, pero al mismo tiempo permanecen en rotación, un solo campo de direcciones, análisis y consultas de búsqueda. Separados están los datos “congelados”, archivos estáticos aislados que los reguladores generalmente prescriben almacenar.

Motivadores de almacenamiento híbrido

La optimización del almacenamiento de datos de temperatura variable ha generado Hierarchical Storage Management (HSM), una tecnología para distribuir datos automáticamente entre unidades rápidas (costosas) y lentas (baratas). 

En el almacenamiento en capas y HSM, la mayor parte de los datos se almacena en discos mecánicos o cintas de gran volumen. 

Siguiendo la dinámica de las solicitudes de E / S, los datos se migran a la memoria flash y vuelven a la clase económica.

Los datos respiran

Sería conveniente almacenar todos los datos en un solo lugar en general, y dejar que los propios sistemas de almacenamiento monitoreen su temperatura y los muevan entre capas. 

Hay varios obstáculos para esto. ¿Cómo llevar datos de diferentes fuentes a un único almacén gestionado? ¿Cómo predecir las proporciones de frío y calor, qué volúmenes de medios proporcionarles? ¿No sería mejor utilizar software de terceros para analizar y mover datos entre grupos de almacenamiento típicos en lugar de invertir en costosos sistemas de almacenamiento HSM?

La actividad de datos se distribuye en el tiempo y el espacio. 

Las empresas recopilan datos en dispositivos periféricos (“calor”) y luego los envían a grupos de datos, donde se enfría (“frío”). 

Luego, los servidores de bases de datos o los servidores analíticos trabajan con ellos (“calientes”). 

Se crean copias de seguridad (“cálidas”). 

Finalmente, los datos se entierran en archivos distantes (congelación).

La creación y almacenamiento de datos está cambiando gradualmente la dinámica, la naturaleza, la geografía. 

La demanda de informática de punta está creciendo. 

Las empresas se están preparando para un aumento de 1,5 veces en los volúmenes de almacenamiento por año, una parte significativa de los datos digitales se asienta en la periferia.

“Nadie lo sabe con certeza”

El valor de los datos siempre es relativo. El tiempo dirá. 

O así resultarán las circunstancias. 

No se sabe de antemano qué cámara de circuito cerrado de televisión registrará el momento del crimen. 

Los resultados electorales anormales se verifican mediante métodos estadísticos después de una pelea. 

Es difícil predecir cuándo un libro o una película se convertirá en un éxito de ventas.

Aquí hay dos historias sobre Paul McCartney.

La melodía Ayer le llegó en un sueño. 

La canción permaneció inconclusa durante meses, con el título tentativo “Huevos revueltos” y la misma letra aleatoria “Huevos revueltos, Oh, mi bebé, cómo amo tus piernas …”. 

El productor de los Beatles, George Martin, logró grabar y lanzar una versión instrumental de la obra en el mercado estadounidense (no llamó la atención). 

La versión final del texto llegó más tarde, y el resto de los Beatles no participaron en la grabación, solo McCartney y el cuarteto de cuerdas. 

Según las encuestas y los resultados de ventas, Yesterday es hoy considerada la mejor canción del siglo XX.

El último álbum de los Beatles, Abbey Road, concluye con Her Majesty, un breve solo de McCartney. 

Ella no debería haber estado allí

Más bien, podría ingresar al popurrí de la segunda cara del disco, entre Mean Mr Mustard y Polythene Pam. 

Pero ella no entró. 

Mientras mezclaba las pistas, Paul decidió que no le gustaba la canción y le dijo al ingeniero de sonido que la enviara a la basura. 

Obedientemente cortó un trozo de la cinta maestra con la grabación. 

Pero le enseñaron a no tirar nada. 

“Hazyayska ditina”, recogió un fragmento del suelo después de que McCartney salió del estudio y lo pegó al final del carrete. 

Al encontrar a Her Majesty en el final del álbum a la mañana siguiente, Paul lo dio por sentado. 

Y al resto no le importó, el equipo vivió sus últimos días.

Almacenamos todo y luego lo resolveremos

Por lo tanto, almacenan activos digitales durante mucho tiempo, sin conocer la importancia futura de los datos. 

Cada empresa tiene su propio rango de valores y su propia estrategia para usar clases de almacenamiento: en RAM, en SSD o en grandes discos mecánicos. 

IT CONNECT

Información para quienes toman decisiones de negocios

Es agradable soñar con mover datos automáticamente entre medios según los requisitos de rendimiento. 

Pero, para tener algo entre lo que moverse, primero debe tener un entorno de almacenamiento híbrido. 

Y tener herramientas de automatización en forma de servicios adquiridos.

La opción más fácil y natural es el almacenamiento fuera de línea en discos SAS SSD / HDD. 

Permite que los datos de todos los niveles de valor estén disponibles en un solo campo, sin barreras para los usuarios, sin el costo adicional de alojar los datos. 

El almacenamiento ajustado requiere un equilibrio: entre datos fríos y calientes, el costo de implementar capas de almacenamiento y rendimiento, y entre el costo de un servicio y el efecto de su implementación.

Disponibilidad de datos

El almacenamiento no se trata solo de capacidad y rendimiento, sino principalmente de disponibilidad. 

Se describe como un porcentaje del tiempo total que el sistema de almacenamiento normalmente atiende solicitudes. 

Los sistemas de almacenamiento de alta disponibilidad (HA) suelen tener métricas que van del 99,9% al 99,999% (cinco nueves representan aproximadamente cinco minutos de tiempo de inactividad aceptable por año).

La característica clave del almacenamiento de alta disponibilidad es la redundancia de componentes, la ausencia de un solo punto de falla (Single Points Of Failure, SPOF). 

En una matriz de este tipo hay al menos dos controladores, la falla de cualquiera de ellos no da lugar a tiempo de inactividad. 

Fuentes de alimentación duplicadas, módulos de refrigeración, rutas a discos.

En un ejemplo vivo

Muchos ofrecen sistemas de almacenamiento híbridos. 

Por regla general, se trata de matrices de controlador dual con interfaces de red de la especificación del proveedor, en discos con el firmware del proveedor y ampliables mediante estantes de disco del mismo proveedor. 

Por un lado, el fabricante reduce los riesgos del comprador con una estricta política de elección de configuración y accionamientos. 

Por otro lado, cualquier restricción sirve como excusa para la esclavitud de precios a la que se ve empujado.

QSAN, un desarrollador de almacenamiento taiwanés, muestra un ejemplo de un enfoque abierto (modular). 

Los controladores del sistema QSAN atienden solicitudes en paralelo (activo-activo). 

Esta arquitectura duplica el ancho de banda disponible del host y la tasa de aciertos de la caché, lo que garantiza que no se desperdicien recursos en el sistema. 

La placa base de cada controlador puede equiparse con tarjetas de expansión (Ethernet de 10-25 Gb o FC de 16-32 Gb) y agregar RAM. 

El almacenamiento en caché SSD opcional y las opciones de nivel automático le permiten usar capas SSD y HDD juntas.

Físicamente, una solución híbrida podría verse así.

QSAN XS5226  es una plataforma básica para 26 discos de 2,5 “.

Motivadores de almacenamiento híbrido

Se admiten SSD y HDD SAS estándar. Debido al crecimiento de los volúmenes de almacenamiento, es mejor instalar SSD de la cantidad y capacidad requeridas en el sistema principal, y mover HDD mecánicos al estante de expansión QSAN XD5324 , que está conectado a un cabezal SAS de 12 Gbit:

Si esto no es suficiente, es conveniente conectar un estante 4U de alta capacidad Western Digital Ultrastar Data60 con 60 discos, y luego su  hermana mayor de 102 discos :

Este puede ser un clúster de VMware vSphere productivo:

Los sistemas de almacenamiento QSAN incluyen características tales como aprovisionamiento ligero, niveles automáticos, instantáneas y clonación local y replicación remota para recuperación de desastres, todas accesibles a través de un navegador web. 

Por ejemplo, las instantáneas pueden acelerar la recuperación ante desastres desde el almacenamiento de respaldo en un centro de datos remoto.

Caso de Éxito

La empresa suiza SFC ofrece servicios de informática forense, seguimiento de activos y diligencia debida de empresas. 

Esto requiere una infraestructura que le permita recopilar, almacenar, buscar y recuperar rápidamente grandes cantidades de información. 

Para las investigaciones, se almacenan datos no estructurados como correo electrónico, documentos de Word y muchos otros archivos recibidos de los clientes. 

Los metadatos recopilados de los archivos se almacenan en una base de datos SQL, lo que le permite buscar rápidamente los documentos necesarios para trabajar posteriormente con ellos.

Cuando el negocio principal es procesar y analizar grandes cantidades de datos de clientes, y las aplicaciones, especialmente las bases de datos SQL, necesitan un almacenamiento confiable y de alta velocidad para funcionar de manera eficiente, el almacenamiento híbrido es la opción obvia. 

SFC eligió un QSAN XS5226 con una capacidad de aproximadamente 50TB en un SSD, con una expansión Western Digital Ultrastar Data60 JBOD por petabyte. 

La capacidad total de almacenamiento se puede aumentar varias veces conectando estantes adicionales.

Finalmente

La “característica” de los sistemas de almacenamiento eminentes es la rica funcionalidad y el soporte de servicio declarado. 

En un país pobre con activos digitales modestos para los estándares mundiales, nihilismo legal y mala logística, debes confiar en ti mismo. 

Esto significa elegir equipos para resolver problemas que le permitan alcanzar objetivos privados con medios asequibles. 

Cuantas menos restricciones, generalmente más barata es la solución.

Almacenar datos (como disparar ollas) no es un oficio de Dios. 

Nunca sabes lo que puedes hacer hasta que lo intentas.

 

Por Marcelo Lozano – General Publisher IT Connect Latam

 

 

 

 

 

Almacenamiento híbrido, Almacenamiento híbrido, Almacenamiento híbrido, Almacenamiento híbrido, Almacenamiento híbrido, Almacenamiento híbrido,  Almacenamiento híbrido, Almacenamiento híbrido,

Almacenamiento híbrido, Almacenamiento híbrido,

Almacenamiento híbrido, Almacenamiento híbrido,

92 / 100