Cloudera hace posible un rendimiento sin igual para BI y analíticas en la nube

Un benchmark muestra que Apache Impala ofrece mejores capacidades nativas en la nube y mejor rendimiento por rango de precio en comparación con Amazon RedShift

Publicado el 10 Oct 2016

Cloudera, proveedor de la plataforma de análisis y gestión de datos construida sobre Apache Hadoop más rápida, sencilla y segura y de las últimas tecnologías open source, ha dado a conocer los resultados de un benchmark que muestran que la moderna solución de base de datos analítica de Cloudera, impulsada por Apache Impala (en incubadora), no solo ofrece capacidades sin precedentes para las cargas de trabajo nativas en la nube, sino que además lo hace con el mejor coste operativo en comparación con otras alternativas.

Impala ofrece una escalabilidad muy elástica, mayor flexibilidad y la capacidad de consulta de Amazon S3, no disponible en sistemas con arquitectura tradicional, como Redshift. Gracias a su moderno diseño, Impala desacopla los datos y ofrece las mismas analíticas SQL de alto rendimiento independientemente de trabajar de forma nativa en la nube con datos de S3 o a través de distintas opciones de almacenamiento en instalaciones o en la nube. Además, Impala hace posible todas estas capacidades siendo hasta un 275% más eficiente y ofreciendo un rendimiento hasta 10 veces mejor en comparación con la base de datos analítica de Amazon, Redshift, lo que traduce en más valor dentro de una misma plataforma.

Tomando como base algunas pruebas del benchmark estándar de la industria TPC-DS,Cloudera comparó Impala en la nube (tanto de forma nativa sobre S3 como con almacenamientos locales EBS) con Amazon Redshift (capaz solo de funcionar sobre su propio almacenamiento en instancias AWS dedicados).

  • Impala es más de un 200% menos costoso y 10 veces más rápido en S3 en comparación con un funcionamiento normal de Redshift.
  • Impala es un 8% menos costoso y un 90% más rápido en S3 en comparación con Redshift pre-configurado para determinadas consultas de reporte.
  • Impala es entre un 28 y un 275% menos costoso y entre un 42 y un 400% más rápido en EBS en comparación con Redshift a nivel normal o pre-configurado.

“Cada vez más, nuestros clientes quieren llevar la inteligencia de negocios y las cargas de trabajo analíticas a entornos en la nube, para aprovechar la eficiencia y rentabilidad de tener una escala elástica y mayor flexibilidad”, explica Charles Zedlewski, vicepresidente de Producto en Cloudera. “Impala lleva a la nube todas las ventajas que aporta a las bases de datos analíticas sobre instalaciones, ya que gracias a su moderna arquitectura asegura una agilidad sin precedentes independientemente de dónde se encuentren los datos.

A medida que las compañías buscan obtener datos de nuevas fuentes y tienen que ajustar sus modelos a necesidades cambiantes o adaptarse a distintos casos de uso, necesitan una base de datos analítica que haya sido construida en función de sus necesidades y sin perjuicio para la rentabilidad de su negocio. El diseño rígido y la ausencia de una escala elástica en los sistemas monolíticos con arquitectura tradicional, sea sobre instalaciones o sobre la nube, implica que simplemente no son capaces de estar al día de las siempre cambiantes necesidades del negocio. La base de datos analítica de Cloudera, impulsada por Impala y por el motor interactivo SQL, se ha diseñado para llevar las analíticas SQL de alto rendimiento al big data, con una escalabilidad elástica tanto para la nube como para las instalaciones convencionales, cuando sea necesario.

Impala trabaja de forma nativa con datos ubicados en diversos motores de almacenamiento, incluyendo el de Amazon S3, lo que elimina la necesidad de mover o cargar los datos en los clústeres de Impala. Especialmente en el caso de las implementaciones en la nube, esto se traduce en un ahorro y una mayor eficiencia, ya que los clústeres podrán utilizarse en función de las necesidades de la inteligencia de negocios y los tiempos de carga. Con un almacenamiento rentable desde S3, habrá un mayor número de datos disponibles rápidamente para su análisis.

Continuar ampliando el rendimiento, concurrencia y escalabilidad de Impala es clave para Cloudera. La compañía ha ampliado la diferencia entre la arquitectura de la base de datos analítica de Impala y la de otras alternativas, tanto para cargas de trabajo de un usuario como de varios. La última versión ofrece un rendimiento 12 veces mejor sobre las cargas de trabajo seguras, en comparación con las dos versiones previas. Cloudera tiene como objetivo seguir aumentando el valor de Impala y sus ventajas en materia de precio, añadiendo soporte en el futuro para otros almacenes de objetos en la nube pública.

¿Qué te ha parecido este artículo?

La tua opinione è importante per noi!

C
Redacción Computing

Artículos relacionados