Cubos OLAP con hbase, pentaho, saiku y phoenix

Gustavo Fernández

Hace unos meses que el proyecto phoenix ha salido de la incubadora de apache. Por
esta razón he decidido hacer unas pruebas de concepto para ver como se
podría integrar los cubos R-OLAP basados en mondrian y
consumidos desde la interfaz de saiku como componente de
servidor de pentaho. ¿por qué puede ser interesante esto?.

Mondrian es un proyecto que traduce queries MDX a SQL
Phoenix es un proyecto que traduce queries SQL a queries de HBase

Por tanto integrando phoenix en pentaho podríamos consumir los datos
almacenados en un tablón tipo Hbase.

Siguiendo este artículo
y configurando superando algunos temas menores es bastante
sencillo crear cubos OLAP desde pentaho que realmenta utilicen como
backend datos almacenados en HBase. Los temas que hay que tener en
cuenta son

Los jars a añadir al directorio lib del bi-server
La configuración del datasource desde pentaho (generic database)
El detalle de los nombres de las tablas en mayusculas al crear las
tablas desde la linea de comandos provista por phoenix

A continuación muestro unas capturas de las pruebas realizadas

y como se vería el cubo

En realidad en este caso, dado
que mi laboratioro de hadoop/hbase es un pequeño juguete el
sistema es un poco lento y el tiempo de respuesta del cubo es un poco
superior al de mysql. En este caso lo único que quería probar era el
funcionamiento de phoneix y ver que tipo de coprocesadores y de
problemas podía tener su uso.

Por otro lado, también he probado a enganchar la herramienta kettle
(ETL) usando phoenix y el sistema de reporting…la verdad es que
todos ellos funciona de manera transparente usando el driver JDBC de
phoenix. Ahora solo queda hacer unas pruebas más orientadas a
rendimiento para ver si realmente es una solución que nos permita
escalar a cientos de millones los registros explotados por los cubos
OLAP …

Si te ha parecido interesante comparte este post en RRS

Leer más sobre temas relacionados

tech

El Empoderamiento de la Mujer en la Era Digital

La presente década está siendo protagonizada por el proceso de digitalización y la aparición de tecnologías disruptivas que prometen poner patas arriba el mundo tal

6 de marzo de 2024 No hay comentarios

liferay

Liferay y ChatGPT: La Fusión de la Experiencia Digital y la Inteligencia Artificial

En un mundo donde la comunicación digital desempeña un papel fundamental en la experiencia del cliente, la integración de tecnologías avanzadas como el procesamiento del

1 de marzo de 2024 No hay comentarios

G-SMART 5.0, respaldado por el programa Hazitek de SPRI y liderado por el Grupo Gestamp busca impulsar la Smart Factory en la industria vasca

innovación / i+d

GSMART 5.0 Avanzando hacia la Smart Factory. Innovación Tecnológica en el sector Industrial del País Vasco

En la actualidad industrial, el desarrollo tecnológico ha creado un entorno marcado por la competencia entre regiones tecnológicamente avanzadas y una constante incertidumbre en la

30 de diciembre de 2023 No hay comentarios

Indatia trabaja el paradigma smart factory con IA y el tratamiento de los datos

cloudera

INDATIA. Nuevos desarrollos para la gestión de los datos y la Inteligencia Artificial

El futuro de la industria actual, pasa por impulsar lo que se denomina Industria 4.0, donde los datos producidos por la fabricación se convierten en

29 de diciembre de 2023 No hay comentarios

plataforma digital de control de calidad para la fabricación con cero defectos mediante inteligencia artificial

innovación / i+d

KAIA: Plataforma digital de control de calidad para la fabricación con cero defectos mediante inteligencia artificial

El proyecto KAIA es una iniciativa surgida en 2021 y llevada a cabo gracias al programa Hazitek de SPRI y los Fondos FEDER Europeos, en

28 de diciembre de 2023 No hay comentarios

Airsafe es un proyecto de Hazitek para monitorizar la calidad del aire en tiempo real

cloudera

AIRSAFE: control y monitorización real-time de la calidad del aire

A lo largo de los últimos años ha aumentado la concienciación de la calidad del aire en espacios públicos cerrados como hospitales, colegios o residencias,

26 de diciembre de 2023 No hay comentarios

Deja un comentario Cancelar respuesta

Busca por categorías