Cloudera

Big Data

Cloudera y Apache Hadoop, el software open-source de computación escalable y distribuida

¿Por qué elegir Cloudera ?

Cloudera es conocido en el mundo por su habilidad para integrar las características de Big Data disponibles en el ecosistema Apache Hadoop, poniéndolas a disposición de las empresas para almacenar, gestionar y analizar gran cantidad de datos en forma rápida y fiable, utilizando hardware de fabricación estándar. Apache Hadoop y Cloudera nos ofrecen una plataforma para el almacenamiento y procesamiento distribuido en clusters de servidores. Hadoop provee un sistema de archivos distribuido con alto rendimiento en el acceso a datos, un framework para gestionar procesos, gestión de recursos en cluster y características para el procesamiento en paralelo de grandes conjuntos de datos. Por otro lado, el ecosistema Big Data contiene funcionalidades para gestionar y monitorizar clusters Hadoop, serialización de datos, bases de datos escalables, infraestructuras de data warehouse, machine learning, explotación de datos y frameworks de programación de flujos de datos. Estas tecnologías han cambiado la forma en la que son dirigidos los negocios hoy en día. Actualmente, más de la mitad del Fortune 50 ha adoptado Hadoop.


Servicios

Tenemos experiencia aplicando soluciones Big Data en nuestros clientes utilizando Apache Hadoop ecosystem y Cloudera. Desde 2012 hemos trabajado en Big Data brindando soluciones basadas en Hadoop, MongoDB, Phoenix, HBase, Ambari, etc.. Actualmente somos considerados expertos en este negocio. Tenemos la capacidad de diseñar cuadros de mando a medida, reportes gerenciales y herramientas destinadas a la predicción. Con Cloudera, Hadoop y ZYLK, las empresas pueden fácilmente acceder a las tecnologías Big Data para obtener información útil que permita mejorar su competitividad. Hemos implantado soluciones Big Data en sectores como telecomunicacíones, energía y administración pública, con excelentes resultados para nuestros clientes.

Cuéntanos tu proyecto

CONTACTA CON NOSOTROS

Blog - Últimas entradas

Zylk
May 9, 2021

Montando un laboratorio con apache Ozone

Llevo bastante tiempo sin escribir nada técnico relacionado con el mundo del la analítica de datos y el bigdata. En zylk hemos seguido trabajando con el ecosistema de apache hadoop (hive, yarn, hdfs etc..) y como siempre también hemos estado siguiendo algunos proyectos de la fundación apache que nos parecen interesante. Entre ellos hay tres que nos gustan especialmente y son: Apache Ozone Apache

Leer más
Zylk
May 3, 2020

Creando mapas personalizados para el análisis de datos

Una de las cosas que se suelen hacer cuando se está haciendo un análisis avanzado de datos es representar los mismos, tanto desde el punto de vista de la fase exploratoria como desde el punto de vista del uso de los resultados de los modelos aplicados. Dentro de este contexto hay una librería/proyteco que es muy interesante y se se está usando bastante. Este proyecto es plotly, es un proyecto bastante más interesante que una mera librería...

Leer más
Zylk
Mar 22, 2020

Procesando ficheros con columnas de tamaño fijo con NiFi

Supongamos que tenemos un conjunto de ficheros que se han generado con un programa que exporta los datos de las columnas con un tamaño fijo. Por ejemplo un programa que exporta los siguientes cuatro campos FechaAlta (YYYYMMDD) 8 posiciones Estado Civil (0|1|2) 1 posición Edad (0-99) 2 posiciones Genero (0|1|2) 1 posición Cada registro será de la siguiente forma 202001030561 -> que representa un...

Leer más

Blog - Más visitados

Zylk
Dec 16, 2017

See you in Alfresco Devcon 2018

Last week, it was published the Alfresco Devcon 2018 conference program, that will celebrate in Lisbon next January. Many Alfresco experts of the community, customers, partners, and employees will participate on this fantastic event, around Alfresco related technologies. The program looks really interesting and trendy, with topics such as production-ready Docker stacks, Alfresco deployments using Kubernetes, AWS use cases, SDK 3.0 setups, Alfresco Development Framework (ADF)...

Leer más
Zylk
Dec 14, 2017

Simple Kibana dashboard for monitoring Alfresco Logs

Some days ago I wrote a post about how to set up a basic Kibana dashboard in Alfresco Enterprise with JMX metrics, from a logstash JMX input. Today I'm gonna add some simple configuration for creating a dashboard for Alfresco logs. The architecture for ELK is the same of the previous post, with logstash running in your Alfresco instance and a dedicated Elastic Search and...

Leer más
Zylk
Dec 26, 2017

Kibana dashboard for monitoring Alfresco Community via OOTB Support Tools

Some weeks ago I wrote a post about how to set up a basic Kibana dashboard representing System Performance and Active Sessions in Alfresco Enterprise via JMX metrics from a logstash JMX input. As you probably know, no such Alfresco JMX objects are available in Alfresco Community, such as active sessions (only the java and catalina objects are available). Anyway, it is...

Leer más