Open IT Experts for Enterprise

Zylk empresa de desarrollo de ecommerce

hadoop ecosystem

empresas 2

Innovando junto al Consorcio de Aguas Bilbao Bizkaia

Reto tecnológico de la mano de Bizkaia Open Future Como sabéis, durante los últimos meses hemos estado investigando junto al Consorcio de Aguas Bilbao Bizkaia (CABB) en la innovación dentro del área de comunicación con dispositivos industriales a través de tecnologías libres. Esta colaboración se lanzó a través del reto propuesto por BOF (Bizkaia Open …

Innovando junto al Consorcio de Aguas Bilbao Bizkaia Leer más »

Apache Spark-Zeppelin

Creando mapas personalizados para el análisis de datos

Como crear mapas personalizados usando zeppelin/spark y plotly Una de las cosas que se suelen hacer cuando se está haciendo un análisis avanzado de datos es representar los mismos, tanto desde el punto de vista de la fase exploratoria como desde el punto de vista del uso de los resultados de los modelos aplicados. Dentro …

Creando mapas personalizados para el análisis de datos Leer más »

apachenifi

Procesando ficheros con columnas de tamaño fijo con NiFi

Como procesar de manera óptima los ficheros con columnas de tamaño fijo usando expresiones Grok en NiFi Supongamos que tenemos un conjunto de ficheros que se han generado con un programa que exporta los datos de las columnas con un tamaño fijo. Por ejemplo un programa que exporta los siguientes cuatro campos FechaAlta (YYYYMMDD) 8 …

Procesando ficheros con columnas de tamaño fijo con NiFi Leer más »

workfloow

Procesando logs con Nifi Grok y HIVE

Usando expresiones Grok para el mapeo y Hive para su explotación posterior En esta ocasión vamos a hacer una prueba de cómo se pueden procesar de manera sencilla, para su posterior explotación con HIVE, los logs de un servidor apache usando  Expresiones Grok  Records de Nifi (Avro)  Ficheros ORC El punto de partida es un …

Procesando logs con Nifi Grok y HIVE Leer más »

EDI BErlin

ZYLK Industry has been selected as one of the brightest “Big Data” startups in Europe

ZYLK Industry has been selected to take part in the European Data Incubator (EDI), a 3-year project that offers around 100 startups the chance to solve data challenges set by major European corporates like Volkswagen Navarra, RACC motoring club and the multinational Sonae. What is EDI? EDI is an incubation programme run by 20 partners …

ZYLK Industry has been selected as one of the brightest “Big Data” startups in Europe Leer más »

EDI_BErlin

ZYLK Industry ha sido seleccionada como una de las startups «Big Data» más brillantes de Europa

ZYLK Industry ha sido seleccionada para participar en European Data Incubator (EDI), un proyecto de 3 años que ofrece a alrededor de 100 startups la oportunidad de resolver los desafíos de datos establecidos por las principales empresas europeas como Volkswagen Navarra, RACC Motoring Club y la multinacional Sonae. ¿Qué es EDI? EDI es un programa …

ZYLK Industry ha sido seleccionada como una de las startups «Big Data» más brillantes de Europa Leer más »

Arquitectura de Big Data para la ingesta y explotación del dato basada en Hortonworks

Flujo del dato en una arquitectura de microservicios La arquitectura descrita en este artículo cubre las necesidades de un caso de uso de Big Data caracterizado por la ingesta de datos tanto en procesos en lotes (Batch) como en tiempo real (Streaming), orientado a la transformación y el enriquecimiento de los datos, y permitiendo su …

Arquitectura de Big Data para la ingesta y explotación del dato basada en Hortonworks Leer más »

Alfresco azul

Using Zeppelin for Alfresco Data Analysis

Whole Lotta Apache Apache Zeppelin is an open web-based notebok that enables interactive data analytics, from data ingestion, data exploration, reporting and visualizations, until sharing or collaboration features. Interactive browser-based notebooks enable to be more productive by developing, organizing, executing, and sharing data code and visualizing results without referring to the command line. It supports …

Using Zeppelin for Alfresco Data Analysis Leer más »

Nutch Overview

Cómo configurar Nutch 1.13 para que use SolrCloud 6.6.0

Tips de configuración He estado haciendo este fin de semana unas pruebas de concepto para poder usar solrCloud, en su última versión, conjuntamente con el crawler nutch, también en su última versión. He encontrado muchos documentos explicando cómo configurar el sistema con solr normal pero no para usarlos con solrCloud. Voy a describir, someramente, un …

Cómo configurar Nutch 1.13 para que use SolrCloud 6.6.0 Leer más »

Basque Industry 4.0

La primera edición de BIND 4.0 concluye con un Demo Day

Empresas industriales, inversores profesionales y medios de comunicación podrán contactar con las startups participantes La primera edición de BIND 4.0 concluye el próximo 5 de mayo con un demo day en el que tanto empresas industriales como inversores y medios de comunicación podrán contactar con las 11 startups participantes. Durante esta jornada las startups participantes …

La primera edición de BIND 4.0 concluye con un Demo Day Leer más »

Starting services via Ambari REST API

How to start, stop and check services via curl command Keeping on curl based commands from Ambari REST API, it is also possible start and stop services of your Big Data cluster, and not only to collect metrics from Ambari. For example,  ambari-service.sh [start|stop|check] a given service: cesar@lemmy ~/local/ambari $ ./ambari-service.sh Usage: ambari-service.sh [ZOOKEEPER|HDFS|YARN|MAPREDUCE2|HBASE|HIVE|SPARK|KAFKA|FLINK|ZK-NIFI|ZEPPELIN] [start|stop|check] Available services: "AMBARI_METRICS" …

Starting services via Ambari REST API Leer más »

Getting Ambari metrics via curl and Ambari REST API

Monitoring an Ambari cluster via curl command During last days, I started to play with an Ambari cluster, based on the Hortonworks distribution.  Ambari provides an agile interface for starting/stopping services in the cluster, modify configurations, and monitoring the different hosts and services of the cluster, providing alerts and metrics. Besides, Ambari provides a REST API for consuming …

Getting Ambari metrics via curl and Ambari REST API Leer más »