Certificación CDMP

¿Qué es CDMP?

CDMP (Certified Data Management Professional) es la certificación internacional otorgada por DAMA (The Data Management International Association ) para aquellos profesionales que trabajan en la gestión de los datos.

¿A quienes aplica esta certificación?

A todos los profesionales que trabajen con datos:

  • Administradores de Base de Datos
  • Arquitectos de software e infraestructura
  • Desarrolladores de Software
  • Profesionales de Business Intelligence y Data Warehousing
  • Profesionales de Data Governance
  • Administradores de metadata
  • Profesionales de calidad de datos
  • Gestores de operación y seguridad
  • Profesionales en integración e interoperabilidad de datos

¿A quien se lo otorga este tipo de certificación?

La certificación es otorgada a quienes cumplan con una combinación de diferentes criterios incluyendo educación, experiencia y, que rindan correctamente los exámenes de evaluación de conocimiento.

¿Quién otorga la certificación?

El responsable en otorgar la certificación y generar los exámenes es el ICCP (Institute for Certification of Computing Professionals) que es una organización sin fines de lucro encargada de realizar diferentes certificaciones.

¿Cómo se certifica?

Hay que rendir 3 exámenes:

  1. Infomation System Core
  2. Data Management Core
  3. Un examen de alguna de las especialidades:
  • Data Warehousing
  • Business Intelligence and Analytics
  • Data & Information Quality
  • Data Development
  • Data Integration & Interoperability
  • Data Governance and Stewardship
  • Data Operations (DBA)
  • Zachman Enterprise Architecture Framework2
  • Integrated IT Project Management

IMPORTANTE

Si el examen de la especialidad que eliges es Data Warehousing, además de obtener la certificación de CDMP, puedes acceder también a la certificación CBIP (Certified Business Intelligence Professional) otorgada en conjunto el ICCP en conjunto con el TDWI.

 

facebooktwitter

Cascada Vs. Prototipo

Más allá de que se trata de una infografía realizada por una empresa de vende un software para ETL, nos pareció muy buena y que vale la pena compartir la comparación que hacen entre la realización de un proyecto de BI con ciclo de vida en cascada vs. un ciclo de vida más prototipado.

 

EMA-Wherescape_DataWarehouseAutomation-2015-Infographic

 

Fuente: WhereScape

facebooktwitter

¿Qué es Data Management?

Durante los últimos años hemos visto como los volúmenes de datos han sido incrementados en las organizaciones. Hoy en día los datos en una organización van más allá de los que generan sus sistemas internos: logs de páginas web, coordenadas de posicionamiento de los clientes empleados o consumidores, sus hábitos de compras, opiniones en twitter o comentarios en facebook son algunos de los datos externos que las organizaciones comienzan a  tener en cuenta para la tomar decisiones.  Los datos e información tienen un rol fundamental en las organizaciones y por tal motivo deben ser “cuidados” y administrados efectivamente, pasando a ser uno de los activos más importantes de la empresa. Y es aquí cuando la disciplina de gestión de datos (Data Management) entra en juego.

Data Management (DM) es una disciplina y profesión relativamente nueva que también puede ser vista dentro de las organizaciones como  un proceso de negocios de alto nivel. Los procesos de DM consisten en:

– Planificación y ejecución de

· Políticas, prácticas y proyectos que

· Adquieren, controlan, protegen, entregan y refinan el valor de

· Los activos de datos e información

La misión de esta función es dar respuesta a las necesidades de información de todos los sectores de la empresa en términos de disponibilidad, seguridad y calidad de información.

Los objetivos estratégicos de Data Management son:

· Entender las necesidades de información de la empresa.

· Capturar, almacenar, proteger y asegurar la integridad los activos de información.

· Continuamente mejorar la calidad de los datos e información incluyendo:

· Exactitud de los datos.

· Integridad de los datos

· Integración de la información

· El tiempo de captura y presentación de los datos

· La definición de los datos.

· Asegurar la confidencialidad

· Maximizar el valor de los activos de datos.

DAMA International (Data Management Association International) define en su libro DMBOK (Data Management Body of Knowledge) 10 funciones (Figura 1) dentro de Data Management las cuales garantizan el manejo y cuidado de los datos coorporativos.

DM10Funciones

Figura 1 — Funciones de Data Management (Copyright by DAMA International)

De apoco esta disciplina va ganando terreno en las grandes organizaciones, donde ya se puede escuchar nuevos roles como el CDO (del inglés Chief Data Officer) o Data Stewards entre otros.

Fuente: DAMA Argentina

facebooktwitter

Trayectos más realizados en bicicleta

Les dejamos un gráfico donde se pueden ver los trayectos más recorridos durante el año 2014 con el sistema de bicicletas del Gobierno de la Ciudad – Argentina. Para el mismo se utilizaron datos abiertos. La herramienta utilizada en esta ocasión fue Microstrategy Visual Analytics y los datos se graficaron con un diagrama de Sankey donde las líneas más anchas representan mayor cantidad de recorridos realizados.

Trayectos más recorridos en Bici

facebooktwitter

¿Que es el lenguaje R?

R

R es un entorno y lenguaje de programación de alto nivel, especialmente diseñado para el análisis de datos. Actualmente se lo utiliza en distintos ámbitos, desde compañías hasta en centros de investigación básica y aplicada.

Se trata de un lenguaje poderoso y flexible, utilizado para el análisis estadístico, minería y visualización de datos con distintos fines.

De este modo, algunas de las razones por las que R está tan difundido son:

  • Es libre y gratuito.
  • Existe un gran número de desarrolladores y usuarios, y por tal motivo es fácil encontrar foros muy activos, tutoriales, videos, etc.
  • Cuenta con más de 5000 paquetes especializados en una gran variedad de tópicos relacionados con minería de datos, visualización, análisis estadístico,  lectura y limpieza de datos, conexión a bases de datos, scraping (procesar información de internet en forma automática), geolocalización, y más.
  • Existen entornos de desarrollo especialmente diseñados para R.
  •  Es posible, y relativamente directo, paralelizar código de R y correrlo en un cluster. También es posible usar algorítmos como Map-Reduce para procesar grandes volúmenes de datos.

El uso que puede a darse a R es muy variado, aunque su uso principal es el análisis y visualización de datos. Entre algunas de sus aplicaciones  encontramos las siguientes:

  • Minería de datos y modelos predictivos. Por ejemplo para clasificar clientes de acuerdo a sus hábitos de consumo, agrupar galaxias y estrellas según sus características, o predecir las ganancias de tiendas.
  • Visualización de datos, procesamiento (y minería) de imágenes, y manejo de mapas en tiempo real.
  • Análisis estadístico clásico. Por ejemplo para cuantificar la eficacia de un medicamento.
  • Scraping y posterior procesado de información de internet.
  • Automatización de procesos, lectura y transformación de datos, conexión a una amplia variedad de bases de datos.

En definitiva, R es una herramienta muy potente y versátil que se presta para usos variados dentro de lo que es el procesamiento y la visualización de datos, cubriendo todo el espectro de manejo de datos, desde su extracción y limpieza, pasando por su análisis y llegando a las visualizaciones más profesionales.

facebooktwitter