Borrador automático

R

R es un entorno y lenguaje de programación de alto nivel, especialmente diseñado para el análisis de datos. Actualmente se lo utiliza en distintos ámbitos, desde compañías hasta en centros de investigación básica y aplicada.

Se trata de un lenguaje poderoso y flexible, utilizado para el análisis estadístico, minería y visualización de datos con distintos fines.

De este modo, algunas de las razones por las que R está tan difundido son:

  • Es libre y gratuito.
  • Existe un gran número de desarrolladores y usuarios, y por tal motivo es fácil encontrar foros muy activos, tutoriales, videos, etc.
  • Cuenta con más de 5000 paquetes especializados en una gran variedad de tópicos relacionados con minería de datos, visualización, análisis estadístico,  lectura y limpieza de datos, conexión a bases de datos, scraping (procesar información de internet en forma automática), geolocalización, y más.
  • Existen entornos de desarrollo especialmente diseñados para R.
  •  Es posible, y relativamente directo, paralelizar código de R y correrlo en un cluster. También es posible usar algorítmos como Map-Reduce para procesar grandes volúmenes de datos.

El uso que puede a darse a R es muy variado, aunque su uso principal es el análisis y visualización de datos. Entre algunas de sus aplicaciones  encontramos las siguientes:

  • Minería de datos y modelos predictivos. Por ejemplo para clasificar clientes de acuerdo a sus hábitos de consumo, agrupar galaxias y estrellas según sus características, o predecir las ganancias de tiendas.
  • Visualización de datos, procesamiento (y minería) de imágenes, y manejo de mapas en tiempo real.
  • Análisis estadístico clásico. Por ejemplo para cuantificar la eficacia de un medicamento.
  • Scraping y posterior procesado de información de internet.
  • Automatización de procesos, lectura y transformación de datos, conexión a una amplia variedad de bases de datos.

En definitiva, R es una herramienta muy potente y versátil que se presta para usos variados dentro de lo que es el procesamiento y la visualización de datos, cubriendo todo el espectro de manejo de datos, desde su extracción y limpieza, pasando por su análisis y llegando a las visualizaciones más profesionales.

facebooktwitter

Comments are closed.