
Llevo algún tiempo pensando sobre esta publicación. No estaba segura si sería o no interesante para alguien. Y me he decidido a escribirla. Si llega a alguien que le interese, pues genial, y si no, al menos habré tenido la experiencia del proceso creativo de escribirla.
En diversas publicaciones leo comentarios sobre Data Science (Ciencia de Datos), Chief Data Officer (Director/a de Datos), y muchas otras palabras que van surgiendo. En esta publicación compatí algunos recursos sobre programación de software que pensé que podrían interesarle a alguien.
En esta ocasión quiero compartir algunos recursos sobre aprender las bases del software R. Es un software que personalmente me gusta, porque es un software de código abierto que todo el mundo puede utilizar de forma gratuita.
Lo primero es saber si este tema te puede interesar o no. ¿Para qué sirve esto? Con este software puedes realizar análisis estadísticos y gráficas sobre tablas de datos a los que tengas acceso.
¿Y para qué? Para analizar qué relación existe entre esos datos y, junto a tu conocimiento, por ejemplo, de un sector de clientes, tomar decisiones para tu negocio.
Por ejemplo, puedo ver si en los datos de compra del supermercado se compra más de un determinado producto que de otro, y crear modelos de ecuaciones que me estimen cómo se comportarán esos datos en el futuro. De esta forma, tomo decisiones en base a esas predicciones de futuro. ¿Qué puedo necesitar en ese futuro? Puedo necesitar más camiones de transporte, o menos almacenes, o menos personas contratadas, o negociar precios con nuevos proveedores que me aseguren las cantidades de producto que necesito atender en ese futuro. Estos son solo algunos ejemplos.
Hay otros software que puedes utilizar comprando licencias. Pero a veces estas licencias tienen un precio que no puedes pagar, y otras, no quieres asumir el riesgo de que la empresa deje de tener en funcionamiento ese software y no puedas seguir utilizándolo. ¿Cómo tomarías decisiones si ya no puedes analizar los datos? Por eso a mí me gusta el software libre.
Para empezar a programar con R, lo primero que necesitas saber es instalarlo. Puedes hacerlo desde esta web (en inglés). En este documento (en español) para principiantes te explica cómo empezar. Y en este otro enlace tienes un libro online (en español).
Lo siguiente que necesitas aprender son las bases matemáticas de los análisis estadísticos para saber seleccionar qué funciones aplicar a tus datos y luego, saber cómo interpretar los resultados. Conceptos que necesitas aprender como: valores P, coeficientes de regresión, residuales, etc. También aprender el funcionamiento de funciones estadísticas:
Los datos obtenidos de R podemos visualizarlos por ejemplo en gráficos más bonitos como estos, y así crear nuestros cuadros de mando de decisiones de nuestra organización. Después de analizar los datos, saber mostrarlos y contar su historia será clave para enseñar el conocimiento que nos aportan.

Una publicación que me gusta mucho para estar informada sobre la actualidad en el análisis de datos es Data Science Central. Dentro de esta web hay un área específica dedicada a la parte que más me gusta y es, la analítica y la inteligencia empresarial (Analytics and Business Intelligence, en inglés).
¿Podría combinar los conocimientos que tengo sobre bases de datos, programación y diseño humano? Sí. Lo que no tengo es acceso a los datos. Ese es el negocio de este momento, quien tiene los datos es quien hace el negocio.