Pero no hablemos del futuro, sino de la última frontera, el ecosistema que se está generando entorno a la herramienta R. ¿Pero que hace aquí R?, ¿no es un entorno de análisis extraño al mundo digital? Además, ni siquiera pretende ser una herramienta orientada al análisis del comportamiento humano online. Pese a todo lo cierto es que está saltando fuera del ámbito académico y científico. Y es que R, está reconociéndose como una alternativa que hace poco no existía en el abanico de posibilidades de un analista web.
¿Por qué este interés entre la comunidad de analistas web?
Hay varias razones por las que los analistas web ven R como una alternativa, y aunque éstas no sean las únicas, sí son las más destacables:
- A diferencia de otras herramientas, su coste es muy bajo. Aunque es gratuita es cierto que también hay coste de personal, y no todas las empresas tienen acceso a soluciones con un coste superior a cero.
- Detrás de R hay una comunidad de desarrolladores y científicos de datos muy fuerte con la que poder compartir conocimientos, experiencias y problemas.
- Permite conectarse a muchas fuentes de datos, facilitando la tan ansiada labor de integración con datos propios (analítica web, analítica social o derivados de herramientas SEO) y externos (datos de negocio, datos de clientes, …).
- Permite incorporar nuestros archivos habituales de trabajo (txt, csv).
- Facilita el acceso a otras fuentes acudiendo a apis de terceros (Ej. google analytics, adwords, omniture, Facebook, Twitter o incluso Search Console).
- Puede acceder a bases de datos mediante lenguaje SQL e incorporar datos de CRMs y fuentes de datos de negocio.
- Permite incorporar fuentes de datos alojados en páginas web públicas lo que la convierte en una fuente muy potente para integrar datos de contexto para el análisis.
- Ayuda, y mucho, a la automatización de informes para otros departamentos generando directamente datos a otras herramientas (Excel, Tableau, Qlik, Power BI) pero también archivos html, pdf o slides con tablas y gráficas interactivas. Existen soluciones como Shiny que en el entorno servidor permiten compartir en un entorno web estos informes automatizados generados con R.
- Su principal función es el análisis de datos, y este es su fuerte:
- Permite la manipulación de tablas de datos descriptivos básicos y estadística descriptiva.
- Permite análisis más avanzados que nos dan a conocer si los ratios de conversión de un determinado segmento están correlacionados con otras variables, y qué combinaciones de productos se compran conjuntamente más a menudo.
- Permite, mediante el análisis de series temporales, y estimar el impacto de determinados esfuerzos de marketing en nuestro tráfico o nuestras conversiones.
- Permite realizar el contraste de hipótesis CRO sin la necesidad de otras herramientas diagnosticando si la conversión es estadísticamente significativa entre dos variaciones (contraste de medias o proporciones) o con múltiples variaciones (análisis ANOVA, MANOVA, ARIMA).
Pero si tiene tantas ventajas, ¿por qué no lo usamos más a menudo?
A pesar de su interés creciente en su implantación como herramienta para el analista web, hay otras soluciones que son más eficaces en determinadas tareas:
- R (incluso RStudio) es poco usable. Estamos hablando de un entorno de programación. No hay ventanas bonitas. Se trabaja a base de comandos. Si quieres algo lo tienes que programar tú mismo.
- R es duro, muy duro. No está orientado al trabajo con datos sino al trabajo con información. En R no se pueden hacer fórmulas como Excel. R, es un lenguaje de programación orientado a objetos y no todo el mundo está dispuesto a cambiar el chip.
- R no es para todos, necesita de ciertos conocimientos técnicos. Puedes trabajar con R sin ser un programador o un experto en estadística. Las habilidades no tienen por qué ser demasiado avanzadas para poder sacar partido a R, pero para sacarle el máximo partido se necesita una base de conocimientos técnicos (bases de datos, programación, …) y sobre todo estadística.
- R necesita un flujo de trabajo claro. Cuando necesitas tiempos muy cortos de respuesta, a no ser que tengas unos sólidos y fuertes conocimientos R te puede ralentizar. Si estás en fase de discovery R no te ayudará mucho. Si necesitas crear modificar constantemente dashboards de personalizados, la carga de trabajo que supone, hace que no siempre puedas tener la agilidad que te gustaría.
- R opera bajo licencia del MIT. Esto facilita que este soportada por más de 4.000 paquetes y que su número aumente, pero también es verdad que muchos de los paquetes que necesitamos (Ej.: para conectarnos a Google Analytics) sean producto del esfuerzo personal. No hay garantías de que la actualización de estos paquetes tenga continuidad en el tiempo, y a veces esto es crítico para una empresa.