Preparación de datos, esa bendita tarea pendiente
Según las publicaciones y noticias que vemos a diario, la ciencia de datos pareciera ser una disciplina que lo abarca todo y a la que todo el mundo, empresarial o no, debe conducirse para no perderse en el olvido o quedarse en paradigmas pasados. Cierto es que esta ciencia no apunta a hacernos a todos científicos, más allá del oficio y del puesto al que nos aboquemos. Más bien, es una ciencia basada en la automatización de los procesos.
Desde esta publicación, queremos ayudarte a resolver esa tarea que todos quieren sacarse de encima rápido.
La realidad de las organizaciones es que se necesitan muchas horas de preparación de datos antes de que puedan ser visualizados y analizados
De allí que en todo rubro (ya que en todos se producen millones de datos constantemente) se necesiten sistemas de análisis y monitoreo de datos, para aliviar el trabajo de las personas. Precisamente, a lo que apuntamos desde Visionaris es a que la tarea de preparación de datos que solía consumir horas de trabajo y recursos especializados sea ahora intuitiva y dinámica, que permita hacer un análisis en profundidad en menos tiempo.
Por eso presentamos Visionaris Data Spa, una aplicación intuitiva para la preparación y limpieza de datos que modifica la forma de descubrir los datos de toda una organización a través del tiempo.
Pero antes, veamos por qué algo tan específico como la preparación de datos puede transformarse en algo tan fundamental. ¿Por qué debe hacerse? ¿Qué problemas resuelve?
La situación de los datos en las organizaciones
La mayoría de las organizaciones se encuentran con la necesidad de analizar sus datos, pero a la hora de hacerlo no cuentan con las personas ni con el tiempo disponible para prepararlos u organizarlos sistemáticamente. Vale decir que si los datos están, pero se encuentran diseminados en diferentes archivos y sistemas, guardados en archivos con nombres disímiles, o están repetidos o con errores en las planillas de Excel que los agrupan, raramente podrán servir para realizar con ellos métricas confiables.
En principio, esto representa una gran frustración a nivel gerencial: saber que los datos están, pero que faltan los recursos para extraer de ellos la información valiosa. Y, en segundo lugar, puede que la organización decida capacitar a parte de su personal en ciencia de datos o contratar a expertos. Son opciones válidas que, sin embargo, no tendrán resultados inmediatos, además de los costos que implican ambas disposiciones.
La necesidad de ahorrar tiempo hace que se deje de lado, que se reemplace esa tarea de preparación por otras más urgentes de resolver. Pero también está la necesidad de aprovechar eso en lo que se basan todas las mediciones (datos preparados y confiables), precisamente para tener el control de un negocio y su sostenimiento y competitividad en el tiempo.
El tiempo dedicado a la preparación de datos en las organizaciones
¿Qué hacer con la preparación de datos? ¿a quién delegarle la meticulosa tarea que más tiempo implica?
Justamente, como vemos en la infografía, se dedica la principal carga horaria a la tarea menos atractiva, que es la preparación y organización de datos. Pero es la tarea que si no se hace bien, el análisis dará resultados que no reflejen la realidad de la organización y llevarán a decisiones contraproducentes.
Entonces ¿qué ofrecemos?
Que el proceso de preparación de datos sea delegable a una aplicación completa de conexión, limpieza y transformación de datos como lo es Visionaris Data Spa.
Cuando desarrollamos esta aplicación, éramos conscientes de que debía aliviar problemas operativos de la carga de datos y, por supuesto, ahorrar tiempo, por lo tanto pensamos en la automatización del proceso. Así, con Data Spa, aseguramos la conexión a los datos de todas las fuentes y sistemas (lo que comúnmente llamamos “de diferentes orígenes”). Pero esta automatización no es una caja negra que absorbe los datos, sino que el usuario puede interactuar y ver todo el proceso, manteniendo la confianza en el tratamiento de los datos.
También nos propusimos que los usuarios de esta aplicación no tuviesen necesidad de aprender código de programación para ordenar sus datos. Por eso generamos una herramienta donde el usuario no sólo pueda acceder a todos los datos, sino ordenarlos, depurarlos, armar conjuntos y jerarquías, de manera intuitiva en una sola interfaz. Y de esta manera, dejar todos los sets de datos disponibles para comenzar el análisis.
Cuando decimos que Data Spa garantiza la conexión a cualquier origen de datos, nos referimos a datos de la organización que estén en SQL, en Oracle, en Progress, o en archivos de texto, CSV o Excel, así como a servicios web y a cualquier api que esté publicada.
En un panel, como el siguiente, el usuario podrá interactuar con las funcionalidades de:
- Entrada
- Preparación
- Combinación
- Transformación
- GIS
- Salida
Cada funcionalidad está debidamente identificada con su ícono y, a la vez, posee distintas subfuncionalidades. Así, arrastrando y soltando los íconos en el panel, el usuario podrá armar un flujo de datos a su medida e ir comprobando los resultados.
Desde Visionaris ofrecemos también varios videos tutoriales para que todos los recientes usuarios puedan consultar y desenvolverse en la interfaz.