Sandra Serrano1, Luis R. Izquierdo1, José Manuel Galán1, Segismundo S. Izquierdo2 and José I. Santos1
2 Universidad de Burgos, España
2 Universidad de Valladolid, España
Keywords: Inteligencia de Negocio, Inteligencia empresarial, Minería de datos, Aprendizaje automático, Data Science, Machine Learning, Ingeniería de Organización, Knime, Aprendizaje por problemas.
En este trabajo presentamos una propuesta para crear una nueva asignatura en los Grados de Ingeniería de Organización Industrial (GIOI). La propuesta surge de la necesidad de actualizar los contenidos de GIOI para formar a nuestros alumnos en el uso y el conocimiento profundo de las nuevas tecnologías diseñadas para facilitar la toma de decisiones empresariales haciendo uso de la gran cantidad de datos que se encuentran disponibles. Estas técnicas pueden englobarse dentro de lo que se llama Inteligencia de Negocio, por lo que un posible nombre para la nueva asignatura que proponemos podría ser “Inteligencia de Negocio aplicada a la Ingeniería de Organización”.
La Inteligencia de Negocio es un conjunto de metodologías y tecnologías diseñadas para extraer, procesar, y explotar grandes cantidades de datos relacionados con una empresa con el objetivo de generar información útil para la toma de decisiones [1, 2]. Comprende la adquisición y el preprocesamiento de datos, la elaboración de informes dinámicos, el análisis y comprensión de relaciones entre variables clave, la identificación de patrones y tendencias, y el diseño y evaluación de modelos predictivos; todo ello de la forma más automatizada posible [3]. La Inteligencia de Negocio, por tanto, puede entenderse simplemente como la aplicación de conceptos y técnicas de Data Science [1] al ámbito empresarial, con un énfasis especial en la creación de informes útiles para la toma de decisiones.
El diseño de la asignatura propuesta sigue un enfoque de aprendizaje basado en problemas, conforme al cual se comienza exponiendo a los alumnos un problema concreto en el ámbito de la Ingeniería de Organización, se explican brevemente los conceptos necesarios para resolver el problema, y se dota a los alumnos de los recursos y las herramientas necesarias para poder resolverlo. Algunos de los conceptos básicos que se usarían en esa asignatura ya se han visto en otras asignaturas (p.ej. estadística descriptiva, regresión lineal y tests de hipótesis en Estadística; o tipos de datos y bucles en Informática Básica), pero lo cierto es que nuestra experiencia impartiendo clase en los últimos cursos de Ingeniería de Organización sugiere que los estudiantes suelen agradecer –o incluso necesitar– repasar en profundidad los conceptos que vieron en los primeros cursos y resaltar la utilidad que estos conceptos tienen usando ejemplos reales concretos.
La asignatura que proponemos se divide en tres grandes bloques:
- Datos: Adquisición, limpieza, transformación, integración, almacenamiento y gestión de datos. Duración aproximada: 8 horas.
- Analítica descriptiva (¿Qué ha ocurrido?): Generación, visualización y análisis de información. Elaboración y presentación de informes dinámicos. Generación automática de contrastes de hipótesis. Creación de cuadros de mando integrales. Duración aproximada: 8 horas.
- Analítica predictiva (¿Qué podría ocurrir?): Diseño, implementación y selección de modelos predictivos. Este bloque es el más extenso, ya que aquí se presentan varias técnicas, todas ellas utilizando como motivación un problema concreto de Ingeniería de Organización:
- Reglas de asociación (4 horas)
- Técnicas de Clustering (6 horas)
- Algoritmos para resolver problemas de clasificación (e.g. regresión logística, árboles de clasificación, redes neuronales). (10 horas)
- Algoritmos para resolver problemas de regresión (e.g. regresión lineal, árboles de regresión, redes neuronales) (8 horas)
- Técnicas de ensemble (e.g. bosques aleatorios) (4 horas)
- Selección de variables y reducción de dimensionalidad (e.g. análisis por componentes principales) (4 horas)
- Detección de anomalías (4 horas)
- Análisis y predicción de series temporales (4 horas)
Cada problema planteado concluirá con una propuesta concreta que añada valor. Es decir, el reto no terminará cuando se haya elaborado un programa informático que funcione y cumpla con los requisitos establecidos, sino que el fin último es que el alumno vea todo el problema en su conjunto y elabore un informe que incluya recomendaciones y acciones concretas que añadan valor. Esta última faceta es lo que se denomina analítica prescriptiva (¿y ahora qué deberíamos hacer?).
La asignatura se plantea de manera eminentemente práctica. Los alumnos resolverán los problemas planteados usando una plataforma integrada de analítica de datos. Para elegir la plataforma adecuada, hemos analizado:
Teniendo en cuenta la disponibilidad de diferentes algoritmos, la facilidad de uso, la documentación, el equipo de desarrolladores, la actividad de su comunidad de usuarios, la licencia con la que se entrega, el precio, y si es de código abierto o no, hemos llegado a la conclusión de que la plataforma que mejor se ajusta al tipo de asignatura que proponemos en GIOI es KNIME. KNIME Analytics Platform tiene una versión completa gratuita, es de código abierto, está perfectamente documentada, contiene multitud de ejemplos, es muy fácil de usar, no requiere de experiencia en programación y consistentemente recibe revisiones extraordinarias (ver e.g. gartner review).
Agradecimientos. Los autores agradecen la financiación del Ministerio de Ciencia, Innovación y Universidades (RED2018‐102518‐T), del Ministerio de Economía, Industria y Competitividad (HAR2017-90883-REDC), de la Agencia Española de Investigación (PID2020-118906GB-I00/AEI/10.13039/501100011033) y de la Junta de Castilla y León – Consejería de Educación (BDNS 425389).
Referencias
- Kotu, V., Deshpande, B.: Data Science. Concepts and Practice. Elsevier (2019). https://doi.org/10.1016/C2017-0-02113-4.
- Grossmann, W., Rinderle-Ma, S.: Fundamentals of Business Intelligence. Springer Berlin Heidelberg, Berlin, Heidelberg (2015). https://doi.org/10.1007/978-3-662-46531-8.
- Berthold, M.R., Borgelt, C., Höppner, F., Klawonn, F., Silipo, R.: Guide to Intelligent Data Science. Springer International Publishing, Cham (2020). https://doi.org/10.1007/978-3-030-45574-3.