"

Silvia Díaz-de la Fuente; Virginia Ahedo; Jorge Caro; María Pereda; José Ignacio Santos; y José Manuel Galán

Silvia Díaz-de la Fuentea, Virginia Ahedoa, Jorge Caroa, María Peredab, José Ignacio Santosa y José Manuel Galána

a Universidad de Burgosb Universidad Politécnica de Madrid

Resumen

Este trabajo recoge los resultados de un análisis de la multidisciplinariedad de la investigación en España. Con información recogida del Ministerio de Ciencia e Innovación sobre los proyectos de investigación de naturaleza coordinada financiados durante el periodo 2013-2017 hemos formalizado una red de instituciones y otra red de áreas temáticas. Las técnicas de análisis de redes nos han permitido caracterizar las propiedades generales y estructurales de estas redes, así como identificar las instituciones que lideran la multidisciplinariedad en España, las comunidades de instituciones que mantienen una mayor colaboración, y las áreas temáticas que reúnen el mayor número de colaboraciones multidisciplinares.

1. Introducción

Cuando nos propusimos estudiar la dimensión multidisciplinar de la investigación en España no imaginábamos que poco tiempo después el mundo iba a enfrentarse a una inimaginable pandemia. Un pequeñísimo microorganismo ha puesto en jaque la economía de muchos países y la salud de sus ciudadanos, y también, a toda la comunidad científica que se ha visto urgida a dar respuesta a las múltiples y complejas cuestiones abiertas por la pandemia. En ausencia de este hecho, hubiéramos introducido este trabajo aludiendo a la utilidad de estudiar la complejidad de muchos problemas desde una perspectiva multidisciplinar, es decir, desde un trabajo colaborativo en el que el que la utilización de conocimientos, metodologías y técnicas de diferentes disciplinas científicas puede generar más valor que la suma de investigaciones independientes y aisladas. Sin embargo, una calamidad mundial como la pandemia de coronavirus nos está enseñando el mejor ejemplo de cómo la ciencia ante problemas complejos busca respuestas multidisciplinares. Encontramos numerosos proyectos de investigación que tratan de superar las tradicionales fronteras disciplinares para abordar con más probabilidades de éxito el desarrollo de fármacos y vacunas contra la enfermedad (“Coronavirus research and innovation | European Commission,2020; CSIC, 2020), la implementación de modelos epidemiológicos más precisos (“Mapa de riesgo COVID-19 – España,2020), o la explotación de la propia información científica que se va generando sobre el virus y la enfermedad (“Help us better understand COVID-19 | Kaggle,” 2020) , por citar solo algunos ejemplos.

El estudio de la multidisciplinariedad en la ciencia abarca diferentes enfoques y metodologías. Por enfoques nos referimos a la propia definición del objeto de estudio, que puede utilizar diferentes niveles de abstracción, desde la simple multidisciplinariedad, entendida como la colaboración de diferentes disciplinas en una tarea común pero trabajando cada una desde en su propio dominio, la interdisciplinariedad, que requiere una integración de conocimientos y metodologías, y finalmente la transdisciplinariedad, que pretende crear un nuevo marco de conocimiento y metodológico que trasciende las disciplinas de partida (Stember, 1991). Y al hablar de metodologías, nos referimos a los métodos y las técnicas que podemos emplear para estudiar el problema, aunque en la práctica, resulta difícil averiguar el grado de abstracción que mejor describe muchas de las investigaciones en las que colaboran científicos de diferentes disciplinas.

Aunque los estudios sobre multidisciplinariedad pueden plantear preguntas heterogéneas, muchos recurren a técnicas comunes basadas en análisis bibliométrico. Así, por ejemplo, algunos trabajos analizan el impacto en la productividad de la investigación en equipos multidisciplinares (Wuchty, Jones, & Uzzi, 2007); otros intentan describir las colaboraciones construyendo mapas de la multidisciplinariedad (Porter & Rafols, 2009); incluso podemos encontrar trabajos que analizan las dificultades de la carrera profesional que desarrolla ciencia multidisciplinar (Benson et al., 2016). Estos son solo algunos ejemplos del interés que en la propia ciencia suscita el estudio del modo de hacer ciencia. La multidisciplinariedad también se hace hueco como medida de comparación entre universidades y centros de investigación, utilizándose como un indicador más en estudios de ranking del sistema universitario nacional (Fundación BBVA e Ivie (Instituto Valenciano de Investigaciones Económicas), 2019).

Con este trabajo pretendemos hacer una aportación significativa al conocimiento sobre la multidisciplinariedad de la investigación en España. El resultado es novedoso por dos aspectos, en primer lugar, por los datos que utilizamos provenientes del Ministerio de Ciencia e Innovación que capturan la multidisciplinariedad desde una perspectiva financiera, a diferencia de los tradicionales estudios sobre productividad científica; y en segundo lugar, por el marco de trabajo en el que desarrollamos el análisis que es la teoría de redes, que nos permite mostrar la dimensión relacional de las colaboraciones entre las diferentes instituciones de investigación españolas.

2. Metodología

El trabajo se ha desarrollado en dos etapas. En una primera se han recogido y procesado la información publicada por el Ministerio de Ciencia e Innovación sobre las ayudas concedidas por el programa estatal de investigación, desarrollo e innovación orientado a los retos de la sociedad entre los años 2013 y 2018. Esta tarea se ha realizado mediante técnicas de “scraping” de la documentación en formato PDF publicada por el ministerio. De entre todos los proyectos financiados, se han seleccionado exclusivamente los proyectos coordinados en la que dos o más instituciones presentan una memoria de investigación única que por su característica multidisciplinar requiere la colaboración de grupos de investigación diferentes (ver la Figura 1). Ha sido necesario revisar manualmente los datos filtrados para corregir errores o pequeñas variaciones en las variables de texto que podían introducir duplicidades en el análisis posterior.

Figura 1. Muestra de una de las múltiples tablas procesadas que recogen la relación de proyectos financiados por el ministerio y la financiación concedida. Los proyectos coordinados se caracterizan por añadir un valor alfanumérico a la referencia que define el grupo y su orden; dos o más instituciones que participan en el mismo proyecto comparten la parte principal de la referencia y difieren en la parte de grupo. La variable “beneficiario” identifica el nodo en la red de instituciones, mientras que la variable “centro” ha sido utilizada como criterio para clasificar el proyecto en una de las áreas temáticas de la ANEP.

En una segunda etapa, a partir de los datos capturados se han formalizado y analizado dos redes:

  1. Una red de instituciones en la que los nodos son los beneficiarios de las ayudas, y cada enlace pesado define el número de proyectos coordinados que dos beneficiarios han suscrito durante el periodo de estudio. Entre los beneficiarios de estas ayudas se encuentran una gran parte de las universidades, así como el CSIC y otras instituciones de investigación nacional.
  2. Una red de áreas temáticas. Desafortunadamente la información publicada por el ministerio no recoge los campos clave con los que se clasifican los proyectos. Sin embargo, hemos propuesto una clasificación tentativa utilizando como criterio de clasificación el dato del centro que lidera el proyecto dentro de la institución, y como clases las áreas temáticas de la Agencia Nacional de Evaluación y Prospectiva (ANEP), (ver la Tabla 1). La clasificación de los proyectos financiados nos ha permitido crear una red de áreas temáticas donde los nodos corresponden con un código ANEP, y un enlace pesado representa el número de proyectos coordinados que relacionan dos áreas temáticas.
Área ANEP Código
Ciencias y tecnologías químicas CTQ
Energía y transporte EYT
Ciencias físicas FIS
Ciencias y tecnologías de materiales MAT
Ciencias matemáticas MTM
Producción industrial ingeniería civil PIN
Tecnologías de la información y comunicaciones TIC
Ciencias sociales CSO
Derecho DER
Economía ECO
Ciencias de la educación EDU
Cultura filología literatura y arte FLA
Mente lenguaje y pensamiento MLP
Estudios del pasado historia y arqueología PHA
Psicología PSI
Biociencias y biotecnología BIO
Biomedicina BME
Ciencias agrarias y agroalimentarias CAA
Ciencias y tecnologías medioambientales CTM
Universidades e Institutos sin especificar gen

Tabla 1. Áreas temáticas de la ANEP

El tratamiento de los datos del ministerio, la formalización de las redes y su análisis se ha realizado en Python mediante las librerías NetworkX (Hagberg, Schult, & Swart, 2008), Pandas  (The pandas development Team, 2020) y Numpy (Oliphant, 2006; van der Walt, Colbert, & Varoquaux, 2011), el programa de “consensus clustering” (Lancichinetti & Fortunato, 2012), y el programa de detección de comunidades OSLOM (Lancichinetti et al., 2011). Además, hemos utilizado el programa de visualización de redes Gephi (Bastian, S., & M., 2009) para crear algunas de las figuras.

3. Principales resultados

3.1- Red de instituciones

3.1.1- Características generales

La red de instituciones está formada por todos los beneficiarios de los proyectos coordinados, que corresponden a las instituciones solicitantes. Se establece un enlace entre dos instituciones si ambas han participado en al menos un proyecto multidisciplinar, siendo el peso del enlace el número de proyectos compartidos. Hemos geolocalizado cada institución lo que nos ha permitido representar la red de instituciones en el mapa de España (ver la Figura 2); dada la naturaleza del CSIC que agrupa una gran variedad de centros, se han tenido en cuenta la geolocalización del centro particular del CSIC que solicitaba el proyecto para no generar un sesgo de concentración de enlaces hacia la capital. El análisis de esta figura nos permite obtener algunos resultados cualitativos de la distribución espacial de la multidisciplinariedad en España. Especialmente podemos destacar el número de relaciones entre instituciones situadas en la capital Madrid con instituciones localizadas en las principales ciudades del arco mediterráneo, Barcelona y Valencia, así como con el noreste peninsular, Bilbao, Pamplona y Zaragoza.

Figura 2. Proyección en el mapa de España de la red de instituciones.

La red de instituciones presenta un componente mayor con más del 98% de los nodos cuyos principales estadísticos se muestran en la Tabla 2. Este componente presenta un clustering elevado, debido a la existencia de muchas relaciones triangulares en los proyectos coordinados.

Además, destaca una asortatividad de grado negativa, lo que evidencia una estructura de red estrellada, donde aquellas instituciones con un mayor número de vínculos tienden a establecer relaciones con instituciones con pocos vínculos. Esta estructura estrellada puede responder a un modelo de especialización, donde las grandes instituciones (en términos de volumen de proyectos y vínculos con otras instituciones) tienden a liderar los proyectos, desarrollando probablemente la línea de investigación principal, asociándose con instituciones más pequeñas que desempeñarían tareas más especializadas.

Nodos Enlaces Densidad Distancia geodésica media Grado medio Clustering medio Asortatividad de grado
163 844 0.063925 2.484284 10.355828 0.460527 -0.243814

Tabla 2. Estadísticas básicas del componente principal de la red de instituciones.

La Figura 3 muestra la distribución de grado de la red de instituciones. El CISIC con sus 93 enlaces (ver la Tabla 3) representa claramente un outlier puesto que agrupa a una gran diversidad de centros de investigación distribuidos por toda España. Sin tener en cuenta el CSIC, el resto de la gráfica manifiesta una significativa heterogeneidad fruto de que unas pocas instituciones tienen un mayor número de relaciones que la mayoría.

Figura 3. Distribución de grado de la red de instituciones. El grado (no pesado) se calcula como el número de enlaces que una institución tiene con otras de la red.

La Tabla 3 recoge las 20 instituciones con un mayor número de enlaces. Además del CISC, en los primeros lugares destacan las principales universidades politécnicas, la Universidad Politécnica de Cataluña, la Universidad Politécnica de Valencia y la Universidad Politécnica de Madrid, junto con la Universidad de Barcelona, la Universidad del País Vasco y la Universidad Complutense de Madrid, todas ellas con más de 40 vínculos correspondientes a más de 100 proyectos coordinados cada una. Más adelante veremos que las áreas temáticas de tecnologías de la información y comunicaciones (TIC) y producción industrial e ingeniería civil (PIN) agrupan una gran cantidad de los proyectos por lo que no sorprende los puestos de las universidades de perfil más tecnológico como las politécnicas. Se ha incluido una variable con el personal de cada una de las instituciones como representante del tamaño de ésta. Sin tener en cuenta el CSIC, podemos ver que existe una importante correlación lineal entre el grado y el tamaño de las instituciones como se muestra en la Figura 4.

Institución Código Grado Peso Personal
CONSEJO-SUPERIOR-DE-INVESTIGACIONES-CIENTIFICAS CSIC 93 429 3646
UNIVERSITAT-POLITECNICA-DE-CATALUNYA UPC 52 149 2643
UNIVERSITAT-POLITÈCNICA-DE-VALÈNCIA UPV 50 128 2598
UNIVERSIDAD-DE-BARCELONA UB 48 123 5391
UNIVERSIDAD-POLITECNICA-DE-MADRID UPM 45 158 2911
UNIVERSIDAD-DEL-PAIS-VASCO-EUSKAL-HERRIKO-UNIBERTSITATEA UPV-EHU 43 103 4383
UNIVERSIDAD-COMPLUTENSE-DE-MADRID UCM 41 105 5727
UNIVERSIDAD-DE-CASTILLA-LA-MANCHA UCLM 37 67 2383
UNIVERSIDAD-DE-VALENCIA UV 37 106 4186
UNIVERSIDAD-CARLOS-III-DE-MADRID UC3M 35 94 1555
UNIVERSIDAD-DE-SEVILLA US 33 89 4163
UNIVERSIDAD-AUTONOMA-DE-BARCELONA UAB 30 72 3532
UNIVERSIDAD-DE-MALAGA UMA 30 57 2404
UNIVERSIDAD-DE-ZARAGOZA UNIZAR 30 78 3615
UNIVERSIDAD-DE-VIGO UVIGO 29 80 1362
UNIVERSIDADE-DE-SANTIAGO-DE-COMPOSTELA USC 27 48 2066
UNIVERSIDAD-DE-CANTABRIA UNICAN 26 63 2520
UNIVERSIDAD-REY-JUAN-CARLOS URJC 26 49 2280
UNIVERSIDAD-DE-VALLADOLID UVA 26 53 1226
UNIVERSIDAD-AUTONOMA-DE-MADRID UAM 26 52 1523

Tabla 3. Lista de las 20 instituciones con mayor número de enlaces (grado) y el número de proyectos coordinados (peso). Se ha incorporado una variable con el personal de cada institución (fuente U-Ranking 2019).

 

Figura 4. Gráfico de dispersión del grado frente al personal de la lista de las 20 instituciones con mayor grado. La línea roja representa la regresión lineal sin el dato del CSIC (con un coeficiente de correlación cercano al 0.5).

Finalmente hemos completado la caracterización de las instituciones calculando las medidas de centralidad de PageRank y de intermediación (betweenness). La Tabla 4 recoge la lista de las 15 instituciones con mayor grado de intermediación, junto con su valor de PageRank. En esta red, la medida de PageRank está muy correlada con la medida del grado y no añade más información a lo ya comentado. La medida de intermediación establece un ranking de instituciones parecido al ranking de grado. Aquellas instituciones con mayor grado que lideran los centros de la estructura estrellada de la red lógicamente también tienen altos valores de intermediación. Aunque también nos permite descubrir algunas otras instituciones que, si bien no tienen tantos vínculos, sí desempeñan un puesto importante como puente de conexión entre instituciones en los proyectos multidisciplinares. Entre estos casos destacamos la Universidad Pompeu Fabra, que estando en la posición 31 del ranking de grado ocupan la séptima posición de acuerdo con la intermediación; y el Institut de Recerca i Tecnologia Agroalimentàries (IRTA) que ocupa la duodécima posición en el ranking de intermediación frente a la posición 50 en el ranking de grado.

Institución Betweenness PageRank Grado Ranking (grado)
CSIC 0.316172474 0.10234972 93 1
UNIVERSITAT-POLITECNICA-DE-CATALUNYA 0.088377378 0.035143813 52 2
UNIVERSIDAD-COMPLUTENSE-DE-MADRID 0.081128512 0.027548889 41 7
UNIVERSIDAD-DE-BARCELONA 0.070336353 0.029512757 48 4
UNIVERSITAT-POLITÈCNICA-DE-VALÈNCIA 0.059703985 0.029565437 50 3
UNIVERSIDAD-POLITECNICA-DE-MADRID 0.057972253 0.035767548 45 5
UNIVERSITAT-POMPEU-FABRA 0.054281014 0.009882365 19 31
UNIVERSIDAD-DEL-PAIS-VASCO-EUSKAL-HERRIKO-UNIBERTSITATEA 0.044935846 0.024205139 43 6
UNIVERSIDAD-DE-SEVILLA 0.039507153 0.021196435 33 11
UNIVERSIDAD-CARLOS-III-DE-MADRID 0.037576766 0.02187506 35 10
INSTITUT-DE-RECERCA-I-TECNOLOGIA-AGROALIMENTARIES-(IRTA) 0.037402525 0.005346497 10 55
UNIVERSIDAD-DE-VALENCIA 0.035621288 0.02440262 37 9
UNIVERSIDAD-DE-ZARAGOZA 0.031349284 0.019077639 30 14
UNIVERSIDAD-DE-CASTILLA-LA-MANCHA 0.029765122 0.016104666 37 8

Tabla 4. Medidas de centralidad de intermediación (betweenness), PageRank y grado.

3.1.2- Identificación de comunidades de instituciones

Hemos aplicado el algoritmo OSLOM de detección de comunidades a nuestra red de instituciones (Lancichinetti et al., 2011). El objetivo es describir la estructura de grupos de la ciencia multidisciplinar en España observada a través de la lente de la financiación de proyectos coordinados. Debemos recordar, que el problema de identificar comunidades, en nuestro caso grupos de instituciones que se caracterizan porque los miembros de cada una comparten un mayor número de proyectos entre ellos mismos que con el resto, es un problema muy complejo del que únicamente podemos esperar soluciones aproximadas (Fortunato, 2010). Un algoritmo de “consensus clustering” (Lancichinetti & Fortunato, 2012) nos ha permitido sortear el problema de la estocasticidad en el resultado de las particiones, construyendo una partición consenso de la red de instituciones formada por 7 comunidades. El valor de la información que aporta cada comunidad está limitado por la su significación estadística, medida como la probabilidad de encontrar una comunidad igual en una red aleatoria. Cuatro de las 7 comunidades presentan un p-valor menor del 5%, lo que nos permite confiar en las interpretaciones que obtenemos de ellas. Las otras tres tienen un p-valor más grande lo que reduce la confianza en su interpretación, algo que no debemos olvidar.

La partición que hemos obtenido responde únicamente a la lógica de los enlaces de la red, es decir, no tiene en cuenta ninguna otra información exógena a la misma. Sin embargo, para interpretar su significado hemos añadido información externa, en particular, la localización espacial de las instituciones y la clasificación de los proyectos en áreas temáticas. De esta forma, cada comunidad muestra dos caras que explorar, un rostro espacial formada por la representación de las instituciones de una comunidad en el mapa de España, y un rostro disciplinar, formada por las áreas temáticas de la ANEP de los proyectos realizados dentro de la comunidad. La Figura 5 y la Figura 6 recogen para cada comunidad su representación espacial y su perfil disciplinar. El perfil disciplinar se ha calculado mediante un histograma de la frecuencia de los diferentes temas abordados en los proyectos, destacando en color rojo aquellas áreas que representan el 80% de los proyectos. Además, en cada figura se indican las instituciones más importantes (en términos de grado) que forman la comunidad.

En nuestro análisis hemos encontrado algunos casos de solapado que corresponden a instituciones que el algoritmo asigna con la misma probabilidad a dos comunidades. Para interpretar estos casos debemos observar que estos casos suelen ser instituciones grandes con heterogeneidad de centros que participan en cada comunidad con proyectos de áreas temáticas distintas. El caso del CSIC es el más evidente, pues agrupa una gran diversidad de centros de investigación, cada uno de los cuales probablemente mantiene una red de colaboraciones independientes.

La interpretación de la dimensión disciplinar se ve limitada en parte por la falta de datos suficientes para clasificar los proyectos que nos ha obligado a crear una clase genérica que a modo de cajón desastre agrupa todos aquellos proyectos indeterminados.

Los principales resultados que obtenemos del análisis de las comunidades de la red de instituciones se resumen en los siguientes puntos:

  • Existen dos comunidades con un patrón espacial en forma de triángulo que une la capital Madrid con el arco mediterráneo y el País Vasco y Navarra (comunidades 2 y 3 de la Figura 5) con una gran diversidad de áreas donde destacan principalmente las ciencias medioambientales, agrarias y agroalimentarias. Una de las comunidades (comunidad 2) está liderada por instituciones valencianas, la Universidad Politécnica de Valencia y la Universidad de Valencia, mientras que la otra (comunidad 3) está liderada principalmente por instituciones catalanas, la Universidad Politécnica de Cataluña, la Universidad de Barcelona y la Universidad Autónoma de Barcelona.
  • La comunidad 4 (Figura 6) muestra una distribución espacial más centrada que va de norte a sur y agrupa a un conjunto de universidades más similares en grado, la Universidad de Castilla la Mancha, la Universidad de Sevilla, la Universidad de Málaga, la Universidad de Valladolid, la Universidad de Oviedo, la Universidad de Murcia, la Universidad de Granada y la Universidad de Extremadura. La dimensión disciplinar también es variada, aunque en este caso tienen un peso importante la producción industrial e ingeniería civil, y las tecnologías de la información y comunicación.
  • La comunidad 6 (Figura 6) une instituciones del norte peninsular, Galicia, León, País Vasco, con Madrid y el área mediterránea. Destacan las principales universidades politécnicas, la Universidad Politécnica de Cataluña, la Universidad Politécnica de Valencia, la Universidad Politécnica de Madrid, junto con la Universidad del País Vasco, la Universidad de Valencia, la Universidad Carlos III, la Universidad de Vigo, la Universidad de Zaragoza y la Universidad de Santiago de Compostela. También con un perfil disciplinar heterogéneo en el que destaca la producción industrial e ingeniería civil, y las tecnologías de la información y comunicación.
  • Finalmente, la comunidad 5 (Figura 6) está muy centrada en instituciones de Madrid, la Universidad Politécnica de Madrid, la Universidad Carlos III y la Universidad Rey Juan Carlos, con colaboraciones con instituciones más pequeñas principalmente del País Vasco y del área mediterránea. Al igual que las comunidades anteriores, muestra un perfil disciplinar variado más orientado hacia la producción industrial e ingeniería civil, y las tecnologías de la información y comunicación.

Comunidad 1 liderada por la Universidad Pompeu Fabra con un peso muy importante en proyectos de biomedicina.

Comunidad 2 liderada por una parte del CSIC, la Universidad Politécnica de Valencia y la Universidad de Valencia con un peso muy importante en ciencias medioambientales, agrarias y agroalimentarias.

Comunidad 3 liderada por el CSIC, la Universidad Politécnica de Cataluña, la Universidad de Barcelona, la Universidad Autónoma de Barcelona y la Universidad Complutense de Madrid, con un peso significativo en ciencias medioambientales, agrarias, agroalimetarias y producción industrial.

Figura 5. Principales comunidades de la red de instituciones con p-valor menor del 5%. Existe una cuarta comunidad muy pequeña que hemos omitido en el análisis porque aporta poca información. Para cada comunidad se muestra: (1) la distribución en el mapa de España, (2) el histograma de la frecuencia de los diferentes temas abordados en los proyectos, destacando en color rojo aquellas áreas que representan el 80% de los proyectos, y (3) las instituciones con más grado que forman la comunidad.

Comunidad 4 donde concurren un conjunto de universiades muy parecidas en grado como la Universidad de Castilla la Mancha, la Universidad de Sevilla, la Universidad de Málaga, la Universidad de Valladolid, la Universidad de Oviedo, la Universidad de Murcia, la Universidad de Granada y la Universidad de Extremadura, que destacan principalmente en proyectos industriales y TIC.

Comunidad 5 liderada por la Universidad Politécnica de Madrid, la Universidad Carlos III, y la Universidad Rey Juan Carlos que destacan en proyectos industriales y TIC.

Comunidad 6 lideradas por la Universidad Politécnica de Cataluña, la Universidad Politécnica de Valencia, la Universidad Politécnica de Madrid y la Universidad del País Vasco, junto con tras instituciones como la Universidad de Valencia, la Universidad Carlos III, la Universidad de Vigo, la Universidad de Zaragoza y la Universidad de Santiago de Compostela, todas ellas con proyectos principalmente industriales y TIC.

Figura 6 Comunidades de la red de instituciones con p-valor mayor del 5%. Para cada comunidad se muestra: (1) la distribución en el mapa de España, (2) el histograma de la frecuencia de los diferentes temas abordados en los proyectos, destacando en color rojo aquellas áreas que representan el 80% de los proyectos, y (3) las instituciones con más grado que forman la comunidad.

3.2- Red de áreas ANEP

3.2.1- Características generales

La red de áreas temáticas se construye después de clasificar cada registro de las tablas de proyectos (Figura 1) en una de las áreas temáticas de la ANEP. La clasificación se hace asociando el nombre del centro solicitante a un área temática. Por ejemplo, el Instituto de Ciencia de Materiales de Sevilla (ICMS) del CSIC se ha asociado al área de Ciencias y tecnologías de materiales (MAT) de la ANEP. Muchos de los centros tienen una fácil clasificación, sin embargo, algunos no ofrecen información suficiente en su nombre por ser demasiado genérico, caso por ejemplo de la Escuela Politécnica Superior de la Universidad de Girona, por lo que son agrupados en un área temática nueva genérica que llamamos “universidades e institutos sin especificar”. En esta red, definimos un enlace entre dos áreas temáticas siempre que haya al menos un proyecto multidisciplinar con dos centros cada uno clasificado en una de las áreas, siendo el peso del enlace el número de proyectos semejantes.

La Figura 7 representa la red de áreas temáticas donde se destacan la importancia de cada área (de acuerdo con el grado), la importancia de cada enlace (de acuerdo con el peso de los proyectos) y la partición en comunidades mediante colores (ver Tabla 6).

Figura 7. Red de áreas temáticas ANEP creada mediante el programa Gephi. Los nodos están coloreados de acuerdo con las comunidades detectadas, su tamaño es proporcional al grado, y el tamaño de los enlaces es proporcional al número de proyectos coordinados que tocan cada par de áreas.

Los principales estadísticos de esta red se muestren en la Tabla 5. Esta proyección de los proyectos en áreas temáticas nos genera una red muy pequeña que se caracteriza principalmente por su elevado clustering y su falta de asortatividad de grado. Como ya comentamos en apartados anteriores, la interpretación de esta red está fuertemente limitada por la falta de datos para clasificar todos los proyectos. Consecuentemente los resultados que podemos extraer son mucho más modestos en comparación con los resultados obtenidos de analizar la red de instituciones.

Nodos Enlaces Densidad Distancia geodésica media Grado medio Clustering medio Asortatividad de grado
20 107 0.563158

1.542105

10.7 0.738453 -0.04028

Tabla 5. Estadísticas básicas del componente principal de la red de áreas temáticas de la ANEP.

Obviando la categoría genérica, sí podemos destacar algunas conlsusiones (ver Tabla 6). La primera es que las disciplinas de perfil más tecnológico, como las tecnologías de la información y comunicaciones, las ciencias y tecnologías medioambientales, la producción industrial ingeniería civil, las ciencias agrarias y agroalimentarias, la biomedicina, las ciencias y tecnologías de materiales, las ciencias y tecnologías químicas, o las biociencias y biotecnología lideran la multidisciplinariedad de los proyectos coordinados financiados por el ministerio. Probablemente la propia naturaleza de los problemas de estas disciplinas, que requiere de aproximaciones multidisciplinares, o también una cultura de investigación tradicionalmente más abierta a la discusión interdisciplinar, esté detrás de este hecho. Por el contrario, las disciplinas ménos tecnológicas y más teóricas como la  psicología, la cultura filología literatura y arte,  los estudios del pasado historia y arqueología, el derecho o las ciencias matemáticas, participan en menor grado en las colaboraciones multidisciplinares. También llama la atención el alto valor de intermediación de las tecnologías de la información y comunicaciones, que caracteriza su importancia como disciplina común en muchos de los proyectos coordinados.

Código

Área ANEP Grado Betweenness PageRank
gen Universidades e Institutos sin especificar 1.052631579 0.259530771 0.164081268
TIC Tecnologías de la información y comunicaciones 0.842105263 0.066743247 0.105027712
CTM Ciencias y tecnologías medioambientales 0.789473684 0.044569758 0.071870245
PIN Producción industrial ingeniería civil 0.736842105 0.030339738 0.139762005
CAA Ciencias agrarias y agroalimentarias 0.684210526 0.028849903 0.06512904
BME Biomedicina 0.684210526 0.020627959 0.042950575
MAT Ciencias y tecnologías de materiales 0.631578947 0.021651351 0.057800342
CTQ Ciencias y tecnologías químicas 0.631578947 0.004511278 0.044727189
BIO Biociencias y biotecnología 0.578947368 0.001670844 0.029798473
EDU Ciencias de la Educación 0.578947368 0.04619883 0.017502303
FIS Ciencias físicas 0.578947368 0.001670844 0.066834523
MLP Mente lenguaje y pensamiento 0.526315789 0.020467836 0.017577349
ECO Economía 0.526315789 0.034307992 0.033263524
EYT Energía y transporte 0.473684211 0 0.025283746
CSO Ciencias Sociales 0.368421053 0.009990253 0.023157597
PSI Psicología 0.368421053 0.000974659 0.013996596
FLA Cultura filología literatura y arte 0.368421053 0.003411306 0.016382026
PHA Estudios del pasado historia y arqueología 0.368421053 0.005847953 0.015893771
DER Derecho 0.263157895 0 0.037872813
MTM Ciencias Matemáticas 0.210526316 0.000974659

0.011088905

Tabla 6. Medidas de centralidad de la red de áreas temáticas de la ANEP. La tabla está ordenada de mayor a menor de acuerdo con el grado de los nodos (valor normalizado).

3.2.2- Identificación de comunidades de áreas temáticas

También hemos analizado la estructura de grupos de la red de áreas temáticas. En este caso, la identificación de comunidades pretende descubrir aquellos grupos temáticos que se caracterizan porque dentro del grupo comparten un mayor número de proyectos que fuera del mismo.

La Tabla 7 muestra la partición en comunidades calculada mediante el algoritmo de Louvain (Blondel et al., 2008) (representada por colores en la Figura 7). Una revisión de esta nos permite destacar los siguientes puntos:

  • Las áreas temáticas más dinámicas en su dimensión multidisciplinar conforman tres comunidades claramente diferenciadas que podemos denominar como: (1) la comunidad industrial, formada por las áreas producción industrial e ingeniería que colabora con la física y la energía y transporte; (2) la comunidad biológica y medioambiental, formada por ciencias y tecnologías medioambientales, ciencias agrarias y agroalimentarias, y biomedicina; y (3) la comunidad TIC, formada por tecnología de la información y comunicaciones.
  • Junto a las anteriores, hay una comunidad de ciencias sociales, que agrupa áreas con menor productividad multidisciplinar, como ciencias sociales, economía y derecho.
  • Finalmente, existe una comunidad más heterogénea y difícil de interpretar (comunidad 5 de la Tabla 7), en el que destaca el área de universidades e institutos sin especificar que representa los proyectos no clasificados.
Tabla 7. Partición en comunidades de la red de áreas temáticas de la ANEP. Los colores de las filas se corresponden con los utilizados para colorear los nodos de la Figura 7.

4. Conclusiones

Con este trabajo hemos pretendido realizar una interesante aportación al conocimiento sobre la multidisciplinariedad de la investigación científica en España. A diferencia de los estudios tradicionales basados principalmente en análisis bibliométricos, nosotros hemos pretendido enfocar el problema de la multidisciplinariedad desde su dimensión financiera, concretada en la captación de recursos que supone la financiación en las convocatorias nacionales anuales. El resultado resulta novedoso también por el marco de trabajo en el que desarrollamos el análisis, por la forma de transformar los datos en redes que muestran las relaciones entre instituciones y entre áreas temáticas.

No debemos olvidar algunas limitaciones de este estudio. En primer lugar, la ventana temporal 2013-2018 de las convocatorias del ministerio estudiadas. Hubiera sido interesante abarcar más años para tener una visión más amplia de la actividad multidisciplinar en España, pero carecíamos de estos datos. En segundo lugar, por la propia información utilizada, solo proyectos financiaos en la convocatoria nacional de I+D+I del Ministerio de Ciencia e Innovación. Seguramente la incorporación de datos de otras convocatorias a diferentes niveles, regional, nacional e internacional, permitirían capturar relaciones que actualmente con nuestros datos se nos han escapado. Estas limitaciones, sin embargo, se convierten en futuras líneas de trabajo en las que trataremos de incorporar más años y más fuentes de datos.

Las diferentes técnicas de análisis de redes nos han permitido caracterizar las propiedades generales y estructurales de las redes de colaboración multidisciplinar en España, y obtener algunos resultados curiosos:

  • La dimensión espacial de la multidisciplinariedad en España muestra una relación muy intensa entre las instituciones científicas de la capital Madrid y las de las principales ciudades del arco mediterráneo, Barcelona y Valencia, así como con el noreste peninsular, Bilbao, Pamplona y Zaragoza.
  • Hemos descubierto una estructura de red de instituciones estrellada que puede responder a un modelo de especialización, donde las grandes instituciones tienden a desarrollar la línea principal de los proyectos y se asocian con instituciones más pequeñas que desempeñarían tareas más especializadas.
  • Hemos identificado diferentes comunidades de instituciones que colaboran más intensamente entre de ellas que con el resto. Podemos destacar, dos comunidades con un patrón espacial triangular que une la capital Madrid con el arco mediterráneo y el País Vasco y Navarra que abordan principalmente proyectos de ciencias medioambientales, agrarias y agroalimentarias; una comunidad más central que une norte y sur y agrupa universidades más similares en grado con proyectos de producción industrial e ingeniería civil y tecnologías de la información y comunicación; y una comunidad que une instituciones del norte peninsular, Galicia, León, País Vasco, con Madrid y el área mediterránea, donde tienen un peso muy importante las principales universidades politécnicas, que abordan principalmente proyectos de producción industrial e ingeniería civil y tecnologías de la información y comunicación.
  • La red de áreas temáticas evidencia que las disciplinas de perfil más tecnológico son las que lideran la multidisciplinariedad en España, frente a disciplinas ménos tecnológicas y más teóricas que participan en menos colaboraciones multidisciplinares.
  • Hemos identificado tres comunidades tematicas con mayor productividad multidisciplinar, una comunidad industrial, una comunidad biológica y medioambiental, y una comunidad TIC. Y junto a ellas, una comunidad de ciencias sociales que agrupa áreas temáticas con una menor actividad multidisciplinar.

5. Agradecimientos

Los autores quieren mostrar su agradecimiento al Ministerio de Ciencia, Innovación y Universidades (redes de excelencia HAR2017-90883-REDC y RED2018-102518-T, y FEDER (España), ayuda PGC2018-098186-B-100 (BASIC)); y a la Consejería de Educación de la Junta de Castilla y León a través de BDNS 425389, el contrato predoctoral de Virginia Ahedo (financiado por el Fondo Social Europeo) y la ayuda destinada a financiar la contratación de personal técnico de apoyo a la investigación por las Universidades Públicas de Castilla y León, para jóvenes incluidos en el Sistema Nacional de Garantía Juvenil, cofinanciadas por el Fondo Social Europeo y la Iniciativa de Empleo Juvenil.

Bibliografía

Bastian, M., S., H., & M., J. (2009). Gephi: an open source software for exploring and manipulating networks. In International AAAI Conference on Weblogs and Social Media. Retrieved from http://www.aaai.org/ocs/index.php/ICWSM/09/paper/view/154.

Benson, M. H., Lippitt, C. D., Morrison, R., Cosens, B., Boll, J., Chaffin, B. C., … Valentin, V. (2016). Five ways to support interdisciplinary work before tenure. Journal of Environmental Studies and Sciences, 6(2), 260–267. https://doi.org/10.1007/s13412-015-0326-9

Blondel, V. D., Guillaume, J.-L., Lambiotte, R., & Lefebvre, E. (2008). Fast unfolding of communities in large networks. Journal of Statistical Mechanics: Theory and Experiment, 2008(10), P10008. https://doi.org/10.1088/1742-5468/2008/10/P10008

Coronavirus research and innovation | European Commission. (2020). Retrieved April 18, 2020, from https://ec.europa.eu/info/research-and-innovation/research-area/health-research-and-innovation/coronavirus-research-and-innovation_en.

CSIC. (2020). La plataforma Salud Global del CSIC lanza 12 proyectos científicos para abordar la pandemia del coronavirus | Consejo Superior de Investigaciones Científicas – CSIC – csic.es. Retrieved April 18, 2020, from https://www.csic.es/es/actualidad-del-csic/la-plataforma-salud-global-del-csic-lanza-12-proyectos-cientificos-para-abordar.

Fortunato, S. (2010, February 1). Community detection in graphs. Physics Reports. North-Holland. https://doi.org/10.1016/j.physrep.2009.11.002

Fundación BBVA e Ivie (Instituto Valenciano de Investigaciones Económicas). (2019). Rankings de las universidades españolas. Retrieved April 18, 2020, from https://www.u-ranking.es/.

Hagberg, A. A., Schult, D. A., & Swart, P. J. (2008). Exploring network structure, dynamics, and function using NetworkX. In G. Varoquaux, T. Vaught, & J. Millman (Eds.), Proceedings of the 7th Python in Science Conference (SciPy2008) (pp. 11–15). Pasadena, CA, USA.

Help us better understand COVID-19 | Kaggle. (2020). Retrieved April 18, 2020, from https://www.kaggle.com/covid19.

Lancichinetti, A., & Fortunato, S. (2012). Consensus clustering in complex networks. Scientific Reports, 2(1), pp. 1–7. https://doi.org/10.1038/srep00336

Lancichinetti, A., Radicchi, F., Ramasco, J. J., & Fortunato, S. (2011). Finding Statistically Significant Communities in Networks. PLoS ONE, 6(4), e18961. https://doi.org/10.1371/journal.pone.0018961

Mapa de riesgo COVID-19 – España. (2020). Retrieved April 18, 2020, from https://covid-19-risk.github.io/map/spain/es/.

Oliphant, T. E. (2006). A guide to NumPy. USA: Trelgol Publishing.

Porter, A. L., & Rafols, I. (2009). Is science becoming more interdisciplinary? Measuring and mapping six research fields over time. Scientometrics, 81(3), pp. 719–745. https://doi.org/10.1007/s11192-008-2197-2

Stember, M. (1991). Advancing the social sciences through the interdisciplinary enterprise. The Social Science Journal, 28(1), pp. 1–14. https://doi.org/10.1016/0362-3319(91)90040-B

The pandas development Team. (2020). pandas-dev/pandas: Pandas. Zenodo. https://doi.org/10.5281/zenodo.3509134

van der Walt, S., Colbert, S. C., & Varoquaux, G. (2011). The NumPy Array: A Structure for Efficient Numerical Computation. Computing in Science & Engineering, 13(2), pp. 22–30. https://doi.org/10.1109/MCSE.2011.37

Wuchty, S., Jones, B. F., & Uzzi, B. (2007). The Increasing Dominance of Teams in Production of Knowledge. Science, 316(5827), pp. 1036–1039. https://doi.org/10.1126/science.1136099

Licencia

Icono de Licencia Creative Commons Atribución 4.0 Internacional

Terra Incognita: Libro blanco sobre transdisciplinariedad y nuevas formas de investigación en el Sistema Español de Ciencia y Tecnología Copyright © 2020 por (Eds.) Jorge Caro; Silvia Díaz-de la Fuente; Virginia Ahedo; Débora Zurro; Marco Madella; José Manuel Galán; Luis R. Izquierdo; José Ignacio Santos; y Ricardo del Olmo se distribuye bajo una Licencia Creative Commons Atribución 4.0 Internacional, excepto cuando se especifiquen otros términos.