El repositorio de datos de investigación en el campo de los Estudios Urbanos

Paulo Nascimento Neto, editor jefe de la revista urbe, Curitiba, Paraná, Brasil.

Logo de la urbe. Revista Brasileira de Gestão UrbanaLa ciencia abierta se caracteriza como un “constructo inclusivo que combina diversos movimientos y prácticas” (UNESCO, 2022), cuyo objetivo es promover un amplio acceso público al conocimiento científico y su uso por la sociedad. Al favorecer la socialización del conocimiento producido, se amplía la colaboración científica y el intercambio de información en beneficio de la ciencia y la sociedad. Este conjunto de principios abarca varias dimensiones, incluidas las relacionadas con la disponibilidad, el acceso y la reutilización de los datos de investigación.

Si bien el tema ha ganado mayor visibilidad recientemente en el ámbito de la publicación científica brasileña, la disponibilidad de datos forma parte de la agenda de la ciencia abierta desde hace décadas. Hace casi tres décadas, el Consejo Nacional de Investigación de Estados Unidos (1997) ya recomendaba el acceso abierto y completo a los datos científicos como un paradigma a adoptar internacionalmente, especialmente en el caso de la investigación financiada con recursos públicos.

La Organización para la Cooperación y el Desarrollo Económicos (OCDE), por su parte, publicó su primera declaración sobre el tema en 2004, haciendo hincapié en la importancia del acceso a los datos de la investigación financiada con fondos públicos, una iniciativa que culminó con la publicación de directrices y principios en 2007. En Brasil, destaca el papel protagónico de SciELO en la introducción de este debate durante al menos quince años (como se ejemplifica en una entrada de 2013 en este mismo blog), al promover reflexiones sobre los datos abiertos y su relevancia para la ciencia abierta.

En este contexto, cabe mencionar especialmente SciELO Data, un repositorio de datos lanzado en 2020 y en funcionamiento regular desde enero de 2022. Esta iniciativa utiliza la plataforma de código abierto Dataverse, empleada actualmente en 110 repositorios de datos en todo el mundo. Cada revista de la colección SciELO que adopta esta plataforma cuenta con su propio dataverse, donde se organizan los conjuntos de datos asociados a los artículos, junto con sus metadatos y un identificador único persistente (DOI).

A pesar de esta trayectoria, el tema no se ha incorporado plenamente a la agenda de las revistas brasileñas. Una encuesta reciente realizada por SciELO (2023) indica que solo alrededor del 30% de las revistas de la colección mencionan los “datos” en sus políticas editoriales. Dentro de este subconjunto, menos del 6% exige el depósito de datos asociados a los artículos publicados, lo que corresponde a menos del 2% del total de la colección.

Por lo tanto, la disponibilidad y el amplio acceso a los datos siguen siendo un tema relevante para la reflexión y el progreso. Como parte de su compromiso con los principios de la ciencia abierta, la revista urbe adoptó el depósito obligatorio de datos asociados a todos los artículos desde 2021. Actualmente, hay 171 bases de datos disponibles, publicadas bajo una licencia CC-BY, con indicadores persistentes (DOI) y vinculadas a los artículos publicados a través de una sección específica de declaración de disponibilidad de datos.

Esta medida busca cumplir dos objetivos complementarios. Por un lado, refuerza la transparencia y la reproducibilidad de la investigación, ampliando la integridad científica y la verificabilidad de los resultados publicados. Por otro lado, permite la reutilización de conjuntos de datos mediante la citación de la fuente original, ampliando el alcance de la investigación y favoreciendo la integración entre diferentes bases de datos, con el potencial de estimular nuevos avances en la producción de conocimiento en el campo de los estudios urbanos.

La apertura de datos de investigación responde así a los principios de la ciencia abierta al ampliar las posibilidades de replicabilidad y reutilización de datos, racionalizando los recursos utilizados en la financiación de la investigación y potenciando los nuevos hallazgos a partir de datos ya recopilados.

Este intercambio debe guiarse por los principios FAIR (Findable, Accessible, Interoperable y Reusable), que establecen directrices para garantizar que las bases de datos sean localizables, accesibles, interoperables y reutilizables. Estos principios se están incorporando progresivamente a las prácticas de publicación diarias. En una edición reciente del informe El Estado de los Datos Abiertos (2025), que encuestó a 3.932 investigadores de diversos países (incluido Brasil), se observó un aumento significativo en el conocimiento sobre estas directrices, con un 40,6% de los encuestados que declararon estar familiarizados con los principios FAIR (Figura 1).

 

Figura 1. Nivel de familiaridad con los principios FAIR para los datos.

 

Por otro lado, existe la percepción generalizada de que los investigadores/as aún reciben poco reconocimiento por compartir sus datos de investigación: aproximadamente el 70% de los encuestados comparte esta opinión. Una conclusión similar aparece en un estudio reciente de SciELO, que identificó como uno de los principales desafíos las “dificultades y la resistencia de los investigadores a promover el intercambio de sus datos de investigación […]”.

Este es, de hecho, un tema central de debate. Particularmente en el campo de las Ciencias Sociales Aplicadas, que incluye los estudios urbanos, el intercambio de datos aún genera inquietudes e incertidumbres entre los investigadores. A esto se suma un debate relevante sobre las distinciones epistemológicas entre áreas del conocimiento y sobre las posibilidades de reutilizar datos cualitativos.

En una publicación reciente sobre el tema, Kahryn Hughes y Anna Tarrant (2019) analizan el análisis secundario cualitativo (QSA – qualitative secondary analysis) y exploran su potencial como estrategia de producción de conocimiento. Las autoras destacan, sin embargo, la estrecha relación entre los datos y los contextos en los que se produjeron, así como la proximidad entre los datos y los/las investigadores/as que los recopilaron originalmente, lo que exige un análisis cuidadoso de los contextos incorporados en cada investigación.

Se trata, por lo tanto, de un paradigma importante que debe ser debatido en el campo, con amplias posibilidades de transformación en las formas de producción y circulación del conocimiento. Al mismo tiempo, existen riesgos que requieren una reflexión más profunda, como la eventual homogeneización de la complejidad social, la simplificación de las premisas epistemológicas que guiaron la recopilación de datos o la eliminación de cuestiones sensibles a ciertos temas y métodos de investigación.

El creciente uso de herramientas de inteligencia artificial, tratado en otra publicación de esta Semana Especial, también emerge como un factor a tener en cuenta. El uso de estas herramientas puede ampliar la capacidad de analizar grandes volúmenes de datos, pero también conlleva el riesgo de limitarse a compilar bases de datos cualitativas sin un análisis crítico adecuado de los diseños metodológicos y las premisas epistemológicas que guiaron su producción.

Considerando la doble funcionalidad del repositorio de datos —transparencia y reproducibilidad, por un lado, y reutilización, por otro—, no parece haber controversia respecto a su importancia para fortalecer la integridad científica, al permitir que la comunidad científica revise los datos que sustentan la investigación. En este sentido, el intercambio de datos dialoga directamente con los principios de la ciencia abierta con IDEIA (Impacto, Diversidad, Equidad, Inclusión y Accesibilidad), especialmente en las dimensiones de impacto y accesibilidad.

Al mismo tiempo, sobre todo en el campo de las ciencias sociales aplicadas, la reutilización e integración de datos en bases de datos agregadas suscita debates adicionales. Resulta necesario establecer mediaciones epistemológicas compartidas y estándares metodológicos que garanticen el rigor esperado en la producción y el uso de bases de datos destinadas al análisis secundario.

También es importante considerar las asimetrías en la producción y circulación del conocimiento entre el Norte Global y el Sur Global, lo que exige prestar atención a la promoción de la equidad y la inclusión en los flujos de producción y uso de datos de investigación en diferentes contextos. En el campo de los Estudios Urbanos, este debate está directamente relacionado con el potencial y las limitaciones de los estudios comparativos internacionales y los desafíos que implica la construcción de conocimiento sobre lo urbano, la gestión urbana y la ciudad a partir de la comparación entre contextos a menudo muy diferentes.

Más allá de respuestas definitivas, este debate plantea interrogantes relevantes para el campo, invitando a la construcción colectiva de vías que permitan la plena incorporación de los datos abiertos como dimensión estructurante de la ciencia abierta.

Enlaces externos

OECD 

Dataverse 

National Academies 

The State of Open Data

Levantamento recente realizado 

urbe. Revista Brasileira de Gestão Urbana – SciELO

urbe. Revista Brasileira de Gestão Urbana –  Redes sociales: Facebook | X | Instagram

Pontifícia Universidade Católica do Paraná (PUCPR) –  Redes sociales: Facebook | X | Instagram

 

Como citar este post [ISO 690/2010]:

NETO, P.N. El repositorio de datos de investigación en el campo de los Estudios Urbanos [online]. SciELO en Perspectiva: Humanidades, 2026 [viewed ]. Available from: https://humanas.blog.scielo.org/es/2026/05/06/el-repositorio-de-datos-de-investigacion-en-el-campo-de-los-estudios-urbanos/

 

Leave a Reply

Your email address will not be published. Required fields are marked *

Post Navigation