Estadísticas históricas sobre bibliotecas de la Argentina: hacia la apertura

La apertura de datos es una tendencia mundial impulsada por los gobiernos para lograr una mayor transparencia. En este contexto, las bibliotecas asumen nuevos roles destacándose su participación en las iniciativas de datos abiertos. Sin embargo, existe una dificultad para acceder a estadísticas históricas ya que están dispersas y su forma de presentación dificulta su procesamiento. Para superar estas limitaciones, surge la idea de recopilar conjuntos de datos sobre bibliotecas de la Argentina entre los siglos XIX y comienzos del XX y publicarlos en un formato abierto. A continuación, comparto un resumen del trabajo publicado en la revista Prefacio donde se describe en profundidad dicha experiencia.



El objetivo del trabajo titulado "Estadísticas históricas sobre bibliotecas de la Argentina: hacia la apertura". publicado en la revista Prefacio (vol. 7, nº 11, 2023), se centra en describir una experiencia en materia de apertura de datos utilizando como materia prima las primeras fuentes censales de la Argentina que datan del siglo XIX. Para ello, se siguen una serie de pasos que se detallan a continuación: 
  1. Relevamiento de las primeras fuentes censales: se realiza una búsqueda de los primeros censos nacionales y se examinan el Primer Censo nacional del año 1864 y el Segundo Censo de 1895.
  2. Identificación de datos sobre bibliotecas: se efectúa un examen exhaustivo de las mismas para identificar si las bibliotecas están incluidas en el relevamiento. De ser así, se estudian la cobertura, cuestiones metodológicas, falencias y las variables medidas.
  3. Elaboración de una guía de buenas prácticas sobre datos abiertos: se revisan las recomendaciones para la apertura de datos impulsadas por los gobiernos de Argentina y España. En base a ello, se definen los criterios básicos que se aplicarán en este proceso y se redacta una guía orientativa.
  4. Preparación de los datos tabulares para su publicación como archivo en formato CSV (Comma Separated Values): los datos seleccionados se transcriben manualmente en un bloc de notas donde la primera línea (cabecera) son las variables, separadas por comas y cada valor es una fila. Así, se crea y guarda como CSV. Este es un formato muy popular y fácil de procesar e interpretar por las personas y las máquinas. 
  5. Redacción de un diccionario de datos: documento que permite que los reutilizadores puedan interpretar correctamente los conjuntos de datos que se publican. Si bien no existe una única forma de elaborarlos, se opta por seguir un modelo básico que provea información sobre los campos o variables que se miden, formato, cualquier código utilizado, valores, cuestiones metodológicas, entre otros elementos. Además, pueden incluir la fuente de los datos, métodos de muestreo, cualquier transformación sufrida, estándares utilizados, cuestiones de calidad. En este caso, el formato elegido es el PDF.
  6. Almacenamiento y testeo del archivo csv: se procede a la guarda del archivo utilizando una nomenclatura clara para su nombramiento según las recomendaciones seguidas en este proceso. También se efectúan testeos rápidos del recurso desde el programa Excel.
Pueden conocer cómo se llevó a cabo el procesamiento de los datos censales y los resultados obtenidos accediendo al texto completo del artículo desde aquí.

Comentarios

Entradas populares