Big data, Open data, Research data.... ¿y las bibliotecas cómo participan?

El universo de los datos es demasiado amplio, razón por la cual es muy sencillo perderse. Existen diversos términos en la bibliografía científica o no, que hacen referencia a los datos: big data, open data, research data, linked data, open linked data, data science, data mining y otros.

Para comenzar a movernos dentro del mundo de los datos, comparto esta ilustración donde los datos abiertos se definen en relación con otros tipos de datos, especialmente los datos masivos. 


Open Data o Datos abiertos, considerada una filosofía que propone poner a disposición de toda la sociedad los datos que recopilan, gestionan y almacenan los organismos públicos durante el desarrollo de sus funciones. Se refiere al acceso abierto a los datos.

Los datos abiertos están muy vinculados con el de gobierno abierto. Es importante destacar que estos datos pueden provenir no solo de gobiernos sino de otras instituciones o empresas y de los individuos.

Entonces, los datos abiertos describen cuán líquidos y transferibles son los datos y los datos masivos describen el tamaño y la complejidad de los conjuntos de datos. El grado en el que esos datos masivos son líquidos  indican si están o no abiertos.

Se puede definir a los Big Data o Datos masivos como la tendencia tecnológica basada en el análisis masivo de datos que no pueden ser procesados o analizados utilizando herramientas tradicionales (IBM). Implica trabajar con una arquitectura tecnológica especial. Para caracterizarlos se habla de las 3Vs o modelo de las 3 Vs que hacen referencia a tres dimensiones consideradas grandes en el mundo de los datos masivos. Cabe destacar que algunos autores incorporar un cuarto aspecto.



Volumen: gran cantidad de datos que exceden la capacidad de procesamiento de las bases de datos convencionales.

Velocidad alta en que los datos son generados y transferidos.

Variedad: las fuentes de las que proceden y los tipos de datos que se procesan pueden ser muy diferentes.

Veracidad: los datos deben ser fiables.



En el gráfico también se incluye a "Mis datos" que implica compartir información recolectada sobre un individuo (organismo) con ese individuo como sucede con las historias clínicas de los pacientes. 

En el sector de la ciencia aparece un concepto amplio como el open research science que significa acceso abierto a la ciencia y que engloba el open access y open research data (acceso abierto a las datos de investigación).

¿Qué pasa en las bibliotecas? ¿Cómo podemos contribuir en el mundo de los datos?


En las bibliotecas públicas

Se proponen algunas líneas de acción en base a la bibliografía examinada para implementar en las bibliotecas públicas y también gubernamentales y así transformar a las bibliotecas en espacios de participación ciudadana. 

  • Apoyar la accesibilidad: diseñar guía que reúnan fuentes de información de calidad sobre datos abiertos y trabajar con los responsables de publicar los datos dentro de la organización para asegurarse que sean accesibles.
  • Formación de usuarios: implementación de un programa orientado a la alfabetización sobre datos que abarquen desde el uso de la plataforma institucional para su máximo aprovechamiento hasta cuestiones vinculadas a la propiedad intelectual, derechos de autor, privacidad, licencias, metadatos, buenas prácticas, etc.
  • Organizar y estimular eventos (hackathones) que ayuden a crear aplicaciones que permitan utilizar estos conjuntos de datos.
  • Analizar, visualizar y crear contenidos que pongan en valor los conjuntos de datos y promuevan la toma de conciencia y la participación ciudadana.

En las bibliotecas académicas

Los datos en las bibliotecas académicas han irrumpido desde la publicación de "OECD Principles and guidelines for access to research data from public funding" donde se instaba a los líderes políticos/científicos a impulsar políticas para facilitar el acceso a los datos de investigación financiados con fondos públicos. Aquí se definen a los denominados Research data de fondos públicos como datos de investigación obtenidos de investigaciones conducidas por agencias de gobierno o departamentos, o llevadas a cabo usando fondos públicos. La idea que prima es que los retos de la humanidad son globales y que había que aprovechar las nuevas tecnologías para mejorar el retorno de inversión que hacen las instituciones públicas cuando financian la investigación (Hernández-Pérez, 2016).


En las próximas publicaciones, voy a compartir diferentes experiencias de las bibliotecas en el mundo de los datos.


Fuentes consultadas:

Dobrecky, L.P. (2017). Datos abiertos: iniciativas y nuevos desafíos en el sector agrícola de la Argentina. Knowledge Management for Development Journal, 13 (2).

Ferrer-Sapena, A.; Sánchez-Pérez, E. (2013). Open data, big data: ¿hacia dónde nos dirigimos?. Anuario ThinkEPI, v. 7.

Hernández-Pérez, T. (2016). En la era de la web de los datos: primero datos abiertos, después datos masivos. El profesional de la información, 25(4).

McKinsey Global Institute. Open data: Unlocking innovation and perfomance with liquid information.

Iglesia Aparicio, J. Tecnología web. [Apunte de curso]

Ortíz, M. Big data y visualización de datos. [Apunte de curso]







Comentarios

Entradas populares