Datos, información y conocimiento: algunas aclaraciones

Datos, datos y más datos. No sólo estamos rodeados de ellos, sino que constantemente ayudamos a generarlos y no nos damos cuenta. En este contexto, l@s bibliotecari@s tenemos la oportunidad de ampliar nuestro campo de acción, centrado más que nada en la información, incorporando a los datos y así volver a los cimientos de la “pirámide del conocimiento”.


Para volver a las bases, necesitamos conocer a la materia prima de la información. Entonces, ¿qué son los datos?

La palabra dato proviene del latín Datum y significa “dado, lo que se da”. En este sentido, los datos son elementos crudos que pueden ser abstraídos de un fenómeno, medidos y registrados en distintas formas. Sin embargo, en el uso general los datos se refieren a aquellos elementos que son tomados, extraídos de observaciones, computadoras, experimentos y registrados. Algunos autores enfatizan la naturaleza extractiva de su obtención, ya que no existen por sí solos, en estado puro en la naturaleza, la mayoría de las veces son generados, incluso manufacturados por personas o máquinas. Así se acerca más a la idea de “capta o capturado” más que “dado”. Johanna Drucker propuso el término “capta” para suplantar al de dato, haciendo así referencia a dato (activo), el que se ha recogido, proporcionado.

También hay que destacar que los datos no tienen un carácter neutro, objetivo. Los datos no representan al mundo, sino que son construcciones referidas al él.

Existen muchas formas de definir a los datos. Presento sólo alguna de ellas:

 “Mínima unidad semántica y se corresponden con elementos primarios de información (un número de teléfono, el nombre de una persona) que por sí solos son irrelevantes como apoyo a la toma de decisiones”.

“Conjunto discreto de valores, que no dicen nada sobre el porqué de las coas y no son orientativos para la acción”. Los datos describen sólo únicamente una parte de lo que pasa en la realidad y no proporcionan valor o interpretaciones, y por lo tanto no son orientativos para la acción.

Los datos pueden tomar distintas formas materiales incluyendo números, textos, símbolos, imágenes, sonidos, etc. En general se los divide en dos grandes categorías:

1. Cuantitativos: Se expresan en formato numérico. Son extensivos y se relacionan con las propiedades físicas de un fenómeno (peso, altura, velocidad) o son representativos y se relacionan con características no físicas (clase social, logro académico, ranking de calidad de vida). Según su rango que tengan se dividen en:

1.1. Discretos: sólo pueden tomar determinados valores numéricos (por ejemplo: edad).

1.2. Continuos: pueden tomar cualquier valor dentro de un rango (por ejemplo: velocidad del auto). 

2. Cualitativos: son descriptivos y no se pueden medir. En general se procesan para convertirlos en cuantitativos y así obtener conclusiones.
Según su forma, pueden ser estructurados, semi-estructurados y no estructurados:

Estructurados: pueden ser fácilmente organizados, almacenados y transferidos en un modelo definido, presentados en una tabla o base de datos relacional que tiene un formato consistente. Estos datos pueden ser procesados, buscados, interrogados, combinados y analizados en forma directa usando cálculos y algoritmos; se pueden visualizar y procesar con facilidad.
Semi-estructurados: datos vagamente estructurados, no tiene un esquema o modelo predefinido de datos. Esas estructuras son irregulares, implícitas, flexibles y anidadas jerárquicamente, pero tienen un conjunto de campos razonablemente consistentes y de datos etiquetados (por ejemplo: etiquetas XML en un página web)

No estructurados: no tienen un modelo definido de datos o una estructura identificable. Cada elemento como texto o fotos, pueden tener una estructura especial o formato, pero no todos los datos dentro de un dataset comparten la misma estructura. Usualmente son cualitativos en su naturaleza, pero a menudo se pueden convertir en estructurados por medio de una clasificación y categorización.

Los datos se pueden transformar en información si se les añade valor, ya sea:

  • Contextualizando: se sabe en qué contexto y para qué propósito se generaron los datos
  • Categorizando: se conocen las unidades de medida que ayudan a interpretarlos
  • Calculando: los datos pueden haber sido procesados matemática o estadísticamente
  • Corrigiendo: se han eliminado los errores o inconsistencias
  • Condensando: los datos se han podido resumir de forma más concisa.

Existen diversas opiniones acerca de lo que es la información. Para algunos son datos procesados, organizados, estructurados o presentados en un contexto determinado que la vuelve útil; una acumulación de datos asociados; datos a los que se les suma sentido. Veamos algunas definiciones:

“Conjunto de datos procesados y transmitidos por un medio, que tienen un significado (relevancia, propósito y contexto) y que por lo tanto, son de utilidad para quien debe tomar la decisión”.

“Datos representados de forma comprensible a los que se les ha asignado un significado en un contexto” (Dictionary of Library and Information Science)



Ahora, vamos a subir un peldaño más para llegar al conocimiento que se deriva de la información. Justamente, para que esto suceda es necesario realizar diferentes acciones como ser: comparaciones con otros elementos, predicción de consecuencias, búsqueda de conexiones con otros datos y conversaciones con otros portadores de conocimiento. Así, se lo puede entender como una mezcla de experiencia, valores, información y saber hace que sirve como marco para la incorporación de nuevas experiencias e información, y es útil para la acción. (Davenpot y Prussak citado por Carrión)



Fuentes consultadas:

Carrión, Juan. Diferencia entre dato, información y conocimiento. [http://iibi.unam.mx/]

Llexià-Fortuño, M.; Montesó-Curto, P. Investigación en enfermería: teoría y práctica. Tarragona: Urv, 2017.

Kitchin, R. The data revolution. London: SAGE, 2014.

Drucker, J. (2011). Humanities Approaches to Graphical Display. Digital Humanities Quarterly, 5 (1).

Iglesia Aparicio, J. Tecnología web. [Apunte de curso]

Ortíz, M. Big data y visualización de datos. [Apunte de curso]

Comentarios

Entradas populares