3 ARCHIVOS

blog del Taller de Empleo Conservación y Archivo del Patrimonio Fotográfico

Introducción a los metadatos

Posted by agnieszka en enero 30, 2008

¿Qué son los metadatos?

Se puede definir los metadatos como un conjunto de datos relativos a un recurso digital, que permiten catalogar, identificar, describir y localizar este recurso, y además proporcionan una información adicional sobre sus características (básicamente el contenido, el contexto y la estructura). Este concepto es análogo al uso de índices y fichas catalográficas en bibliotecas, donde una serie de datos (autor, titulo, IBSN, fecha lugar de publicación, etc.) describen y ayudan a buscar libros. En un sentido amplio, una ficha catalogrfica se puede considerar un conjunto de metadatos. Sin embargo, se suele utilizar la palabra “metadatos” en un sentido estricto, definido por Berners Lee y el World Wide Web Consortium: “Los metadatos son información inteligible para el ordenador sobre recursos Web u otras cosas” (Tim Berners-Lee, Metadata Architecture).

Ya en el momento del surgimiento de catálogos informáticos en bibliotecas surgió la necesidad que las bibliotecas comparten unas normas internacionales de catalogación que permitan el intercambio de información y la integración de catálogos de varias bibliotecas, para facilitar la búsqueda en varias bases de datos a la vez. Con la aparición del Internet y la World Wide Web, cuando la función principal de metadatos se definió como describir los recursos que se encontraban en la Web, el problema de estandarización resultó todavía más urgente.

La digitalización de los fondos de archivos, museos, bibliotecas, empresas, editoriales, prensa etc. y la gestión de esos recursos en la red (sea Internet o intranet) resultó en un cambio de perspectiva hacia la catalogación. Mientras que las fichas catalográficas eran creadas manualmente por un bibliotecario o un archivero posteriormente a la creación/adquisición del documento, algunos metadatos se generan automáticamente en el momento de la creación del recurso, otros son introducidos manualmente, pero en mayoría de las veces también en las primeras etapas del ciclo de vida del documento, y el sistema de catalogación –para ser viable, útil adecuado- debe crearse antes de la producción de los recursos.

Categorías de metadatos

Las tres categorías básicas de metadatos son (ver tabla con explicación sacada del Tutorial de digitalización de imágenes
de la Cornell Library):

Metadatos descriptivos. Descripción e identificación de recursos de información

  • en el nivel (sistema) local para permitir la búsqueda y la recuperación (por ejemplo, búsqueda de una colección de imágenes para encontrar pinturas con ilustraciones de animales);
  • en el nivel Web, permite a los usuarios descubrir recursos (por ejemplo, búsqueda en la Web para encontrar colecciones digitalizadas sobre poesía).

Metadatos estructurales. Facilitan la navegación y presentación de recursos electrónicos

  • proporcionan información sobre la estructura interna de los recursos, incluyendo página, sección, capítulo, numeración, índices, y tabla de contenidos; describen la relación entre los materiales (por ejemplo, la fotografía B fue incluida en el manuscrito A);
  • unen los archivos y los textos relacionados (por ejemplo, el ArchivoA es el formato JPEG de la imagen de archivo del ArchivoB).

Metadatos administrativos. Facilitan la gestión y procesamiento de las colecciones digitales tanto a corto como a largo plazo

  • incluyen datos técnicos sobre la creación y el control de calidad;
  • incluyen gestión de derechos y requisitos de control de acceso y utilización;
  • información sobre acción de preservación.

La tipología expuesta arriba es sólo una de las existentes y no es nada exhaustiva. Como ejemplo, podemos ver también el esquema propuesto por Ann J. Gilliland-Swetland (ver fuente), que propone cinco categorías de metadatos: los administrativos (usados en la gestión y administración de recursos de información), los descriptivos (usados para representar recursos de información), los metadatos de preservación (para salvaguardar los recursos de información), técnicos (relativos a cómo funcionan los sistemas o el comportamiento de los metadatos), y de uso (relaticos al nivel y tipo de uso que se hace con los recursos informativos).

Además, se puede establecer otras tipologías en función de diversos elementos como pueden ser la fuente, los métodos de creación, la naturaleza de sus productores, la permanencia dentro del sistema, la estructura o la semántica de los metadatos (ver artículo del Grupo FORIS sobre la metadescripción [doc]).

Actualmente existen varios esquemas y formatos de metadatos, dependiendo del carácter de los recursos tratados, las necesidades de varias instituciones gestoras de la información digital (bibliotecas, archivos, centros de documentación…), pero como dice Isabel Daudinot Founier en su artículo Descripción de los recursos de información en Internet: formato Dublín Core, todos deben reunir las siguientes características considerarse como verdaderos formatos de metadatos:

  • Independientemente del área del conocimiento para la cual se utilicen, todos los formatos deben responder a las particularidades de los recursos de información de la red para facilitar su identificación y ulterior recuperación.
  • Todos los esquemas tienen un número limitado de elementos, un nombre para cada elemento o etiqueta y un significado asociado a cada elemento.
  • Todos contienen también, una semántica descriptiva con información relativa al contenido, ubicación, atributos físicos, tipo de documento, etcétera.

Codificación de metadatos

En todo caso, para poder ser leído por los ordenadores, los metadatos necesitan tener sintaxis o codificación apropiada. Los esquemas de codificación de metadatos más importantes son:

  • HTML (Hyper-Text Markup Language)
  • SGML (Standard Generalised Markup Language)
  • XML (eXtensible Markup Language)
  • RDF (Resource Description Framework)
  • MARC (MAchine Readable Cataloging)
  • MIME (Multipurpose Internet Mail Extensions)

Un ejemplo sencillo de metadatos son los conocidos “meta tags” incluidos en el código fuente de las páginas Web, que permiten que los motores de búsqueda (como Google) indicen esas páginas para su búsqueda y recuperación. Se insertan dentro del elemento HEAD (cabecera) de la página, y no se visualizan en los navegadores – son datos de interés para las máquinas y no para los humanos.

<head>
<title>Fundacion Santa Maria la Real – Centro de Estudios del Romanico</title>
<meta name=”Description” content=”Fundación cultural enfocada a todos los aspectos del románico y de la promoción del patrimonio en general” >
<meta name=”keywords” content=”arquitectura románica, románico, turismo cultural, romanesque, enciclopedia, patrimonio, escuela taller, fundacion, aguilar de campoo, palencia, medieval, campoo, aguilar” />
</head>

Como se puede ver en el ejemplo, los meta tags se indica mediante el código meta name= al que sigue, entre paréntesis, en nombre del metadato en cuestión (por ejemplo, meta name=”description”, es decir, descripción o resumen de la página). Después de content= se introduce -otra vez entre paréntesis- el texto deseado. Otro ejemplo es meta name=”keywords”, es decir, las palabras claves con las que queremos indizar nuestra página.

Además, dentro del mismo elemento HEAD se puede introducir otros metadatos (como por ejemplo los metadatos Dublín Core) siempre que vienen codificados según un esquema entendible para los motores de búsqueda.


<head>
<title> Introducción a los metadatos </title>
<meta name=”DC.Title” content=” Introducción a los metadatos “>
<meta name=”DC.Creator” content=”Swiatecka, Agnieszka”>
<meta name=”DC.Type” content=”text”>
<meta name=”DC.Date” content=”2008″>
<meta name=”DC.Format” content=”text/html”>
</head>

El ejemplo que vimos demuestra que los metadatos pueden ser codificados dentro del mismo documento, en este caso, una página Web. Sin embargo, los metadatos sirven para una variedad de fines y tipos de recursos. ¿Cómo aplicar los metadatos en documentos que no son páginas Web, y su indización, búsqueda y recuperación se realiza mediante un software especializado distinto a los motores de búsqueda y los navegadores?

Existen tres métodos de asignar los metadatos:

  • En un documento separado, o fichero vinculado al recurso en cuestión. Se utiliza sobre todo para material multimedia, imágenes, etc. Para indizar estos metadatos se necesita unas herramientas específicas.
  • En una base de datos, es decir, independientemente del recurso. La mayoría de las bases de datos sirven para el uso interno de organizaciones y su contenido no es accesible a los motores de búsqueda.
  • Incrustados dentro del propio documento, como los meta tags de las páginas Web.

Para aprender más, os recomiendo dos recursos que reúnen información básica sobre los metadatos:

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

 
A %d blogueros les gusta esto: