viernes, 10 de octubre de 2014

Metadatos: concepto, características y curiosidades.

En esta entrada, se va a tratar un lenguaje de registro de información que se encuentra dentro de la Web, ya que así como existe un registro para cualquier material tangible como un libro, una pintura, incluso una escultura o una persona; también existen formas y códigos de registro para materiales intangibles que se encuentran en un entorno digital. Estos materiales intangibles y digitales están formados por paquetes de datos que le dan a la pantalla esa apariencia específica. Entonces, ¿cómo se pueden registrar estos paquetes de datos?

Recuerda que tus archivos de computadora están formados por estos paquetes, los cuales trabajan detrás de las letras y aplicaciones que usas día tras día; estos grupos de datos forman: imágenes, audio y otros programas que utilizas en tu computadora. A partir de este punto, no sólo hay que preguntarse el cómo se registran, también el porqué y el para qué se deben de registrar estos materiales. 




Concepto

Para todas estas preguntas, existe una respuesta: los Metadatos, que son información entendible para la máquina y describe los recursos que se encuentran en un entorno digital. En pocas palabras, son los " datos sobre los datos" (de ahí el prefijo "meta").

Tim Berners Lee, explica que la frase "para la máquina", es clave para entender la función de los metadatos, esto se debe a la forma en como ésta maneja la información. Una computadora recupera la información a través de palabras clave, un ejemplo sería el siguiente: si tú buscas "permanente", la red pondrá a tu disposición todo lo que encuentre sobre "permanente", y esto quiere decir TODO, desde el significado de la palabra hasta el proceso de micropigmentación que realizan los salones de belleza. Por eso, a la hora de recuperar o buscar la información se debe de conocer las herramientas para recuperar lo que se necesita, como los operadores booleanos. 

Aquí entran los metadatos, que fueron creados para que los agentes de software puedan utilizarlos y con ello faciliten la búsqueda y recuperación de la información. ¿Cómo logran esto los metadatos? Pues contienen semántica y estructura bien definida, que además contribuye al movimiento de la World Wide Web Consortium, el cual a través de una serie de actividades tiende a la creación de tecnologías para publicar datos entendibles por aplicaciones informáticas. En lenguaje natural y con un ejemplo, se busca que la máquina entienda la diferencia entre la palabra "permanente" y el proceso de "permanente" que se realiza en los salones de belleza.  


El primer paso para este enorme movimiento, es hacer un sistema de información sobre la información. Para un ejemplo de metadatos, cuando se recupera un objeto utilizando el protocolo HTTP, el protocolo permite recuperar la información sobre su fecha de creación, su fecha de caducidad, su propietario, y otra información arbitraria que se envió por el servidor. 

Se clasifican usando tres criterios: Contenido. Variabilidad y Función.

Características


El primer criterio, consiste en describir el contenido del recurso, por ejemplo, para separar los metadatos que describen el sentido del contenido. El segundo criterio, distingue metadatos mutables e inmutables; el primero difiere de parte a parte, como un vídeo, el segundo no se modifica, por ejemplo el nombre de un fichero. Mientras que el tercer criterio tiene tres capas: sub-simbólicos que no contienen información sobre su significado, los simbólicos que le añaden un sentido y los lógicos que describen datos sub simbólicos, lo que les otorga comprensión.

Voutssás menciona algunas de las características relevantes de los metadatos:
  • No tienen que ser digitales por fuerza. De hecho, menciona que los profesionales de la información han creado conceptos y herramientas de acceso durante milenios. Actualmente, estos datos se agregan en forma digital a los sistemas de información.
  • Tienen que ver con algo más que la simple descripción de un objeto, ya que también pueden indicar contexto, administración, procesamiento, en fin, algunos aspectos especiales que indican función, etc.
  • Pueden venir de una gran variedad de fuentes, ser creados por una persona, computadora e incluso hipervínculos.
  • Pueden ser creados, modificados, aumentados, etcétera, durante la vida del recurso.
  • El metadato de un objeto documental puede ser simultáneamente el contenido de otro objeto documental.
Además de tener diferentes tipos de metadatos, cómo se muestra en el siguiente cuadro:

Fuente: http://archivoempresa.files.wordpress.com/2013/09/cuadro-archivo4.jpg
Lenguajes

Cabe destacar, que los metadatos tienen una gran variedad de formatos y estándares, los cuales son creados para cubrir ciertas necesidades específicas para cierta comunidad, recurso o institución. Algunos ejemplos son: 

  • MODSMetadata Object Description Schema. http://www.loc.gov/standards/mods/ Es un esquema de metadatos descriptivo que se deriva del MARC 21 y que intenta permite crear la descripción de recursos originales o seleccionar los registros existentes en MARC 21. Utiliza el lenguaje y la sintaxis XML y puede utilizarse como un formato específico de la Próxima Generación de Z39.50.
  •  EADEncoded Archival Description. http://www.loc.gov/ead/ Se trata de un proyecto internacional que desarrolla pautas para el marcado de textos electrónicos (novelas, obras de teatro, poesía, etc.) y se enfoca al campo de las humanidades.
  •  CIMIComputer Interchange of Museum Information. http://www.cimi.org/ (El Consorcio cerró sus operaciones en 2003).
Al observar estos ejemplos, cabe destacar que estos metadatos tienen aplicaciones distintas, hay desde metadatos para descripción de recursos geoespaciales, contenidos multimedia, objetos de aprendizaje, generales, administrativos, gubernamentales, en fin, no sólo hay una gran variedad de formatos y estándares por las aplicaciones, también por las características del recurso que se está catalogando, lo que vuelve a los metadatos una opción flexible y excelente para los diversos formatos que existen actualmente. 

Metadatos en Bibliotecas

Voutssás menciona que los metadatos en sí no suponen algo muy nuevo dentro del mundo bibliotecario. De hecho, menciona que por mucho tiempo se afirmó que el primer catálogo en la historia de las bibliotecas se remonta a veintitrés siglos atrás y fue el registro temático de la Biblioteca de Alejandría denominado Pinakes, en ese tiempo Calímaco de Cirene estaba a cargo. Explica también que los metadatos, como concepto, existen en las bibliotecas desde que el primer encargado de una de ellas hizo un listado de las tabletas que se encontraban en su colección, hace cinco mil años. Otro ejemplo, según Voutssás, es la famosa Bibliotheca Universalis de Konrad de 1545, que se realizó a partir de una bibliografía universal de este escritor que recogió todos los libros impresos en Europa en latín, griego y hebreo; se trata de la primera bibliografía general que resulta ser un gran metadato por cinco siglos. 

Uno más práctico y que conocemos en la formación profesional, es MARC 21 (MAchine Readable Cataloguing) que desde la década de los sesenta fue creado para que los registros bibliográficos fueran más fáciles de intercambiar y de manipular. Empezó en la Biblioteca del Congreso y se fue desarrollando en diferentes bibliotecas, creando diferentes versiones de MARC, hasta que la ISO (International Organization for Standarization) empezó a normalizarlo y así se creó la versión de MARC que utilizamos ahora. 

Conclusión

Metadatos, una herramienta increíblemente compleja y a la vez tan sencilla en su aplicación. Desde hace mucho tiempo, llama la atención la recuperación, la búsqueda y el registro de la información en la Web. Sin embargo, creo que muy pocos consideraron que este sistema de información sobre la información, fuera la estructura de algo tan grande e innovador como la Web semántica y las ontologías, que son la base de la Web 3.0, entre otros proyectos del futuro en el mundo de la información.

Conocer estas herramientas, no por la estructura y base informática que tienen la cual está basada en lenguajes de programación y sistemas informáticos, sino por su concepto, por la teoría de aplicación y sus principios básicos; los cuales son la organización, el registro y manejo de la información para su fácil recuperación e identificación.

Conocerlas, nos permiten desarrollar nuevas; desarrollarlas nos permiten crear nuevos mundos y sistemas eficaces para tener una increíble red de información formada por recursos multimedia, páginas web, textos, bases de datos, en fin, pone en nuestra pantalla, una ventana que abre muchas posibilidades no sólo para el usuario, también para el profesional de la información.

Espero que esta entrada les haya sido útil y gracias por leer a la Aprendiz de la Información. 



BIBLIOGRAFÍA


Berners Lee, Tim. Metadata Architecture. Disponible en: www.w3.org/DesignIssues/Metadata.html

Voutssás Márquez, Juan. Bibliotecas y publicaciones digitales. México: UNAM, Centro Universitario de Investigaciones Bibliotecológicas, 2006. 342 p. ISBN: 970-32-3962-5

Saiz, Javier. Archivo de Empresa. Disponible en: http://archivoempresa.files.wordpress.com/2013/09/cuadro-archivo4.jpg

Lamarca Lapuente, María Jesús. Hipertexto, el nuevo concepto de documento en la cultura de la imagen. Disponible en:

No hay comentarios:

Publicar un comentario