9b994ec3022fa0781bca4281e1741158.ppt
- Количество слайдов: 144
Curso IDEs (Bloque 4) [IGN + UPM] con financiación de la AECI Madrid, junio-julio de 2006 Perspectiva de las IDEs desde la Documentación: Formatos y metadatos (MARC 21, DC, etc. ) Dra. Eva Méndez. Universidad Carlos III de Madrid Junio de 2006 Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España.
Contenidos n Introducción a la Documentación. n n La Documentación y las bibliotecas ante la Web. n n n Biblioteconomía y Documentación: visión tradicional. La descripción bibliográfica y sus estándares: Normativa internacional para el intercambio de registros bibliográficos. Los materiales especiales (mapas) en las bibliotecas y servicios de información. Importancia de la Documentación ante la WWW. Organización de objetos de información digital (DLOs): La necesidad de Metadatos. Modelos y estándares de descripción bibliográfica para la WWW n Estándares y formatos de metadatos: n n Metadatos de propósito general: MARC y Dublin Core Metadatos de propósito específico: FGDC, ISO 19115… otros MARC 21 y estándares de “catalogación” Dublin Core y estándares de “metadatos” Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 2
En esta sesión vamos a aprender… n n n La importancia de la biblioteconomía y documentación en la organización de registros de conocimiento. El proceso de la catalogación tradicional y los estándares utilizados. El proceso de la descripción de objetos digitales a través de metadatos y la catalogación de recursos electrónicos. Distinguir modelos y esquemas de metadatos, con especial atención al formato MARC 21 y al Dublin Core. Diferenciar un registro bibliográfico de un registro de metadatos. Analizar los elementos del Dublin Core y sus principios de uso y características aplicables a cualquier objeto de información digital (también, mapas). Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 3
Introducción a la Documentación: Visión tradicional Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 4
Definición tradicional de Biblioteconomía y Documentación: Orígenes y concepto n n Desde que existen depósitos documentales actividades desarrolladas para organizar los fondos de los mismos. Biblioteconomía (1633), acuñado por Gabriel Naudé, autor de la obra que será considerada como el primer tratado de biblioteconomía Advis pour dresser une bibliothèque. Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 5
Definición tradicional de Biblioteconomía y Documentación: Orígenes y concepto n n Siglo XIX cuando nace verdaderamente la «ciencia de la biblioteca» . Aparecen las bibliotecas públicas, como consecuencia de la popularización de la cultura que supuso la revolución industrial. Definición: disciplina científico-técnica que debe desarrollar los dos principios básicos de búsqueda y recuperación del documento. Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 6
Definición tradicional de Documento n Un documento es una información (poema, imagen, mapa, texto, música. . . ) que permanece en un soporte. SOPORTE DOCUMENTO INFORMACIÓN Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 7
Definición de Documento especial n Documentos que exigen para su descripción bibliográfica ciertas reglas que hagan mención a las características que los distinguen, ya sea en cuanto a su especial contenido o al soporte en que se encierra la información que se pretende catalogar. (Reglas de catalogación) Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 8
Documento especial: tipos n n Manuscritos Materiales cartográficos y proyectables Música impresa Grabaciones sonoras n n n Microformas Películas y videograbaciones Archivos de ordenador Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 9
Proceso Documental Conjunto de operaciones y tareas que se realizan en el centro de información desde que se selecciona un documento hasta que es recuperado y utilizado por un usuario. FASES: n Selección y adquisición n Registro, sellado y signatura topográfica n Análisis documental n Almacenamiento y conservación del doc. n Difusión documental Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 10
Análisis Documental n n Análisis formal / Catalogación descriptiva / Descripción bibliográfica Análisis de Contenido / Clasificación e indización Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 11
Análisis formal / Catalogación descriptiva n n Descripción bibliográfica (ISBD) Elección y forma de los puntos de acceso n n Principal (autor, entidad, título) Secundarios (autor, entidad, título, serie) Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 12
Análisis formal / Catalogación descriptiva n Cada material tiene sus particularidades ISBD: n n Aunque se mantienen las áreas básicas de la descripción bibliográfica, hay que prestar especial atención a: n n n p. ej. : Mapas: área de datos matemáticos Área 3 Área 5: descripción física Área 7: Notas Forma del encabezamiento principal Especial dificultad: libro antiguo y manuscritos Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 13
Análisis de Contenido n Catalogación por materias o indización n n Tesauros / Listas de encabezamientos / Clasificaciones Resumen n Descripción de planos (documentos audiovisuales) Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 14
Descripción de recursos tradicional n n n Práctica bibliotecaria tradicional Sistemas de organización y representación del conocimiento Normas / estándares Semántica, sintaxis, contenido MARC, ISO 2709, ISBD (RC) Bibliotecas MARC ISBD Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 15
Descripción bibliográfica Registro Bibliográfico n n Descripción Bibliográfica: Proceso por el cual se describe de forma normalizada un documento, con vistas a su identificación bibliográfica. Ello supone la descripción de los datos que identificarían el título del documento, su autoría y la edición respecto a otras. Es un instrumento para el control bibliográfico. Registro bibliográfico. Es el resultado de la descripción de ítem (documento) que contiene todos sus datos bibliográficos, los puntos de acceso, los encabezamientos de materia y la clasificación. Un documento puede estar en cualquier soporte y constituir más de una unidad física. Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 16
ISBD: Norma internacional para la descripción bibliográfica n n ISBD Internacional Standard Bibliographic Description: Normalización internacional surgida en 1961 y redactada por la IFLA, que explica la estructura de los datos que permiten identificar un documento, así como el orden en que se deben recoger y el sistema de puntuación que se utilizará. Adaptaciones nacionales de las ISBD: Reglas de catalogación (RC, AACR 2 RDA) Estándares ISBD: http: //www. ifla. org/VI/3/nd 1/isbdspan. htm Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 17
Registro bibliográfico tradicional Punto de acceso principal Título propiamente dicho [designación general de la clase de documento]=Tít paralelo: subtítulo y/o información complementaria sobre el título / 1ª mención de responsabilidad ; otras menciones de responsabilidad. — Edición / mención de responsable de la edición. — Datos específicos de la clase de documento. — Lugar de edición: editor, año Descripción física. — (Título propiamente dicho de la serie / mención de responsabilidad relativa a la serie, nº normalizado de la serie ; nº de la serie. Título de la subserie, número normalizado de la subserie; número de subserie) Notas. — Número normalizado Puntos de acceso secundarios (1. Materia. I. Autor, entidad, título, serie) CDU Signatura topograf. Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 18
RRCC españolas n n n Cap. 1: Descripción bibliográfica general Cap. 3: Descripción de manuscritos Cap 4: Material cartográfico Cap 5: Materiales gráficos Cap 6: Materiales gráficos proyectables Cap. 7: Música impresa Cap. 8: Grabaciones sonoras Cap. 9: Microformas Cap. 10: Películas y videograbaciones Cap. 11: Archivos de ordenador (Rec. Electrónicos) Puntos de acceso y forma de encabezam: 14. 6 / 15. 4 Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 19
Materiales especiales: Características n n Opacidad Fragilidad Heterogeneidad de soporte y formatos Precisan aparatos lectores específicos Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 20
Materiales cartográficos n Se entiende por materiales cartográficos todos los documentos que representan, en su totalidad o en parte, la tierra o los cuerpos celestes a cualquier escala. Por ej: n n n n los mapas y planos en dos y tres dimensiones las cartas aeronáuticas, marinas y celestes los globos los bloques diagramas los cortes de terreno las fotografías aéreas los atlas, etc. . . Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 21
Áreas de descripción n n n n Área 1: Título y mención de responsabilidad Área 2: Edición Área 3: Área de datos específicos del tipo de documento (Datos matemáticos) Área 4: Publicación y distribución Área 5: Descripción física Área 6: Serie Área 7: Notas Área 8: ISBN y condiciones de adquisición Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 22
Orden de las fuentes El documento en sí mismo (fuente principal) Si está formado por varias unidades, el conjunto de todas ellas. El envase o caja, soporte o pie en el caso de los globos. Cuando no haya información disponible a partir de una fuente principal, se tomará del material anejo si existe. Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 23
Fuente principal por áreas Áreas 1, 2, 3, 4 y 6: Fuente principal Descripción física Notas ISBN Cualquier fuente Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 24
1. Título y mención de responsabilidad: n Elementos necesarios: n n Título propiamente dicho Subtítulo y/o información complementaria Mención de responsabilidad Elementos posibles: n n Designación general de la clase de documento [material cartográfico] Título paralelo. Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 25
Título propiamente dicho: casos n n En el caso de mapas y planos, se preferirá el título de la hoja al de la carátula Cuando no haya título, será necesario redactar uno facticio (área geográfica representada) Id. Cuando sólo aparezca el autor o responsable que pasará a la mención de responsabilidad Si aparece la escala o el número de la serie, formará parte del título. Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 26
/ mención de responsabilidad n n Si el nombre del autor aparece asociado a una entidad también responsable de la publicación ambos se incluirán en la mención de responsabilidad, poniendo en primer lugar el nombre de la entidad, a no ser que los nombres aparezcan unidos gramaticalmente. En mapas antiguos, si aparece incompleto el apellido del autor, puede completarse entre corchetes. Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 27
2. Área de edición n Elementos necesarios: n n n Mención de edición Mención de responsabilidad de edición Elementos posibles: n n n Mención de edición paralela Mención de edición adicional Mención de responsabilidad relativa a la edición adicional Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 28
3. Área de datos matemáticos DATOS MATEMÁTICOS n n Elementos necesarios: n n n Mención de escala (obligatorio). Mención de proyección. Mención del equinocio. Elementos posibles: n Mención de las coordenadas. escala ; proyección (coordenadas ; equinocio) Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 29
Ejemplo completo (mapa) Alcalá de Henares (Madrid). Planos de población. 1996 Alcalá de Henares / realización, Hispa-Weka. — Escala indeterminada. — Alcalá de Henares : Ayuntamiento, 1996 1 plano : col. ; 38 x 47 cm Alrededor información comercial. Inserta: Relación de lugares de interés y su localización en el plano. Al verso: Callejero; lugares de interés con su explicación y teléfonos BE MAP 97 DL V 1500 -1996 I. Hispa-Weka. II. Alcalá de Henares. Ayuntamiento. III. (España). (460. 27 Alcalá de Henares) Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 30
MARC 21 n n n Formato MARC (MAchine Readable Cataloguing): Un registro MARC es un registro bibliográfico legible por máquina de tal forma que el ordenador puede interpretar los datos contenidos en un registro bibliográfico MARC 21 - Formato estándar internacional: http: //www. loc. gov/marc/ Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 31
MARC 21 n Objetivos básicos: n n n Evitar la duplicación de esfuerzos permitiendo que las bibliotecas intercambien / compartan sus registros Permitir a las bibliotecas utilizar sistemas de automatización. Garantizar el paso de un sistema automatizado a otro (SIGB) con la seguridad de que los datos continuarán siendo compatibles. Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 32
Fuentes ISBD-MARC 21 Áreas ISBD y Campos MARC 21: n Área de título, designación gral. de la clase de documento y mención de Responsabilidad Etiqueta 245 n Área de edición Etiqueta 250 n Área de publicación Etiqueta 260 n Área de descripción física Etiqueta 300 n Área de serie Etiquetas 440 ó 490 n Área de notas Etiquetas 5 xx n Área de ISBN Etiqueta 020 Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 33
MARC 21 n n MARC 21: formato internacional de descripción bibliográfica Componentes: n n n Marcado: conjuntos de elementos de datos Semántica: significado de los elementos numéricos (pero el contenido que debe llevar cada elemento se define por otros estándares –AACR, RDA, ISBD –) Estructura: sintaxis para la comunicación e intercambio de información http: //www. loc. gov/marc/ Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 34
Contexto MARC n n n Alto nivel de conformidad y número limitado de implementaciones Miles de sistemas MARC (IBERMARC, UKMARC, LCMARC, CATMARC, UNIMARC 21) Uso extendido de las utilidades bibliográficas y su implementación en SIGB. Más de 1 Billón de registros MARC en sistemas locales y sistemas de red (World. Cat= 1 billón Formato estandarizado de comunicación contenido predecible que ha permitido compartir registros. ISO 2709 -1996 Format for Information Exchange Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 35
Registro bibliográfico de un mapa: ISBD / MARC Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 36
Recuperación: Tipos de catálogos n Opciones: n n Catálogo individual para cada tipo de material (p. ej. ARIADNA) Catálogo integrado: Es lo más habitual, tanto en bibliotecas públicas, universitarias, etc. donde la proporción de materiales no librarios no supera nunca a las monografías. n Ventaja: Recuperación por materias (recuperación temática) en vez de formal. Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 37
La Documentación y las bibliotecas ante la Web. La necesidad de Metadatos Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 38
La Documentación Hoy n n n Internet en las bibliotecas y las bibliotecas en Internet Del OPAC al Web. PAC El reto de la biblioteca digital Toda suerte de sistemas y servicios de información digital. El reto de la descripción de objetos de información digital y de la interoperabilidad (metadatos) Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 39
La Documentación Hoy Contexto: Internet n n Internet: Fuente inagotable de recursos de información. Popularización del entorno WWW. Crecimiento exponencial de la información. Universo de Información: n n n Distribuido Heterogéneo Cambiante Dinámico Poco uniforme Disperso Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 40
Universo de información Web Volumen Variedad Volatilidad Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 41
La Web HOY n n Grandes cantidades de información. Mezcla de recursos de alta calidad o profesionales con sitios informales, personales, de información poco fiable, etc. Fundamentalmente para el hombre. Desarrollada como un “escaparate” para atraer clientes. Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 42
Universo de información Web Fuente: Stuart Weibel, Makx Dekkers (DCMI) Páginas Web Comercio Empresa Biblioteca Internet Datos científicos e. Gobierno Cualquiera. . . Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 43
La Web en el FUTURO (próximo) n Continuará la mezcla de calidades informativas: n n n Se mantendrán sitios personales Escaparates comerciales con un propósito real Los ordenadores utilizarán información estructurada de forma mucho más eficaz. Se necesita la integración de datos para permitir el procesamiento automático (OAI, z 39. 50, etc. ) SW (Web Semántica). . . “. . . is an extension of the current Web in wich information is given well-defined meaning, better enabling computers and people to work in cooperation” Tim Berners-Lee, James Hendler, Ora Lassila. The Semantic Web. Scientific American (Mayo 2001). Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 44
Problemas n Grandes conjuntos de datos: n n Las colecciones de datos y documentos digitales (DLO) son: n n Los formatos son heterogéneos y complejos. El coste del almacenamiento. Esos conjuntos de datos no tienen, en sí mismos, valor educativo. Necesidad de selección y dotar de valor añadido a la información. Grandes y diversas. Numerosas. Cambian rápidamente. Los sistemas de recuperación de información son: n n n Unas veces: potentes herramientas de software. Otras veces: islas semánticas. . . Siempre: . . . Insuficientes. Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 45
Información tradicional vs digital n Conocimiento científico y cultural en formatos tradicionales: n Conocimiento científico y cultural en formatos digitales: n e-books/ e-Journals / Páginas Web / portales / homepages. . . Bibliotecas digitales, colecciones virtuales, portales bibliográficos. . . Identificación inestable (URIs) – estabilizada (PURL, DOI, etc. ) Distribución / dispersión Libros / Revistas n n Bibliotecas / Catálogos n Identificación unívoca y n uniforme: ISBN, ISSN, NIPO, etc. n n Integración Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). n España. Eva Méndez. Universidad Carlos III de Madrid 46
3 Modelos bibliotecarios (Buckland) Biblioteca papel Biblioteca automatizada Papel Ordenador Biblioteca digital Colecciones Trabajo Técnico Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 47
El documento digital = DLO En la WWW no podemos hablar de libros ni de documentos sino de documentos entendidos como objetos de información digital. Cualquier unidad informativa (texto, imagen, sonido, vídeo, etc. ) en un formato de codificación numérica, para cuyo acceso son imprescindibles medios informáticos. Técnicamente, los DLOs están constituidos por: Su propio contenido (conjunto de bits). Las propiedades o metadatos asociados a él. Un registro de operaciones realizadas. Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 48
Descripción de recursos electrónicos: Tendencias ð Escuela de la catalogación Escuela de la estructuración información ISBD (ER) ð Formato USMARC (campo 856) ð MARC 21 ð HTML/XML / Metadatos (modelos) : ü Dublin Core ü TEI (Text Encoding Initiative), ü FGDC, ETC. ðRDF (Resource Description Framework) Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 49
DLOs: Problemas n n n ¿Cómo aislar DLOs? ¿Qué DLOs aislar? ¿Qué nivel de detalle se debe estipular para la descripción y análisis? ¿Cómo describir/organizar y recuperar DLOs? ¿Cómo identificar unívocamente los documentos digitales? ¿Cómo integrar distintos recursos, distintos DLOs para que sean interoperables? La información en la WWW es más un fenómeno que documentos aislables, identificables y que puedan ser integrados e interoperables fuera de sus “colecciones virtuales”. Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 50
Metadatos: concepto y fundamento Dos tendencias conceptuales “Todo metadatos” Enfoque del control bibliográfico Escuela de la catalogación Exhaustiva (WWW) Enfoque de la Gestión de datos Escuela estructuralista Descripciones estructuradas de un objeto de Catalogación Marcado información que tienen como finalidad hacer MARCútiles los datos. SGML/XML Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 51
Metadatos ¿Qué? n n n n . . . Datos sobre datos. . Descripciones estructuradas de un objeto de información. . Un conjunto de elementos y atributos para caracterizar la información. . Estándares semánticos para describir objetos de datos discretos, que precisan de una semántica y estructura. Su finalidad es. . . Describir y recuperar información Web. . Fundamentar la RI en sistemas y servicios de información digital. Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 52
Metadatos ¿por qué? n Justificación tradicional: n n para describir la información existente. para organizar el conocimiento. para poder encontrar y utilizar dicha información y/o conocimiento. Entorno Web: n n n Grandes cantidades de información en formato electrónico. Necesidad de aunar recursos en la Web. Oportunidad de proporcionar a los profesionales servicios de mayor calidad que Google etc. Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 53
Metadatos: tendencia y necesidad n n n n n Retos y oportunidades que ofrecen las NTICs para las industrias culturales (la digitalización masiva del patrimonio cultural). Necesidad de describir y estructurar los recursos digitales para cualificar el acceso a la información (subject/information gateways/repositorios, etc. ). Escaso uso en España y Latinoamérica de Sistemas y/o servicios de información digital que basen su funcionamiento, estructura y recuperación en metadatos. Poca conciencia del valor de la metainformación. Confusión: entre la moda y la vaguedad. . . Perspectiva Internacional del valor de los metadatos. Nivel de normalización estable: formalización de estándares. Servicios globales: Integración e interoperabilidad. Web Semántica (Semantic Web, SW). Metadatos (DC): Infraestructura operacional de la Web Semántica Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 54
Metadatos: tendencia y necesidad Tendencia hacia el acceso universal a las fuentes de información ¿Cómo recuperar información de calidad? n Comisión Europea y su Dirección General para la Sociedad de la Información, han instituido los principios para lograr la interoperabilidad y el acceso global a las bibliotecas digitales (Principios de Lund): n n n Mejorar la calidad y usabilidad de los contenidos, Promover el acceso unificado de los ciudadanos Sensibilizar sobre los problemas de conservación Elaboración de acuerdos sobre normas de interoperabilidad y de directrices para la preservación digital y longevidad de los contenidos. Favorecer la interoperabilidad y la recuperación continuada de recursos a través de metadatos, registros y esquemas. Fomentar una coherencia terminológica que favorezca el multilingüismo y la preservación de la identidad cultural. Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 55
Metadatos: ¿Quién y cuándo? CREACIÓN DE METADATOS CATALOGACIÓN “Arte” de cariz técnico DLOs Autor / creador Documentos Tradicionales e. CIP Autor de un recurso Editor de un DLO Catalogador MARC, etc. Agente XML/HTML, etc. Colecciones digitalizadas Servidor Declaración efectiva Mejor gestión 856 DC/RDF CORC Asignación de forma externa Retro-codificación Colecciones virtuales Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 56
Metadatos ¿para qué? Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 57
Tipos de metadatos (elementos de metadatos) n Cualquier modelo/esquema de metadatos contempla los siguientes tipos de metadatos, atendiendo a una clasificación funcional: n Descriptivos n n Administrativos n n Copyright, privilegios de uso, etc. Técnicos y estructurales n n Fecha del recurso, número de recurso, etc. Conservación y Derechos n n Título, autor, materias, etc. Tipo de fichero, tamaño del fichero, etc. Uso y gestión del sistema n Metadatos internos del creador de la metainformación. Especificidades de gestión. Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 58
Tipos de metadatos (Origen de los datos) n Dependientes del recurso n n Modelos semánticos de representación de las características básicas de un DLO. Dependientes del contenido n Catalogación Indización Modelos de representación de las materias y de las relaciones entre ellas (Tesauros, ontologías, etc. ). Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 59
Tipos de metadatos (Finalidad) 3 Niveles de metainformación: n n n Metadatos recuperación-sistema Metaetiquetas de búsqueda Web Metadatos de usuario/servicio Búsqueda local Búsqueda en BD propia Búsqueda texto completo Búsqueda global Búsqueda en SRII Búsqueda global Integrada Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 60
Modelos y estándares de descripción bibliográfica para la WWW Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 61
WWW: Marcado/edición digital n n Marcado de procedimiento o procesado (procedural): relativo a la apariencia física o de formato, restrictivo a cada sistema de edición electrónica de documentos, que no tiene ninguna implicación expresa para el contenido del documento. Marcado descriptivo o declarativo: identifica los elementos estructurales de un documento, determinando su estructura lógica. Se describe la estructura y/o el contenido de un documento n el contenido de los documentos marcados descriptivamente puede reutilizarse con distintas finalidades (p. ej. , la identificación de los elementos que describen un documento desde el punto de vista bibliográfico: título, autor, etc. , y/o de contenido= Metadatos: marcado semántico). Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 62
Metainformación & Marcado Semántica que no se ve (metadatos) ESTRUCTURA Lenguajes de marcado: HTML XML SMIL/SVG PRESENTACIÓN Hojas de estilo CSS Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 63
WWW: Lenguajes n HTML n n Estándar para formatear la información publicada en Ia Web, distribuida a través de HTTP. Diseñado principalmente para visualización de datos y se centra en cómo aparece la información, no en su estructura. Pobre mecanismo de descripción: metaetiquetas. XML n n Subconjunto de SGML: Lenguaje de marcas que añade información estructural y semántica (metadatos) a los propios datos. Enfocado a la descripción, no a la visualización. Metalenguaje que sirve para definir otros lenguajes de propósito específico (v. g. , XHTML, WML, XSL, RDF, etc. ) Múltiples representaciones de la información a través de metadatos. Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 64
Metadatos de propósito general Metadatos de propósito específico XML autodescriptivo n Incluso MARC n Etiquetas <meta> HTML n TEI-H Otros esquemas DCMI Application profiles RDFMS RDFS Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). XML DCMI España. Eva Méndez. Universidad Carlos III de Madrid RDF: metamodelo de metadatos Metadatos de propósito específico Metadatos de propósito general Modelos/formatos/esquemas. . . estándares de metadatos 65
Estándares y tecnologías para la SW Fuente: Oficina española W 3 C, basado en Tim Berners Lee, 2000: http: //www. w 3. org/2000/Talks/0906 -xmlwebtbl/slide 9 -0. html Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 66
Niveles de estándares para la Web n n n Normas en torno a la estructura de la información. Estándares sobre el contenido (reglas y sintaxis de datos) y su representación. Normas destinadas a la valoración semántica de los datos (vocabularios específicos). Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 67
Mapa de esquemas de metadatos Fuente: http: //mapageweb. umontreal. ca/turner/meta/english/metamap. html Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 68
Esquemas de propósito general: Modelos comunes n n Hay tantos modelos/ esquemas de metadatos, como disciplinas o dominios informativos. Pero nos vamos a centrar en dos modelos de propósito general: n n MARC 21 DUBLIN CORE (DC) Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 69
MARC 21 y el nuevo contexto de la catalogación n Importancia de los metadatos descriptivos n n n Mayor importancia de los catálogos bibliográficos (WEBPAC) Número creciente de metadatos descriptivos para diferentes necesidades. Mayor nivel de normalización de todo tipo de metadatos Los sistemas MARC se están remodelnado para hacer uso de la flexibilidad de XML Evolución gradual, proporcional a las grandes inversiones en sistemas MARC Necesidad de metadatos adicionales para recursos electrónicos Adaptar MARC a Internet Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 70
MARC 21: Formato n Marc 21 n n n Base de datos Bibliográfica Formato de comunicaciones Registros homogéneos Catálogos M A R C Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 71
¿Adaptar MARC a Internet? El crecimiento exponencial de recursos susceptibles de catalogarse o describirse obliga a plantear sistemas de indización descentralizados, que no requieran una formación tan compleja como la necesaria para trabajar con MARC, ni mecanismos de entrada de datos tan complejos. n n 1ª iniciativa de la LC (1992): inclusión del campo 856 (localización y acceso electrónico) en USMARC. Este campo permitiría crear un enlace entre un registro bibliográfico y un recurso remoto disponible en formato electrónico Proyectos: OCLC Internet Cataloging (1994 -1996); CATRIONA (CATaloguing and Retrieval of Information Over Network Applications). Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 72
¿Adaptar MARC a Internet? n n n 2ª iniciativa LC (1995) adaptar MARC a SGML: crear una DTD que permitiese la conversión de registros MARC/SGML/MARC sin perder información Se diseñaron 2 DTDs, para datos bibliográficos / fondos y para autoridades. Y una aplicación PERL para la conversión de MARC 2709 a MARC SGML Las DTDs se publicaron en mayo 1996. La utilidad de conversión se inició en julio 1997. En enero 1998 se hizo pública, cuando ya era inminente la migración a XML como metalenguaje para estructurar información electrónica. El 5 de junio 2002, la LOC Network Development and MARC Standards Office publicó un esquema XML para codificar registros MARC 21 Sustituye a la iniciativa anterior derivada de la DTD SGML: está previsto que sirva para codificar cualquier tipo de registro MARC (bibliográfico, autoridades, etc. ). Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 73
Interacciones entre estándares de metadatos n n MARC continuará intercambiándose, quizás en XML Las bibliotecas pueden recibir o necesitar integrar registros utilizando otros esquemas de metadatos (DC, ONIX, TEI, etc. ) Los metadatos descriptivos pueden ser parte de los objetos digitales en cualquier esquema XML (por ejemplo en TEI, FGDC) Uso cooperativo de metadatos para aumentar el acceso n n n OAI harvesting (Open Archives Initiative): http: //www. openarchives. org SRU/SRW (Search and Retrieve via URL/ for the Web): http: //www. loc. gov/standards/sru/ Reutilización y adaptación de metadatos existentes. Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 74
XML/Metadatos vs. MARC n n n MARC es un formato que permite codificar y transmitir un gran número de datos de una forma estandarizada y fácilmente procesable. (Tradición y experiencia= SIGB) MARC: excesivo nivel de detalle para descripción de RE; carece de elementos necesarios. XML elimina la complejidad del MARC a los desarrolladores, crea un marco más flexible de representación de la información electrónica. XML ofrece un sistema de codificación más simple y fácil de procesar que ISO 2709. XML formato “universal”, utilizado en cualquier tipo de aplicación. MARC, sólo en bibliotecas Se pretende evitar la segregación de MARC frente a otros formatos de metadatos Internet utilizados en los proyectos de biblioteca digital (ej. TEI, EAD, DC. ) Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 75
MARC 21 Evolución a XML Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 76
MARC 21 (2709) record (machine view) 00967 cam 2200277 a 4500 001000800000005001700008008004100025020005300229040001 80028205000240031208200210033610000357245007400387 260004400461300003500505440001200540500002000552650004 200572651002500614 3471394 19990429094819. 1 931129 s 1994 wauab 001 0 eng a 93047676 a 0898863872 (acid-free, recycled paper) : a. DLC c. DLC 00 a. GV 1046. G 3 b. G 47 1994 00 a 796. 6/4/0943 a. Slavinski, Nadine, d 1968 - 10 a. Germany by bike : b 20 tours g for discovery / c. Nadine Slavinski. a. Seattle, Wash. : b. Mountaineers, cc 1994. a 238 p. : bill. , maps ; c 22 c a. Includes index. 0 a. Bicycle touring z. Germany x. Guidebooks. Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 77
Adaptar MARC a Internet: MARCXML n El esquema XML forma parte de una iniciativa mayor que incluye el desarrollo de distintas aplicaciones: n n n Continuación lógica del proyecto de MARC en SGML MARCXML DTD: http: //www. loc. gov/marcxml. html#marcdtd MARCXML Schema: http: //www. loc. gov/standards/marcxml// Transformaciones entre MARC (2709) y otros modelos de metainformación (MARC (xml) Dublin Core y MODS (Metadata Object Description Schema) Hojas de estilo XSLT para la presentación de la información tanto en XML como HTML. También (Standford University Medical Center): http: //xmlmarc. stanford. edu XOBIS (XML Organic Bibliographic Information Schema): http: //xobis. stanford. edu Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 78
MARC 21 en XML – MARCXML n Un registro MARCXML implica: n n n Equivalencia exacta de un registro MARC (2709) Fácil conversión sin pérdida de datos entre registros MARC 21 -MARCXML Esquema XML flexible. No necesita cambiar, cuando MARC 21 cambie Posibilidades de presentación utilizando XSL y XSLT La biblioteca del Congreso tiene varios convertidores a/De MARC 21 http: //www. loc. gov/standards/marcxml Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 79
Ejemplo: MARC 21 (2709) A MARCXML <record xmlns="http: //www. loc. gov/MARC 21/slim"> <leader>00967 cam 2200277 a 4500</leader> <controlfield tag="001">3471394</controlfield> <controlfield tag="005">19990429094819. 1</controlfield> <controlfield tag="008">931129 s 1994 wauab 001 0 eng </controlfield> <datafield tag="020" ind 1=" " ind 2=" "> <subfield code="a">0898863872 (acid-free, recycled paper) : </subfield> <subfield code="c">$14. 95</subfield> </datafield> <datafield tag="040" ind 1=" " ind 2=" "> <subfield code="a">DLC</subfield> <subfield code="c">DLC</subfield> <subfield code="d">DLC</subfield> </datafield> <datafield tag="050" ind 1="0" ind 2="0"> <subfield code="a">GV 1046. G 3</subfield> <subfield code="b">G 47 1994</subfield> </datafield> <datafield tag="082" ind 1="0" ind 2="0"> <subfield code="a">796. 6/4/0943</subfield> <subfield code="2">20</subfield> </datafield> <datafield tag="100" ind 1="1" ind 2=" "> <subfield code="a">Slavinski, Nadine, </subfield> <subfield code="d">1968 -</subfield> Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). </datafield> España. Eva Méndez. Universidad Carlos III de Madrid 80
Ejemplo: MARC 21 (2709) A MARCXML <datafield tag="245" ind 1="1" ind 2="0"> <subfield code="a">Germany by bike : </subfield> <subfield code="b">20 tours geared for discovery /</subfield> <subfield code="c">Nadine Slavinski. </subfield> </datafield> <datafield tag="260" ind 1=" " ind 2=" "> <subfield code="a">Seattle, Wash. : </subfield> <subfield code="b">Mountaineers, </subfield> <subfield code="c">c 1994. </subfield> </datafield> <datafield tag="300" ind 1=" " ind 2=" "> <subfield code="a">238 p. : </subfield> <subfield code="b">ill. , maps ; </subfield> <subfield code="c">22 cm. </subfield> </datafield> <datafield tag="440" ind 1=" " ind 2="0"> <subfield code="a">By bike</subfield> </datafield> <datafield tag="500" ind 1=" " ind 2=" "> <subfield code="a">Includes index. </subfield> </datafield> <datafield tag="650" ind 1=" " ind 2="0"> <subfield code="a">Bicycle touring</subfield> <subfield code="z">Germany</subfield> <subfield code="x">Guidebooks. </subfield> Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). </datafield> España. Eva Méndez. Universidad Carlos III de Madrid </record> 81
Adaptar MARC a Internet: MODS n n Metadata Object Description Schema (schema de metadatos específico, de la LC): ofrece un mecanismo que permite describir recursos con XML utilizando un esquema que se sitúa a medio camino entre MARC y Dublin Core. Consta de 20 elementos - subconjunto del MARC 21 Format for Bibliographic Data (cada uno de ellos tiene subelementos a modo de cualificadores (v. DC) que matizan su semántica n Es más sofisticado que DC n No es tan complejo como MARC Es más compatible con MARC que otros esquemas (la pérdida de información en las transformaciones en menor) Ver. 3. 0. (rev. Oct 2003): http: //www. loc. gov/standards/mods/v 3/mods-3 -0 -draft-oct-9. xsd n n Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 82
Adaptar MARC a Internet: METS n n n Metadata Encoding y Transmission Standard Esquema específico LC de metadatos para la concepción de bibliotecas digitales Surge a finales de 2001 en el seno de la iniciativa americana DLF, para la descripción e intercambio de repositorios de metadatos en la segunda parte del Proyecto MOA. Finalidad: codificar todo tipo de metadatos (estructurales, descriptivos y administrativos) METS Schema: http: //www. loc. gov/standards/mets. xsd Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 83
Adaptar MARC a Internet: METS MARC ONIX Dublin Core VRA Core Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 84
Metadatos de propósito general: DCMI n Un mecanismo básico de descripción que: n n n Puede usarse en todos los dominios. Para todo tipo de recursos. Es sencillo, pero potente. Puede extenderse fácilmente. Puede trabajar conjuntamente con otras soluciones específicas. Para ayudar a la recuperación de información en la Web Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 85
http: //dublincore. org/ Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 86
Dublin Core: aproximación gral. /1 n n Nace de la imposibilidad de catalogar la Web (1995) Dublin Core Metadata Element Set n n ANSI Z 39. 85 / ISO 15836: 2003(E) Estándar para la descripción de recursos entre distintos dominios. n n n Diseñado originalmente para soportar/mejorar la búsqueda y recuperación de información en la WWW. Define semántica pero es sintáctico-independiente. Inicialmente 13+2 elementos: simple / cualificado Mantenido por: Dublin Core Metadata Initiative (DCMI) y alojado por OCLC Usos en OCLC: Connexion, DCPS, Content. DM, Research Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 87
Dublin Core: aproximación gral. /2 (www. openarchives. org) n Valor del Dublin Core como estándar de metadatos: n n Simplicidad, extensibilidad e interoperabilidad Adopción mundial (DCMES traducido a más de 20 idiomas) Utilizable como crosswalk entre los principales esquemas de metadatos. Algunas aplicaciones del Dublin Core: n n Open Archives Initiative (OAI) Amplia variedad de versiones en uso n n Bibliotecas, museos, archivos… etc. Utilizado en programas de e-government (AU, CA, DK, FI, IE, NZ, UK) Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 88
La filosofía del Dublin Core n Un mecanismo básico de descripción que: n n n puede usarse en todos los dominios puede usarse para todo tipo de recurso es simple, pero potente puede extenderse fácilmente y trabajar con soluciones específicas Para ayudar a la recuperación de información en la Web Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 89
Dublin Core en la Web n n Estándar de metadatos con más éxito en la Web Uso creciente en dominios específicos: n n n Información del Sector Público y del Estado Gestión de conocimiento corporativo Fundamento esencial en la Web Semántica Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 90
coste Coste contra funcionalidad MARC Dublin Core Google funcionalidad Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 91
Historia de Dublin Core n n n Octubre 1994, discusión en el pasillo en el 2 o Congreso WWW, Chicago. Se identificó la necesidad de un núcleo básico de metadatos para ayudar el recuperación de contenidos en la Web. Marzo 1995, Taller OCLC/NCSA en Dublin, Ohio. Desde 1995, congresos/talleres anuales en EEUU, Reino Unido, Australia, Finlandia, Alemania, Canadá, Japón, Italia, China; Madrid (http: //dc 2005. uc 3 m. es) Participación de muchos sectores (bibliotecas, administración, empresas etc. ). Amplia utilización (pero no se sabe cuánto). Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 92
Críticas al DC (1997 -98) n n Motores de búsqueda no soportan DC (sólo algunos search engines) Falta de reglas y principios directores que aseguren la calidad del contenido. No responsabilidad formal. Ausencia de masa crítica. Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 93
Fortalezas del DC (2000 -06) n n n Simplicidad. Responsabilidad formal consorciada: DCMI Independencia sintáctica. n n Integración en la nueva estructuración de la información (XML/RDF) Normalización (estándares formales). Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 94
Normalización n n n n 1998: Dublin Core Element Set versión 1. 0 1998: Internet RFC 2413 1999: Dublin Core Element Set versión 1. 1 2000: Recomendación UE: CWA 13874 2001: Estándar EEUU: NISO Z 39. 85 2003: Estándar internacional: ISO 15836 2005: PNE: Proyecto de Norma española 2006: UNE-ISO 15836 Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 95
Dublin Core – principios y Términos n n n Todos los elementos son optativos. Todos los elementos son repetibles. Todos los elementos se pueden mostrar en cualquier orden. Extensible. Internacional. DCMI- términos de metadatos: n n DCMES (Dublin Core Simple) Otros elementos y matizaciones (refinements) de elementos Esquemas de Codificación Vocabulario Type (DCMI) Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 96
Elementos y refinamientos n n Los Elementos son propiedades (properties) Las matizaciones de los elementos (refinements) son también propiedades de un tipo específico, subordinados a otras propiedades y con un significado más específico Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 97
Elementos DC Simple (DCMES. ISO 15836) Contenido Title Subject Description Source Language Relation Coverage Propiedad Intelectual Creator Publisher Contributor Rights “instantiation” Ejemplo Date Type Format Identifier Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 98
Elemento: coverage Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 99
Elemento (matizado): coverage. spatial Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 100
Elemento (matizado): coverage. temporal Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 101
Elemento: creator Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 102
Elemento: date Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 103
Elemento (matizado): date. created Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 104
Elemento: description Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 105
Elemento (matizado): description. abstract Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 106
Elemento: format Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 107
Elemento (matizado): format. extent Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 108
Elemento: Identifier Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 109
Elemento: language Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 110
Elemento: publisher Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 111
Elemento: relation Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 112
Elemento (matizado): relation. is. Version. Of Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 113
Elemento: rights Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 114
Elemento: source Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 115
Elemento: subject Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 116
Elemento: title Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 117
Elemento matizado: title. alternative Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 118
Elemento: type Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 119
DCMI Terms: Esquemas de codificación Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 120
DCMI: Vocabulario Type Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 121
DCMI scheme: RFC 1766 Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 122
Principios gramaticales n n n One-to-one: un recurso, una descripción Dumb-down: reducción de complejidad Appropriate values: valores apropiadas Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 123
Principio: One-to-one n n Una descripción para cada manifestación o versión de un recurso Descripciones separadas para: n n n una pintura y su imagen digital. dos versiones de un texto. un documento creado por una organización y la organización misma. Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 124
Principio: Dumb-down n n Cuando se encuentra un elemento matizado (refinement), se tiene que poder ignorar el refinamiento de modo que el resultado tenga sentido. La matización de los elementos tiene que ser más precisa, nunca más amplia que el elemento. Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 125
Principio: Appropriate values n Los valores que se atribuyen a los elementos siempre tienen que ser: n n n del tipo apropiado (p. ej. la frecuencia de actualización no es una fecha). útiles para la recuperación (p. ej. title “No title” no sirve). comprensibles para el usuario (p. ej. subject “ 56”, sin una referencia no dice nada). Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 126
Modelo de datos: DCMI Abstract Model n n n La base fundamental del Dublin Core. Definiciones de las palabras que se utilizan en los documentos del Dublin Core. Independiente de la codificación. Especificación utilizando UML (Universal Modeling Language). Recomendación propuesta (Marzo 2005). Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 127
Descripciones y Declaraciones n Una descripción (description) consiste en: n n una o más declaraciones (sobre un, y sólo un, recurso) Una declaración (statement) consiste en: n n una property identificando una propiedad un value identificando un valor y/o una o más representaciones de un valor (p. ej. un ‘secuencia de caracteres’) Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 128
Esquemas de codificación n Los valores se pueden cualificar a través de dos tipos de esquemas de codificación (encoding schemes): n n (vocabulary encoding schemes), indicando un vocabulario controlado del cual se escoge el valor, p. ej. LCSH. (syntax encoding schemes), indicando una notación formal según la cual el valor ha sido estructurado, p. ej. W 3 CDTF (“ 2005 -02 -07”). Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 129
DC simple o cualificado n n DC simple consiste en la utilización de sólo los 15 elementos básicos con valores representados por ‘secuencias de caracteres’. El DC cualificado puede utilizar todas las posibilidades del Abstract Model. Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 130
Implementación: (X)HTML n La descripción va codificado en la cabecera <head> del documento: <html> <head> …La descripción utilizando el DC iría aquí… </head> <body> … Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 131
Elementos Dublin Core en HTML/XHTML n se utilizan los atributos ‘name’ y ‘content’ del etiqueta <meta> del XHTML, por ejemplo: <meta name="DC. date" content="2001 -07 -18" /> Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 132
Idioma del valor n Cuándo se tiene que indicar la idioma del valor, se utilice el atributo ‘xml: lang’, p. ej. : <meta name="DC. subject" xml: lang="en" content="seafood" /> <meta name="DC. subject" xml: lang="es" content="mariscos" /> Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 133
Elementos repetidos n Cuándo se tiene más de un valor para un elemento, se tiene que repetir la etiqueta <meta> de XHTML: <meta name="DC. title" content="First title" /> <meta name="DC. title" content="Second title" /> Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 134
Otros elementos n Los elementos adicionales (p. ej. AUDIENCE) se codifican de modo similar, pero con el prefijo DCTERMS: <meta name="DCTERMS. audience" content="software developers" /> Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 135
Refinamientos n Los refinamientos (matizaciones de un elemento) van codificados con la misma estructura: <meta name="DCTERMS. modified“ content="2001 -07 -18" /> Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 136
Esquemas de codificación n Se utiliza el atributo ‘scheme’ de la etiqueta <meta> de XHTML: <meta name="DC. date" scheme="DCTERMS. W 3 CDTF" content="2001 -07 -18" /> Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 137
Declaración de namespace n Dublin Core tiene dos espacios de nombre (namespaces) Uno para los 15 elementos básicos. n Y otro para el resto. n <link rel="schema. DC" href="http: //purl. org/dc/elements/1. 1/" /> <link rel="schema. DCTERMS" href="http: //purl. org/dc/terms/" /> Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 138
Mezclando metadatos n Se puede mezclar metadatos DC con otros tipos de metadatos: <link rel="schema. DC" href="http: //purl. org/dc/elements/1. 1/" /> <link rel="schema. AGLS“ href="http: //www. naa. gov. au/. . /agls/1. 2" /> <meta name="DC. title" content="Services to Government" /> <meta name="keywords" content="public administration" /> <meta name="AGLS. Function" scheme="AGIFT" content="recordkeeping standards" /> Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 139
Ejemplo XHTML (simple) <link rel="schema. DC" href="http: //purl. org/dc/elements/1. 1/" /> <meta name="DC. title" content="Expressing Qualified Dublin Core in HTML/XHTML meta elements" /> <meta name="DC. creator" content="Andy Powell, UKOLN, University of Bath" /> <meta name="DC. contributor" content="Simon Cox" /> <meta name="DC. contributor" content="Eric Miller" /> <meta name="DC. date" content="2002 -09 -09" /> <meta name="DC. identifier“ content="http: //dublincore. org/documents/dcq-html/" /> <meta name="DC. relation" content="http: //dublincore. org/documents/2000/08/15/dcq-html/" /> <meta name="DC. description" content="This document describes how qualified Dublin Core metadata can be encoded in HTML/XHTML < meta> elements" /> <meta name="DC. format" content="text/html" /> <meta name="DC. type" content="Text" /> Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 140
Ejemplo XHTML (cualificado) <link rel="schema. DC" href="http: //purl. org/dc/elements/1. 1/" /> <link rel="schema. URI" href="http: //purl. org/dc/terms/URI" /> <link rel="schema. W 3 CDTF" href="http: //purl. org/dc/terms/W 3 CDTF" /> <link rel="schema. IMT" href="http: //purl. org/dc/terms/IMT" /> <meta name="DC. title" lang="en“ content="Expressing Qualified Dublin Core in HTML/XHTML meta elements" /> <meta name="DC. creator" content="Andy Powell, UKOLN, University of Bath" /> <meta name="DC. contributor" content="Simon Cox" /> <meta name="DC. contributor" content="Eric Miller" /> <meta name="DCTERMS. issued" scheme="W 3 CDTF" content="2002 -09 -09" /> <meta name="DC. identifier" scheme="URI“ content="http: //dublincore. org/documents/dcq-html/" /> <meta name="DCTERMS. replaces" scheme="URI" content="http: //dublincore. org/documents/2000/08/15/dcq-html/" /> <meta name="DCTERMS. abstract" content="This document describes how qualified Dublin Core metadata can be encoded in HTML/XHTML < meta> elements" /> <meta name="DC. format" scheme="IMT" content="text/html" /> <meta name="DC. type" scheme="DCMIType" content="Text" /> Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 141
Discusión / Preguntas Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 142
Conversores de metadatos n n n FGDC-MARC 21: http: //cuadra. nwrc. gov/converter/ Herramientas recopiladas por la LC en relación a los metadatos y MARC: http: //www. loc. gov/marctools. html#w eb DC-MARC converter: http: //www. bibsys. no/meta/d 2 m/ Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 143
Información útil n n n MARC: http: //www. loc. gov/marc/ DC: http: //dublincore. org Lista DCMI-ES: http: //www. rediris. es/list/info/dcmies. html Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN + UPM). España. Eva Méndez. Universidad Carlos III de Madrid 144
9b994ec3022fa0781bca4281e1741158.ppt