288da9d1a487e40cdfc853856970bbf9.ppt
- Количество слайдов: 63
Multimediale Neugestaltung und Erweiterung von AURIS zur Steigerung der Attraktivität und Bedienerfreundlichkeit der Österreichischen Forschungsdokumentation - AG 2 Online Toolkit & Suchmaschine Konzept&Realisierung 2. Arbeitstreffen 19. 6. 2000 Uni Salzburg
AG 2 -Organisation Kernteam Uni Salzburg (Projektmanagement) – Abtlg. F. Forschungsförderung, UB, ZID Walter Niedermayer (TU-wien) Susanne Voller (TU-Graz) Johannes Koch-Geiger (Kunst-Uni-Linz) Rudolf Kanov (öster. Institut für Gewerbe- und Handelsforschung - Aufdat außeruniversitäre Forschungsdatenbank) © MM-AURIS AG 2
AG 2 -Organisation Interessierte Ansprechpersonen Wolfgang Schinagl (WK-Steiermark) © MM-AURIS AG 2
AG 2 - Inhalt Input/Ausgangsbasis Allg. Zielsetzungen AG 2 Planung der einzelnen Arbeitsschritte Ergebnisse Einzelne Erfahrungsberichte Output Diskussion Vorgaben zur Erstellung e. Erfahrungsberichtes © MM-AURIS AG 2
Input: Allg. Zielsetzungen AG 2 (http: //arge. tuwien. ac. at/arge/Mails/AG 2 PLAN 1. html ) · Gemeinsame Strategien und Verfahren zur Unterstützung der Produktion und des elektronischen Publizierens von forschungsbezogenen Multimedia. Daten als konsequente Fortsetzung der AG 1 -Tätigkeit (Einbringung multimedialer Elemente) · Modelle zur Zusammenführung von On-line-MM-Daten mit traditionellen Text-Informationen zu Personen, Projekten und Instituten aus Uni-Informationssystemen (insbes. Forschungsdokumentation AURIS) und feststellen der dafür notwendigen Voraussetzungen. © MM-AURIS AG 2
Input: Allg. Zielsetzungen AG 2 · Miteinander abgestimmte (Qualitäts-)Kriterien zur integrierten Anzeige (von Text- und Multimedia. Dokumenten) der Ergebnisse von On-line-Recherchen in Zusammenarbeit mit AG 3 (Qualitätsmanagement). · Möglichkeiten der Erschließung zusätzlicher Informations-Quellen (z. B. Aufdat-Recherche ist über Protokoll-Schnittstelle in der DB selbst möglich oder man könnte auch auf indexierte statische HTML-Web. Seiten zurückgreifen) © MM-AURIS AG 2
Input: Allg. Zielsetzungen AG 2 · Kriterien und Methoden für die Selektion und Indexierung forschungsrelevanter Web-Seiten · Spezifikation und Realisierung eines neuen Systems AURIS-MM (in Zusammenarbeit mit AG 4 Linguistik und Visualisierung) und AG 6 (Marketing, Web-Design und Realisierung der Services) © MM-AURIS AG 2
Input: “Planung der einzelnen Arbeitsschritte” Ø Erschliessung von Online-Dokumenten durch Metadaten (Palzenberger) Ø Durchführungsideen (Hofmann) Ø Funktionierende Anwendungen (Mader) Ø Kriterienkatalog für Informationssysteme (Koch. Geiger) Ø Diskussion der Zielsetzungen (AG 2) © MM-AURIS AG 2
Erschliessung von Online-Dokumenten durch Metadaten Margit Palzenberger Universitätsbibliothek Salzburg
Ausgangspunkt – Findung von Kriterien für HTML-Dokumente, daß sie von Suchmaschinen indexiert werden (z. B. Verwendung spezieller Meta-Tags im Abschnitt zwischen
Was ist. . . IN OUT @ Metadaten & Kataloge @ Dublin Core & RAK @ RDF & MAB, MARC @ Internet & Bibliotheken © MM-AURIS AG 2
Was ist. . . Metadaten? Daten über • kurz • strukturiert • regelhaft @ @ Daten • lang • unstrukturiert • frei maschinenverständlich Online (WWW) zugänglich © MM-AURIS AG 2
Was ist. . . Metadaten? Beschreibung Objekt Eigenschaft 1 Eigenschaft 2 Eigenschaft 3. . Eigenschaft Typ = Wert © MM-AURIS AG 2
Wozu. . . Metadaten? • • • Aufstöbern (Retrieval, Discouvery) Beschreiben Unterstützen von Software-Agenten Bewerten des Inhaltes (rating) Sichern von Eigentümerrechten Unterstützen von Privacy-Regeln © MM-AURIS AG 2
Was ist. . . Dublin Core? • 15 Eigenschaften (property types) • Document Like Objects (DLOs) aller Art • Retrieval, Beschreibung Formal I • Creator • Contributor • Publisher • Title • Relation • Source Formal II • Identifier • Date • Type • Format • Language • Rights Inhaltlich • Subject • Description • Coverage © MM-AURIS AG 2
Was ist. . . Dublin Core. . . nicht? • • • ISO-Standard, W 3 C-Standard ausreichend qualifiziert Syntaxregelwerk für alle Objekte und Anforderungen für bestimmte Communities es hat sich vielmehr bewährt als A kleinster gemeinsamer Nenner A Ausgangspunkt für Qualifizierung © MM-AURIS AG 2
Was ist. . . Qualifizierung? • Beschränkung einer Eigenschaft (type) • Beschränkung eines Wertes (value) • Bestimmung der Sprache (language) • • durch standardisierte Bezeichnungen durch normierte Formulierung durch Thesauri und Klassifikationen (= controlled terms) © MM-AURIS AG 2
Was ist. . . Qualifizierung? • Date. Created Date. Modified Date. Issued Date. Accepted • • Creator = Hans Adam Creator = Adam, Hans Creator = Prof. H. Adam. . . • • Subject = Earthworms Subject = Regenwürmer Subject = Lumbricidae. . . Date = 1999 -07 -01 Date = 01. Juni 1999 Date = 07/01/1999. . . © MM-AURIS AG 2
Was ist. . . RDF? • • • Resource Description Framework Wird vom W 3 C entwickelt XML-Syntax für Metadaten aller Art Komplexe Logik möglich Abwärts-kompatibel zu HTML © MM-AURIS AG 2
Standpunkte - Dublin Core C ist ein geeigneter Ausgangspunkt für die Definition eines Metadaten-Schemas C kann als kleinster gemeinsamer Nenner mit anderen Communities dienen D ist für ein präzises Retrieval zu grob D beschreibt wichtige Eigenschaften nicht D beschreibt wichtige Objekttypen nicht © MM-AURIS AG 2
Standpunkte - RDF C ausgefeilte Logik für die Nutzung von Metadaten im WWW C kompetente Entwicklung, akzeptiert (W 3 C) D braucht maschinelle Erstellung/Auswertung D kann sehr schnell sehr komplex werden D für einfache Metadaten nicht zwingend © MM-AURIS AG 2
Standpunkte - Qualifizierung C unbedingt notwendig für Retrieval C unbedingt notwendig für Administration D keine globale Standardisierung in Sicht D sehr heterogene Materie D steigert Aufwand bei der Erfassung © MM-AURIS AG 2
Was ist zu tun - Zielsetzungen Analyse von DC im Rahmen verschiedener RIS Analyse der (Meta)datenstrukturen österreichischer RIS Analyse von Standards für die Qualifikation Spezifikation von Objekttypen, Eigenschaften und Qualifikationen für MM-AURIS Spezifikation von Schnittstellen zu anderen IS Spezifikation der syntaktischen Möglichkeiten Analyse der Usability der gewählten Spezifikationen © MM-AURIS AG 2
„Meanwhile, I‘m going to sit back and meta-tate on how nice it will be someday to actually be able to find some of those document-like objects out there when I want them“ Caplan, Priscilla 1995 © MM-AURIS AG 2
Durchführungsideen Anton Hofmann Zentraler Informatikdienst Uni Salzburg
Ausgangspunkt – Sammlung von Durchführungs-Ideen z. B. , durch das Durcharbeiten der folgenden Diplomarbeit aus Deutschland zum Thema Resource Discovery und Information Retrieval - Nutzung von Dublin Core Metadaten bei der Informationserschließung im World Wide Web: http: //www. home. unixag. org/sfx/papers/metadaten/ ==> Zusammenfassung der entscheidenden Ideen auf ca. 2 Seiten. © MM-AURIS AG 2
Durchführungsideen: Robots DI Lars Eilebrecht, “Resource Discovery und Information Retrieval Nutzung von Dublin Core-Metadaten bei der Informationserschließung im World Wide Web”, 1998, Universität. Gesamthochschule Siegen Def. : Web-Roboter Informationen von einem Web-Server ohne Interaktion mit einem Menschen herunterladen. © MM-AURIS AG 2
Durchführungsideen: Robots Aufbau Einem HTTP-Interface zur Kommunikation mit Web. Servern. · Einem Content- respektive HTML-Parser zur Isolation von Verweisen aus dem HTML-Sourcecode und gegebenenfalls der Extrahierung weiterer Informationen. © MM-AURIS AG 2
Durchführungsideen: Robots · Einer Komponente zur Verwaltung der Verweise (Speicherung der bereits besuchten URLs und Auswahl der noch zu besuchenden Ressourcen). · Einer Komponente zur Verarbeitung der Daten, z. B. Speicherung von Metadaten in einer Datenbank oder Übergabe an ein weiteres Programm. © MM-AURIS AG 2
Durchführungsideen: Robots Zielsetzung Web-Roboter: Media. Fox Es soll ein Web-Roboter implementiert werden, der in der Lage ist, ()Bereiche eines einzelnen oder mehrerer Web-Server zu durchsuchen. ()Die heruntergeladenen Dokumente sollen auf Dublin Core-Metadaten hin untersucht werden und, © MM-AURIS AG 2
Durchführungsideen: Robots ()sofern es sich um gesuchte Daten handelt, sollen sie zusammen mit dem URL des jeweiligen Dokuments in einer Datenbank gespeichert werden. ()Damit der Roboter möglichst flexibel eingesetzt werden kann, soll er weitgehend unabhängig vom jeweils verwendeten Datenbanksystem arbeiten. © MM-AURIS AG 2
Durchführungsideen: Robots ()Zudem soll der Roboter in der Lage sein, den Datenbestand auf Aktualität zu überprüfen und gegebenenfalls Datensätze erneuern oder löschen. ()Der Roboter soll, abgesehen vom Aufruf, keinerlei Interaktivität des Benutzers erfordern und mindestens in der Lage sein, einen Bestand von einigen tausend Datensätzen zu verwalten. © MM-AURIS AG 2
Durchführungsideen: Robots Möglichkeiten, mit denen Metadaten in ein Dokument integriert werden können. 1. Einbetten der Metadaten zum Zeitpunkt der Erstellung der Ressource, 2. Automatisches Einbetten der Metadaten, wenn die Ressource auf einer Web. Site publiziert wird, 3. Automatisches Einbetten der Metadaten, wenn die Ressource vom Web-Server ausgeliefert wird. © MM-AURIS AG 2
Durchführungsideen: Robots Die erste Variante könnte als Standardvariante betrachtet werden. Die Metadaten werden manuell, mit Hilfe eines (HTML-)Editors, dem jeweiligen HTML-Dokument, hinzugefügt und zusammen mit der Ressource verwaltet. Muß jedoch eine hohe Anzahl von Ressourcen verwaltet werden, kann diese Vorgehensweise Probleme verursachen, zum Beispiel, wenn SyntaxÄnderungen an allen Metadaten vorgenommen werden müssen oder zusätzliche Elemente eingefügt werden sollen. . © MM-AURIS AG 2
Durchführungsideen: Robots Bei der zweiten Variante, automatisches einbetten der Metadaten, wenn die Ressource publiziert wird, kommen sogenannte Web-Site-Management-Systeme zum Einsatz. Solche, noch nicht sehr verbreiteten Systeme, sind zum Teil in der Lage, Metadaten einer Datenbank zu entnehmen und auf Basis entsprechender Vorlagen in die zu publizierenden Dokumente einzubinden. Vorteil dieses Verfahrens ist die zentrale Verwaltung der Metadaten in einer Datenbank und der verwendeten Syntax-Vorlage. Auch bei einer hohen Anzahl von Ressourcen können so Änderungen schnell und effizient an den Dokumenten vorgenommen werden. © MM-AURIS AG 2
Durchführungsideen: Robots Als dritte Variante bieten sich Server-Side-Scripting-Mechanismen des jeweils verwendeten Web-Servers an, d. h. erst beim Abruf einer Ressource werden die Metadaten on-the-fly durch den Web-Server bzw. durch ein entsprechendes Skript in die Dokumente eingebunden. Ein Beispiel sind Server-Side Includes (SSI) [3] die zur dynamischen Erstellung von HTML-Dokumenten oder Teilen von ihnen verwendet werden können. . Das Skript selbst kann die passenden Metadaten beispielsweise aus einer Datenbank holen und die entsprechend aufbereiten Daten an den Web-Server zurückliefern, der sie dann in das Dokument einbettet und ausliefert. Um die jeweils passenden Metadaten zu erzeugen bzw. aus einer Datenbank zu extrahieren, wird typischerweise der Dateiname des HTML-Dokuments als Schlüsselwert verwendet. © MM-AURIS AG 2
Analyse funktionierender Anwendungen Martin Mader FODOK-Team Uni Salzburg
Ausgangspunkte – Studium von funktionierenden Anwendungen: Als Beispiel die Safari Methode aus Schweden "how to register research information" at http: //mother. lub. lu. se/safari/metadata/safari. pl, den "Meta-Tag-Generator" der Fa. CCOM-INET Netz- und Medienste Gmb. H auf http: //www. ccominet. de/service/metatags. htm, die Suchmaschine für die Uni Hannover auf http: //harvest. rrzn. uni-hannover. de/ oder das Projekt Dissertation on-line auf http: //www. educat. hu-berlin. de/diss_online/kurzproj. html ==> Zusammenfassung der entscheidenden Ideen auf ca. 2 Seiten © MM-AURIS AG 2
Analyse funktionierender Anwendungen SAFARI (Schweden) Suchportal zur Forschung in Schweden (Universitäten, Forschungseinrichtungen) von der technischen Seite her interessant (Aufbau) METADATA SERVER (Uni Göttingen) Suchportal zur nationalen und internationalen Metadaten Diskussion aus bibliothekarischer Sicht von der Benutzerseite her interessant (Recherche) (beide Systeme verwenden das DC-Schema) © MM-AURIS AG 2
SAFARI (Verbreitung von Forschungsinformation an die Öffentlichkeit via Internet) Funktionsweise: Information über universitäre Forschung in Schweden wird gesammelt und präsentiert. Dokumente, die auf DC basierende Metadaten enthalten werden regelmässig gesammelt und indexiert Verteiltes System: Teilnahme von Unis, Colleges, Forschungseinrichtungen; Zugang zu allen Webseiten und Datenbanken von einer einzigen Eingabemaske Technologie: Net. Lab der Lund University stellt Metadaten Tools und Suchroboter bereit (vgl. DESIRE-Projekt) - Freeware © MM-AURIS AG 2
Informationsarchitektur/SAFARI Mehrere Portale, die nach den Bedürfnissen verschie-dener User angepaßt werden können (verschiedene Rollenverteilungen möglich) Metadatentool speichert Metadaten in externe Daten-bank (Zugriff für Roboter) die vom Tool registrierte URL wird an den Roboter zur Indexierung weitergel. © MM-AURIS AG 2
Produktionsstufen/SAFARI Automatisierte Übermitt-lung der Metadaten in die DB durch den Suchroboter Verwendung eines eigenen Suchinterface möglich Combine-Roboter (Version 1. 3. 2. ) kann Post. Script/PDF lesen und speichern Suchmaschine: Verwendung von Z 39. 50 Software © MM-AURIS AG 2
Vor- und Nachteile von SAFARI PRO: Viele technische Informationen Gute Quellenangaben für Software (Net. Lab, . . . ) KONTRA: unübersichtliche Anwendung für den User Suchmaske ist kompliziert zu benützen FAZIT: Schwerpunkt liegt auf dem technischen Part © MM-AURIS AG 2
METADATASERVER (Uni Göttingen) Ergebnis des META-LIB Projektes der Niedersächsischen Staats- und Universitätsbibliothek Ziel: Entwicklung von Richtlinien zum Einsatz von Meta-daten zur Erschließung digitaler bzw. digitalisierter Ressourcen in wiss. Bibliotheken Teilprojekt Göttingen: Meta. Form: Datenbank zur vergleichenden Analyse der verschiedenen Dublin-Core-Anwendungen Metaguide: Dokumentation der (inter)nationalen Metadatendiskussion aus bibliothekarischer Sicht © MM-AURIS AG 2
Meta. Form Access-Datenbak: Enthält das DC-Schema mit seinen Spielarten in den bisherigen Anwendungen (Vergleiche ergeben sich immer aus der Perspektive des DC Metadata Element Set) Abfragen werden dynamisch mit Hilfe von Java Servlets aus der Datenbank generiert „Crosswalks“: Vergleich zwischen DC und den anderen aufgenommenen Formate „Crosscuts“: Darlegung, wie ein best. DC-Element über alle Anwendungen hinweg verwendet wird © MM-AURIS AG 2
Meta. Guide Internet-basierter Zugang zu Informationen zur aktuellen Metadatendiskussion aus bibliothekarischer Sicht Hauptaugenmerk wird auf die Entwicklung des DC Metadata Element Set gelegt „Subject Catalog“: Reihung der Dokumente nach einer themenspezifischen Klassifikation „Source Type Catalog“: Reihung der Dokumente nach dem Quellentyp Suchmaschine“ © MM-AURIS AG 2
Vor- und Nachteile des Metadataservers PRO: Übersichtlichkeit für den Benutzer Einfache Suche in Katalogen möglich KONTRA: Auf die technische Beschreibung wird zu wenig Wert gelegt keine Angaben zur verwendeten Software FAZIT: Schwerpunkt liegt auf dem Anwenderpart © MM-AURIS AG 2
Fazit - To. Do für MM-AURIS Aus den „Fehlern“ der Anwendungsbeispiele lernen Nützen der Vorteile des jeweiligen Systems: Erstellung eines benutzerorientierten Systems Einfache(s) Suchinterface (Katalogsuchfunktion, Suchmaschine) Einsatz der richtigen Software Zusammenarbeit mit anderen Initiativen (Göttingen, . . . ) Vertiefung der Analyse von Anwendungen DC als kleinster gemeinsamer Nenner zur Beschreibung von Web. Ressourcen; Erweiterung bzw. Anpassung notwendig © MM-AURIS AG 2
Kriterienkatalog für Informationssysteme Johannes Koch-Geiger Kunst-Uni Linz
Ausgangspunkte – Findung notwendiger bzw. optimaler Kriterien (Schnittstellen, Anknüpfungspunkte) für Informations. Systeme (Text-Dokumente) an den Unis in Österreich zur systematischen Verbindung mit MM-Dokumenten (optimale Kriterien könnten sein: z. B. alle Text. Dokumente als HTML-Dateien im Web ausgelagert, eindeutige und systematisch aufgebaute URL für jede Person an der Uni, Abfrage-Zugang in eine Datenbank über ein plattformunabhängiges Protokoll, Identifikationssystem für die on-line Eingabe. . . ) ==> Zusammenfassung auf ca. 2 Seiten © MM-AURIS AG 2
Diskussion der Zielsetzungen MM-AURIS AG 2
Diskussion Forschungsportal Österreich-Akad. Bereich 1) Spezifizierung/Standardisierung von DC-Elementen unter besonderer Berücksichtigung von · österreichischen (AURIS), UB, Aufdat, . . . (FWF, FFF, . . . ) · europäischen (CERIF, ERGO) Standards © MM-AURIS AG 2
Diskussion 2) AURIS-Zertifikat Einführung eines offiziellen AURIS-Zertifikat inkl, Beschreibung der Kriterien um dieses Zertifikat erhalten zu können 3) Registrierungsstelle Kontrolle der Erstellung der Metadaten (third party metadata) = “AURIS-Zertifikat” Registrierung / Eintragung / Mitglied 4) Suchportal © MM-AURIS AG 2
Diskussion )Aufbau eines Metadatenservers zur Verwaltung der in der AURIS-Datenbank vorhandenen Daten (z. B. am Beispiel der Universität Gießen) )Spezifikation von Metadaten für die österreichische Forschungslandschaft (AURIS-Datenbank); welche Informationen sollen für welche Daten verwendet werden © MM-AURIS AG 2
Diskussion )Für die integrierte Suche müssen Partner gefunden werden, nach deren Beispiel vorgegangen werden kann (z. B. SAFARI, CERIF, Universität Göttingen) )Auf der Basis der AURIS-Datenbank und anderen Datenservern (SAFARI, CERIF, Universität Göttingen) ist ein Minimal- bzw. Maximalset von Dublin Core Tags zu definieren. Dazu ist die Einsichtnahme in Entity-Relationship -Diagramme notwendig. © MM-AURIS AG 2
Diskussion Aufbau einer zentralen Datenbasis und Authorisierungsinfrastruktur für die Forschungsdokumentation österreichischer Universtitäten mit Redakteursfunktionalitäten (Single-Point of Access) vgl. hier mit ALEPH-Funktionalitäten © MM-AURIS AG 2
Diskussion Aufbau eines Intranets mit zentraler Datenbasis (1) zur Erfassung und Verwaltung der multimedialen Inhalte via WWW-Clients (HTML, XML); (2) zur Regelung von einheitlichen Zugangs- und Authorisierungsformen; (3) zur Regelung von Redaktuersrechteund -funktionen; (4) zum automatisierten Datenabgleich (Replikation, Snapshots, FTP) mit den dezentralen Systemen; (5) zur durchgängigen Archivierung der multimedialen Inhalte; © MM-AURIS AG 2
Diskussion Zentral betriebene Internet-Server zur Umsetzung von Skalierbarkeit, Personalisierung und kundenspezifische Adaptierung der Inhalte. Realisierung von Kostenpflichtigen Zugangsformen für z. B. Online-Verkauf von Forschungsberichten; Zentrales Informationsmedium bzw. Informationsdienst z. B. für Email-Benachrichtigungen, Ankuendigungen, Newsletter etc. © MM-AURIS AG 2
Diskussion Unterstützung mehrerer Ausgabemedien (Media-on. Demand) für Online- und Print-Ausgaben der Forschungsdokumentation. Individuelle Reporting- und Auwertungsfunktionalitäten für z. B. Evaluierungsverordnung oder F&EErhebungsverordnung mit definierbaren Auswertungsfeldern und frei gestaltbaren Layouts. © MM-AURIS AG 2
Diskussion Gestaltung von On-/Offline Schnittstellen mit Authorisierungsfunktionalitäten für z. B. Datenabgleich mit dezentralen Systemen, Zugriffsmöglichkeiten für ÖUK u. a. autorisierte Insitutionen sowie Personen; Syonchronisierungs- bzw. Verknüpfungsmöglichkeiten zum Abgleich mit EU/internationalen Forschungsdatenbanken und Anwendung von Metadaten; © MM-AURIS AG 2
Diskussion Promotion der AURIS-MM Web. Site durch automatisierte Eintragungen in Suchmaschinen und Verlinkungen an prominenten Stellen; Mehrsprachiges Such- und Ausgabeinterface sowie Möglichkeiten zur Online-Übersetzung on-the-fly; © MM-AURIS AG 2
Diskussion – ==> Erstellung eines Erfahrungsberichtes (bestehend insbes. aus den vorangehenden Zusammenfassungen) zu bestehenden Technologien, deren Vorteile und Nachteile, sowie Empfehlungen! © MM-AURIS AG 2


