763a835dbeba06cbbb9b15059cdd448e.ppt
- Количество слайдов: 43
PLAN WYSTĄPIENIA • Wprowadzenie • Semantic Web w 5 minut, • Linked Data. • • • Czym jest SKOS? Dlaczego SKOS? SKOS w praktyce. Krytyka SKOS. Wnioski.
SEMANTIC WEB W 5 MINUT Tim Berners-Lee (2007) Sukces World Wide Web: • nieograniczone możliwości łączenia informacji (np. hiperłącza), • otwarte standardy, • rozdzielenie warstw sieci (komunikacja, wizualizacja, przetwarzanie).
SEMANTIC WEB W 5 MINUT • dzisiejsza sieć to sieć dokumentów (statyczne, dynamiczne), • dane w dokumentach zrozumiałe tylko dla ludzi, • aplikacje sieciowe nie są w stanie przetworzyć danych.
SEMANTIC WEB W 5 MINUT
SEMANTIC WEB W 5 MINUT • utrzymanie postulatu AAA (Anyone can say Anything about Any topic), • rozpowszechnienie standardów opisywania treści, • „zrozumienie” danych przez aplikacje, • możliwość powiązania danych.
SEMANTIC WEB W 5 MINUT Podstawowe standardy/specyfikacje: • RDF (Resource Description Framework) - specyfikacja modelu metadanych, • RDF Schema (RDFS) - język reprezentacji wiedzy, • OWL (Web Ontology Language) – język modelowania ontologii internetowych, rozszerzenie RDFS.
SEMANTIC WEB W 5 MINUT Cel • standaryzowany i spójny model danych, • zmiana perspektywy - dane, • dane powiązane (Linked Data).
LINKED DATA • nie model danych, lecz filozofia, • metoda ekspresji, reprezentacji, łączenia i współdzielenia danych, • Tim Berners-Lee: data hugging, • narzędzia: – identyfikator URI, – protokół http, – RDF oraz RDFS/OWL.
LINKED DATA Cztery zasady Linked Data: 1. Używaj URI jako nazwy dla obiektów. 2. Stosuj protokół http, po to by uzyskać informacje o tych obiektach. 3. Aktywacja poszczególnego URI ma spowodować pozyskanie użytecznych informacji. 4. Wykorzystuj powiązania z innymi obiektami za pomocą URI, aby zapewnić możliwość eksploracji i odkrywania innych obiektów.
LINKED DATA • • • FOAF (Friend Of A Friend), format reprezentacji danych personalnych, internetowa tożsamość, wizytówka sieciowa, rozszerzenie RDF.
FOAF
FOAF <rdf: RDF xmlns: rdf="http: //www. w 3. org/1999/02/22 -rdf-syntax-ns#" xmlns: rdfs="http: //www. w 3. org/2000/01/rdf-schema#" xmlns: foaf="http: //xmlns. com/foaf/0. 1/" xmlns: admin="http: //webns. net/mvcb/"> </foaf: Personal. Profile. Document> <foaf: Person rdf: ID="me"> <foaf: name>Marcin Roszkowski</foaf: name> <foaf: givenname>Marcin</foaf: givenname> <foaf: family_name>Roszkowski</foaf: family_name> <foaf: mbox_sha 1 sum>e 59 bff 904001 aa 669 cc 84 a 983 fcbf 6 e 4 b 97 e 2299</foaf: mbox_s ha 1 sum> <foaf: homepage rdf: resource="http: //biblioteka. unipt. pl"/> <foaf: based_near rdf: resource="http: //sws. geonames. org/3088972/" rdfs: label="Piotrków Trybunalski"/> <foaf: depiction rdf: resource="http: //4. bp. blogspot. com/_4 Xgy. LS 9 g. Xg/roszkowski. jpg"/> <foaf: workplace. Homepage rdf: resource="http: //mroszkowski. blogspot. com"/> <foaf: school. Homepage rdf: resource="Uniwersytet Jana Kochanowskiego. Filia w Piotrkowie Trybunalskim"/></foaf: Person> </rdf: RDF>
FOAF + GEONAMES
LINKED DATA
LINKED DATA Formaty danych / zbiory danych: • FOAF (Friend Of A Friend), • SIOC (Semantically-Interlinked Online Communities) Project – format danych do opisu społeczności, jej członków, zainteresowań • DOAP (Description of a Project) - format danych do opisu projektów open source, jego twórców, przebiegu, efektów, • Kartoteki wzorcowe VIAF (The Virtual International Authority File), • DBpedia – ustrukturyzowane dane pochodzące z Wikipedii. • SKOS (Simple Knowledge Organisation System).
CZYM JEST SKOS? Czym jest SKOS? • format danych dla systemów porządkowania pojęć (systemy organizacji wiedzy), • formalny język reprezentacji struktury SOW, • rozszerzenie RDF, • rekomendacja World Wide Web Consortium - W 3 C (sierpień 2009 r. )
CZYM JEST SKOS? Systemy organizacji wiedzy (SOW): • systemy porządkowania pojęć, • tradycyjne języki informacyjno-wyszukiwawcze, • sieciowe systemy organizacji wiedzy: – taksonomie internetowe, – ontologie.
OPIS W SKOS • opis pojęcia z wykorzystaniem składni RDF, • Trójki RDF (RDF triples) : – podmiot – predykat – obiekt, – pojęcie – predykat – wartość. • Przywołanie pojęcia za pomocą indywidualnego URI w opisywanym zbiorze.
OPIS W SKOS <rdf: RDF xmlns: rdf="http: //www. w 3. org/1999/02/22 -rdf-syntax-ns#" xmlns: rdfs="http: //www. w 3. org/2000/01/rdf-schema#" xmlns: skos="http: //www. w 3. org/2004/02/skos/core#"> <skos: Concept rdf: about="http: //www. ukat. org. uk/thesaurus/concept/1750"> <skos: pref. Label>Economic cooperation</skos: pref. Label> </skos: Concept> </rdf: RDF>
CECHY SKOS Standaryzowany zbiór klas i własności, które służą do: • identyfikacji pojęcia: skos: Concept za pomocą jego URI – http: //bn. org. pl/jhp/concept/1750 (pojęcie językoznawstwa) • identyfikacji SOW: skos: Concept. Scheme – np. JHP BN
CECHY SKOS • ustalenia nazw dla pojęcia i określenie ich statusu: – skos: pref. Label (w różnych językach etnicznych) Językoznawstwo @pl, – skos: pref. Label Linguistics @en, – skos: alt. Label Lingwistyka, – skos: hidden. Label Językonzawstwo,
CECHY SKOS • dodatkowych informacji o znaczeniu pojęcia i jego zmianach: – skos: note, – skos: scope. Note, – skos: definition, – skos: editorial. Note,
CECHY SKOS • ustalenia relacji znaczeniowych pomiędzy pojęciami: – relacja nadrzędności zakresowej skos: broader, – relacja podrzędności zakresowej skos: narrower, – relacja skojarzeniowa skos: related,
JHP W SKOS
JHP W SKOS <rdf: RDF xmlns: rdf="http: //www. w 3. org/1999/02/22 -rdf-syntax-ns#" xmlns: rdfs="http: //www. w 3. org/2000/01/rdf-schema#" xmlns: skos="http: //www. w 3. org/2004/02/skos/core#"> <skos: Concept rdf: about="http: //bn. org. pl/jhp/concept/1750"> <skos: pref. Label>Językoznawstwo</skos: pref. Label> <skos: alt. Label>Lingwistyka</skos: alt. Label> <skos: hidden. Label>Językoznwastwo</skos: hidden. Label> <skos: broader rdf: resource="http: //bn. org. pl/jhp/concept/4382"/> <skos: narrower rdf: resource="http: //bn. org. pl/jhp/concept/2108"/> <skos: narrower rdf: resource="http: //bn. org. pl/jhp/concept/9505"/> <skos: narrower rdf: resource="http: //bn. org. pl/jhp/concept/15053"/> <skos: narrower rdf: resource="http: //bn. org. pl/jhp/concept/18987"/> <skos: related rdf: resource="http: //bn. org. pl/jhp/concept/3250"/> <skos: in. Scheme rdf: resource="http: //bn. org. pl/jhp"/> </skos: Concept> </rdf: RDF>
JHP W SKOS
EKSPRESJA SKOS Siła ekspresji SKOS pozwala również na uwzględnienie: • sztucznego systemu notacyjnego, np. dla klasyfikacji: <skos: notation>81</skos: notation>, • odwzorowanie fasetowej struktury pola semantycznego: <skos: collection>Procesy</skos: collection> • odwzorowanie zależności pomiędzy pojęciami z różnych SOW (mapowanie), wykładniki typów zgodności zakresowej: skos: exact. Match, skos: close. Match.
ELASTYCZNOŚĆ SKOS
SOW W SKOS • UK Archival Thesaurus (UKAT), • The General Multilingual Environmental Thesaurus (GEMET), • Australian Public Affairs Information Service (APAIS) Thesaurus, • Tezaurus AGROVOC, • Library of Congress Subject Headings (LCSH) • Medical Subject Headings (Me. SH), • Geo. Names, kartoteka wzorcowa nazw geograficznych, • UNESCO Thesaurus, • ISO 639 Codes for the representation of names of languages.
SOW W SKOS
DLACZEGO SKOS? • wspólny model danych dla opisu SOW, • opis SOW musi być zrozumiały dla aplikacji, • SOW muszą być współdzielone, • SOW jako platforma wspólnego odniesienia.
JAK TO DZIAŁA? Rezultaty wyszukiwania JIW SOW 1 SOW 2 BAZA 1 BAZA 2 OPAC
JAK TO DZIAŁA? API
http: //www. flickr. com/photos/dullhunk/639163558/sizes/l/
JAK TO DZIAŁA?
KRYTYKA SKOS • format danych vs. mechanizmy ich przetwarzania, • wymiar technologiczny: – aplikacje eksplorujące i przetwarzające linked data, języki zapytań (np. SPARQL), – mechanizmy wizualizacji RAW DATA,
KRYTYKA SKOS • wymiar technologiczny: – narzędzia opisu SOW w SKOS (np. Protege, Tematres) • problemy: – reprezentacja niesamodzielnych jednostek leksykalnych (symbole pomocnicze, określniki), – reprezentacja zdań JIW.
PODSUMOWANIE • formalizacja umożliwia automatyczne przetwarzanie, • bariery: odległość, język, granice dyscyplinarne, • SKOS < Linked Data, • projekt nadal rozwijany, • ocena bibliotekarzy?
PODSUMOWANIE • SKOS = format danych dla SOW, • potrzeba współdzielonych zbiorów danych, • co z „naszymi” formatami?
PODSUMOWANIE
763a835dbeba06cbbb9b15059cdd448e.ppt