INFORMATICA UMANISTICA B DA DATI NON STRUTTURATI A

Скачать презентацию INFORMATICA UMANISTICA B DA DATI NON STRUTTURATI A Скачать презентацию INFORMATICA UMANISTICA B DA DATI NON STRUTTURATI A

0b348da00f82b79de9243b32b810719d.ppt

  • Количество слайдов: 40

INFORMATICA UMANISTICA B DA DATI NON STRUTTURATI A DATI STRUTTURATI: LINGUAGGI DI MARCATURA XML INFORMATICA UMANISTICA B DA DATI NON STRUTTURATI A DATI STRUTTURATI: LINGUAGGI DI MARCATURA XML TEI

AGGIUNGERE STRUTTURA A DATI NON STRUTTURATI USANDO LINGUAGGI DI MARCATURA l In questa lezione AGGIUNGERE STRUTTURA A DATI NON STRUTTURATI USANDO LINGUAGGI DI MARCATURA l In questa lezione e la prossima discuteremo di come sia possibile usare LINGUAGGI DI MARCATURA come XML per rendere ‘parzialmente strutturati’ dati testuali l l Oggi: aggiungere struttura a testi Prossima lezione: aggiungere informazione semantica

LINGUAGGI DI MARCATURA l l Permettono di aggiungere informazione (‘annotare’) un testo Due tipi LINGUAGGI DI MARCATURA l l Permettono di aggiungere informazione (‘annotare’) un testo Due tipi di informazione: l Aspetto (formattazione, disposizione degli elementi sulla pagina) l l HTML Struttura logica l XML

TIPI DI LINGUAGGI DI MARCATURA l ‘Procedurali’ (Te. X, La. Te. X, nroff, troff) TIPI DI LINGUAGGI DI MARCATURA l ‘Procedurali’ (Te. X, La. Te. X, nroff, troff) l l Indicano alla macchina la procedura di formattazione da seguire per un certo testo ‘Generici’ o ‘dichiarativi’ (SGML e discendenti) l Dichiarano la funzione LOGICA del testo

Te. X e La. Te. X The quadratic formula is $-b pm sqrt{b^2 - Te. X e La. Te. X The quadratic formula is $-b pm sqrt{b^2 - 4 ac} over 2 a$ end

HTML a SGML XHTML …… WML Math. ML HTML a SGML XHTML …… WML Math. ML

SGML l l Sviluppato nel 1986 da Charles Goldfarb Obiettivo: sviluppare uno standard per SGML l l Sviluppato nel 1986 da Charles Goldfarb Obiettivo: sviluppare uno standard per l’INTERSCAMBIO di testi Consente di definire marcatori (‘TAGS’) che permettono di strutturare un testo ed i loro ATTRIBUTI Utilizzato per: l l BNC OED

STRUTTURA SGML NEL BNC ATTRIBUTO <div 1 complete=y org=seq> TAG <head> <s n=00040> <w STRUTTURA SGML NEL BNC ATTRIBUTO

TAG TROUSERS SUIT There is nothing masculine about these new trouser suits in summer's soft pastels. Smart and acceptable for city wear but soft enough for relaxed days

DTD l La specifica degli elementi e dei loro attributi in un documento SGML DTD l La specifica degli elementi e dei loro attributi in un documento SGML costituisce la DEFINIZIONE DEL TIPO DI DOCUMENTO o DTD

HTML l l Un linguaggio di marcatura basato su SGML (una DTD SGML) Tipo HTML l l Un linguaggio di marcatura basato su SGML (una DTD SGML) Tipo di elementi e’ fissato

" src="http://present5.com/presentation/0b348da00f82b79de9243b32b810719d/image-11.jpg" alt="LINGUAGGI DI MARCATURA: HTML " /> LINGUAGGI DI MARCATURA: HTML My first HTML

Hello, World!

XML l l Una versione semplificata di SGML sviluppata dal W 3 C Come XML l l Una versione semplificata di SGML sviluppata dal W 3 C Come in SGML, ed a differenza di HTML, le TAG non sono predefinite ma definite usando un DTD o SCHEMA

ALBERI l I documenti SGML, HTML ed XML hanno una struttura ad ALBERO ALBERI l I documenti SGML, HTML ed XML hanno una struttura ad ALBERO

DOCUMENTI XML HANNO UNA STRUTTURA AD ALBERO Must have a UNIQUE root element DOCUMENTI XML HANNO UNA STRUTTURA AD ALBERO Must have a UNIQUE root element

LA STRUTTURA AD ALBERO DEI DOCUMENTI HTML (ED XML) <html> <head> <title> My first LA STRUTTURA AD ALBERO DEI DOCUMENTI HTML (ED XML) My first HTML

Hello, World!

LA STRUTTURA AD ALBERO DEI DOCUMENTI HTML html head title body p LA STRUTTURA AD ALBERO DEI DOCUMENTI HTML html head title body p

ACCESSO AD UN ALBERO html figlie madre head title body p ACCESSO AD UN ALBERO html figlie madre head title body p

XML PER LA STRUTTURA LOGICA DI TESTI <recipe> <title> Peanut butter on a spoon XML PER LA STRUTTURA LOGICA DI TESTI Peanut butter on a spoon Peanut butter Stick a spoon in a jar of peanut butter, scoop and pull out a big glob of peanut butter.

ALBERI + ATTRIBUTI IN XML poem title = Paradise Lost author = jm year= ALBERI + ATTRIBUTI IN XML poem title = Paradise Lost author = jm year= 1667 verse Seest thou yon dreary Plain, forlorn and wild, verse

Seest thou yon dreary Plain," src="http://present5.com/presentation/0b348da00f82b79de9243b32b810719d/image-20.jpg" alt="ATTRIBUTI IN XML Seest thou yon dreary Plain," /> ATTRIBUTI IN XML Seest thou yon dreary Plain, forlorn and wild, The seat of desolation, void of light, Save what the glimmering of these livid flames Casts pale and dreadful? TITLE: Paradise Lost AUTHOR: John Milton YEAR: 1667

ATTRIBUTI l Elements can contain one or more attributes <phone area_code='0461'>881607</phone> l l Names ATTRIBUTI l Elements can contain one or more attributes 881607 l l Names are case sensitive The values of the attributes must be enclosed within single or double quotes (either both single or both double) Attributes cannot be empty (name only) No attribute can be repeated twice within an element

BASI DATI IN XML: RUBRICA <RUBRICA> <PERSONA> <DATI_ANAGRAFICI> <NOME>Giulio</NOME> <COGNOME>Cesare</COGNOME> <INDIRIZZO> <PIAZZA>Bruto</PIAZZA> <N_CIVICO>10</N_CIVICO> <CITTA>Roma</CITTA> BASI DATI IN XML: RUBRICA Giulio Cesare Bruto 10 Roma 10100 321654 32557684785 Giovanni Pompeo Catilina 12 Milano 12100 96877564 3356545342

RUBRICA COME ALBERO RUBRICA COME ALBERO

TEXT ENCODING INITIATIVE l Un’iniziativa internazionale per sviluppare standards per l’archiviazione di testi Inizi: TEXT ENCODING INITIATIVE l Un’iniziativa internazionale per sviluppare standards per l’archiviazione di testi Inizi: 1987 Standard basato su SGML agli inizi, ora XML l Definizione: l l l http: //www. tei-c. org/release/doc/tei-p 5 -doc/en/Guidelines. pdf

TESTI IN FORMATO TEI <TEI. 2> <tei. Header>[informazioni della testata TEI] </tei. Header> <text> TESTI IN FORMATO TEI [informazioni della testata TEI] [materiali dell'avantesto] [testo unitario] [materiali annessi]

TEXT ENCODING INITIATIVE l l una testata TEI, codificata come <tei. Header> (frontespizio elettronico), TEXT ENCODING INITIATIVE l l una testata TEI, codificata come (frontespizio elettronico), che raccoglie la serie delle informazioni paratestuali e metatestuali di riferimento (descrizione dell'esemplare elettronico, di quello cartaceo di riferimento, delle norme di codifica seguite e delle revisioni effettuate) il testo vero e proprio, marcato con l'elemento , suddiviso in tre elementi: l (avantesto: frontespizio dell'esemplare cartaceo di riferimento e materiali introduttivi come prefazioni, dediche, sommari, introduzioni, indici etc. ) l (corpo del documento, a sua volta strutturato in partizioni significative del componimento, variabili a seconda della tipologia: testo in prosa, in versi, testo teatrale, ecc. ) l (materiali annessi come glossari, indici, note, bibliografie, colophon etc. )

TEI Header <tei. Header> <file. Desc> <title. Stmt>. . . </title. Stmt> <publication. Stmt>. TEI Header . . . . . . . . .

<file. Desc> l L’elemento <file. Desc> contiene tutte le informazioni bibliografiche l L’elemento contiene tutte le informazioni bibliografiche

TEI HEADER: title. Stmt <title. Stmt> <title>Two stories by Edgar Allen Poe: a machine TEI HEADER: title. Stmt Two stories by Edgar Allen Poe: a machine readable transcription Poe, Edgar Allen (1809 -1849) compiled by James D. Benson

TEI HEADER: publication. Stmt <publication. Stmt> <publisher>Oxford University Press</publisher> <pub. Place>Oxford</pub. Place> <date>1989</date> <idno TEI HEADER: publication. Stmt Oxford University Press Oxford 1989 0 -19 -254705 -5 Copyright 1989, Oxford University Press

Il Principe " src="http://present5.com/presentation/0b348da00f82b79de9243b32b810719d/image-31.jpg" alt="TEI HEADER: IL PRINCIPE Il Principe " /> TEI HEADER: IL PRINCIPE Il Principe Machiavelli Niccolò …. Prima edizione ca. 200 kb …. . Bologna 1 ….

KING LEAR IN FORMATO PROJECT GUTENBERG Kent. Now by Apollo, king, Thou swear'st thy KING LEAR IN FORMATO PROJECT GUTENBERG Kent. Now by Apollo, king, Thou swear'st thy gods in vain. Lear. O vassal! miscreant! [Laying his hand on his sword. ] Alb. and Corn. Dear sir, forbear! Kent. Do; Kill thy physician, and the fee bestow Upon the foul disease. Revoke thy gift, Or, whilst I can vent clamour from my throat, I'll tell thee thou dost evil.

KING LEAR IN FORMATO TEI <sp><speaker>Kent</speaker> <p>Now by Apollo, king, <lb/> Thou swear'st thy KING LEAR IN FORMATO TEI Kent

Now by Apollo, king, Thou swear'st thy gods in vain.

Lear

O vassal! miscreant!

Laying his hand on his sword.

Alb. and Corn.

Dear sir, forbear!

Kent.

Do; Kill thy physician, and the fee bestow Upon the foul disease. Revoke thy gift, Or, whilst I can vent clamour from my throat, I'll tell thee thou dost evil.

TEI: JANE EYRE CHAPTER 38 READER, I married him. A quiet wedding we had: TEI: JANE EYRE CHAPTER 38 READER, I married him. A quiet wedding we had: he and I, the par- son and clerk, were alone present. When we got back from church, I went into the kitchen of the manor-house, where Mary was cooking the dinner, and John cleaning the knives, and I said – 'Mary, I have been married to Mr Rochester this morning. ' The housekeeper and her husband were of that decent, phlegmatic order of people, to whom one may at any time safely communicate a remarkable piece of news without incurring the danger of having one's ears pierced by some shrill ejaculation and subsequently stunned by a torrent of wordy wonderment. Mary did look up, and she did stare at me; the ladle with which she was basting a pair of chickens roasting at the fire, did for some three minutes hang suspended in air, and for the same space of time John's knives also had rest from the polishing process; but Mary, bending again over the roast, said only --

Reader, I married him. A quiet" src="http://present5.com/presentation/0b348da00f82b79de9243b32b810719d/image-35.jpg" alt="Text markup

Reader, I married him. A quiet" /> Text markup

Reader, I married him. A quiet wedding we had: he and I, the parson and clerk, were alone present. When we got back from church, I went into the kitchen of the manor-house, where Mary was cooking the dinner, and John cleaning the knives, and I said —

Mary, I have been married to Mr Rochester this morning. The housekeeper and her husband were of that decent, phlegmatic order of people, to whom one may at any time safely communicate a remarkable piece of news without incurring the danger of having one's ears pierced by some shrill ejaculation and subsequently stunned by a torrent of wordy wonderment. Mary did look up, …

ARCHIVI BASATI SULLA TEI l Biblioteca Italiana: l l Electronic Text Center: l l ARCHIVI BASATI SULLA TEI l Biblioteca Italiana: l l Electronic Text Center: l l etext. lib. virginia. edu Humanities Text Initiative: l l www. bibliotecaitaliana. it www. hti. umich. edu Oxford Text Archive l ota. ahds. ac. uk

LA BIBLIOTECA ITALIANA LA BIBLIOTECA ITALIANA

XML – DTD – XSL Un file XML specifica il contenuto Un DTD o XML – DTD – XSL Un file XML specifica il contenuto Un DTD o SCHEMA specifica la SINTASSI Un file XSL specifica come VISUALIZZARE

IDEE PRINCIPALI LEZIONE DI OGGI l l Linguaggi di marcatura XML l l Struttura IDEE PRINCIPALI LEZIONE DI OGGI l l Linguaggi di marcatura XML l l Struttura ad albero Attributi Text Encoding Initiative Archivi basati sulla TEI

LETTURE l l Tomasi, cap. 4 Linguaggi di Marcatura XML TEI: l Tutorials: l LETTURE l l Tomasi, cap. 4 Linguaggi di Marcatura XML TEI: l Tutorials: l Gentle introduction to XML § http: //www. tei-c. org/release/doc/tei-p 5 doc/en/html/SG. html l TEI-LITE l http: //www. tei-c. org/Guidelines/Customization/Lite/teiu 5_split_en. html




  • Мы удаляем страницу по первому запросу с достаточным набором данных, указывающих на ваше авторство. Мы также можем оставить страницу, явно указав ваше авторство (страницы полезны всем пользователям рунета и не несут цели нарушения авторских прав). Если такой вариант возможен, пожалуйста, укажите об этом.