Скачать презентацию Introduction à l utilisation des corpus Introduction aux expressions Скачать презентацию Introduction à l utilisation des corpus Introduction aux expressions

249c5bf29262792c1d67833fe958cdd3.ppt

  • Количество слайдов: 14

Introduction à l’utilisation des corpus Introduction aux expressions régulières Introduction à l’utilisation des corpus Introduction aux expressions régulières

Questions abordées Ø Qu’est-ce qu’une expression régulière ? Ø A quoi peut servir une Questions abordées Ø Qu’est-ce qu’une expression régulière ? Ø A quoi peut servir une expression régulière ? Ø Comment construire des patrons ? Ø Comment faire des requêtes avec Ant. Conc/Wall en utilisant les expressions régulières ?

Qu’est-ce qu’une expression régulière ? Ø Qu’ont en commun les expressions suivantes ? Ø Qu’est-ce qu’une expression régulière ? Ø Qu’ont en commun les expressions suivantes ? Ø Enlarge Image (125 K) Ø Enlarge Image (273 K) Ø Enlarge Image (159 K) Ø Ou alors Ø volatile, volatile-rich, volatilization, volatility, volatilize ? Ø écrire, écrirais, écrivons, écrirons …. Ø Comment pourrait-on décrire une url ? Ø Ou une date ?

Qu’est-ce qu’une expression régulière ? Ø formule écrite dans un langage* crée dans le Qu’est-ce qu’une expression régulière ? Ø formule écrite dans un langage* crée dans le but de pouvoir décrire d’une façon concise des classes de chaînes de caractères Ø chaîne de caractères = suite de symboles Ø caractère = lettres, nombres, ponctuation, espaces, tabs Ø Repérage/filtrage de ‘patrons’ ou ‘motifs’ Ø « Pattern matching »

A quoi sert une expression régulière ? Ø Les applications sont immenses et vous A quoi sert une expression régulière ? Ø Les applications sont immenses et vous en aurez certainement besoin un jour !!! Ø Recher/remplacer des séquences spécifiques dans les corpus. Ø Les outils de traitement de texte, concordanciers permettent en général des requêtes pas expressions régulières Ø La syntaxe des expressions régulières peut varier mais les utilités sont les mêmes. Ø EXEMPLE (Open. Office)

Comment construire des patrons ? (Syntaxe des expressions régulières) (EN 6 POINTS) Comment construire des patrons ? (Syntaxe des expressions régulières) (EN 6 POINTS)

Comment construire des patrons ? 1. Chaînes de caractères Ø les plus simples expressions Comment construire des patrons ? 1. Chaînes de caractères Ø les plus simples expressions : chaînes de caractères : Ø « house » Ø « House » Ø « out of » Ø Exceptions : les caractères spéciaux Ø . ^ $ | [] () Ø Ils doivent être ‘protégés’ par le symbole

Comment construire des patrons ? 2. La disjonction (alternatives) Ø caractères alternatifs Ø [Hh. Comment construire des patrons ? 2. La disjonction (alternatives) Ø caractères alternatifs Ø [Hh. Mm]ouse Ø r[iau]ng Ø i[sz]e Ø [0123456789] Ø [aeiou] Ø chaîne de caractères alternatives Øin (any|every) Ø volcano|lava

Comment construire des patrons ? 3. Intervalles Ø [0 -9] Ø [a-z] Ø [A-Z] Comment construire des patrons ? 3. Intervalles Ø [0 -9] Ø [a-z] Ø [A-Z] Ø [a-c] Ø Autres exemples d’ensembles(alternatives) : Ø [0 -9 a-z. A-Z] Ø [a-zàèêëéïüùç]

Comment construire des patrons ? 4. La négation Ø [^A-Z] Ø [^aeoiuy] Ø [^Dd] Comment construire des patrons ? 4. La négation Ø [^A-Z] Ø [^aeoiuy] Ø [^Dd] ni D ni d

Comment construire des patrons ? 5. Quantificateurs Ø ? représente 0 ou 1 occurrence Comment construire des patrons ? 5. Quantificateurs Ø ? représente 0 ou 1 occurrence de l‘expression qui précède Ø Ex : arbres? arbre | arbres Ø colou? r color | colour Ø interest(s|(ed|ing)(ly)? )? Ø (school)? Bus(es)? Ø * 0 ou plus occurrences de l’expression qui le précède Ø lo*ng lng, loong, loooong Ø + au moins une occurrence Ø as [a-z]+ as Ø volatil[a-z]+

Comment construire des patrons ? 5. Autres quantificateurs Ø lo{1, 3}ng long, looong Ø Comment construire des patrons ? 5. Autres quantificateurs Ø lo{1, 3}ng long, looong Ø as ([a-z]+ ){1, 3}as

Comment construire des patrons ? 6. Un dernier point Ø le symbole. remplace n’importe Comment construire des patrons ? 6. Un dernier point Ø le symbole. remplace n’importe quel caractère (caractère joker) Ø r. ng ring, rang, rbng, r 4 ng, r ng Ø r. *ng -> rng, rdshfksdhng, riiing, etc. Ø wait. {0, 14} for Ø the more. {0, 30} the more Ø the (more|less). {0, 30} the (more|less)

Comment construire des patrons ? Exercices Ø Écrire les expressions régulières correspondant aux Ø Comment construire des patrons ? Exercices Ø Écrire les expressions régulières correspondant aux Ø les mots commençant par over– Ø les mots finissant par –ion Ø formes du verbe ask Ø formes des verbes finissant par –ise/–ize Ø adresses émail Øsites web Ødates.