Télécharger le fichier pdf d’un mémoire de fin d’études
Corpus multilingues
Corpus comparables
|
Table des matières
Introduction
1 ´Etat de l’art
1.1 Introduction
1.2 Corpus multilingues
1.2.1 Corpus parall`eles
1.2.2 Corpus comparables
1.3 Lexiques bilingues `a partir de corpus parall`eles
1.3.1 Alignement phrastique
1.3.2 Alignement sous-phrastique
1.3.2.1 Alignement de mots et de segments
1.3.2.2 Vers l’alignement d’expressions polylexicales
1.4 Lexiques bilingues `a partir de corpus comparables
1.4.1 Premi`eres approches
1.4.2 Approche standard
1.4.2.1 Constitution des vecteurs de contexte
1.4.2.2 Transfert des vecteurs de contexte
1.4.2.3 Comparaison des vecteurs sources et cibles
1.4.2.4 R´esultats de l’approche standard
1.4.3 Am´eliorations de l’approche standard
1.4.4 Approches connexes
1.5 Conclusion
I Extraction de lexiques bilingues à partir de corpus paralèlles
Introduction g´en´erale
2 Lexique bilingue d’expressions polylexicales
2.1 Introduction
2.2 Expressions polylexicales
2.2.1 D´efinition
2.2.2 Typologie d’EPL
2.2.2.1 Les expressions lexicalis´ees
2.2.2.2 Les expressions institutionalis´ees
2.3 Extraction de lexique bilingue
2.3.1 Identification monolingue d’EPL
2.3.1.1 EPL candidates
2.3.1.2 Heuristiques de filtrage
2.3.2 Alignement d’EPL : approche par comparaison de distributions
2.4 Evaluation
2.5 Conclusion
3 Application des expressions polylexicales `a un syst`eme de traduction statistique
3.1 Introduction
3.2 Traduction automatique statistique
3.2.1 Traduction statistique : mod`ele standard
3.2.2 Moses : TAS `a base de segments
3.3 EPL dans Moses
3.3.1 Strat´egies d’int´egration dynamiques
3.3.1.1 Nouveau mod`ele de traduction
3.3.1.2 Extension de la table de traduction
3.3.1.3 Trait additionnel pour les EPL
3.3.2 Strat´egie d’int´egration statique
3.4 Exp´eriences et r´esultats
3.4.1 Cadre exp´erimental
3.4.1.1 Corpus et outils
3.4.1.2 Qualit´e d’une traduction
3.4.2 R´esultats et discussion
3.5 Conclusion
II Extraction de lexiques bilingues : Vers l’exploitation de corpus comparables
Introduction g´en´erale
4 Contexte et Mat´eriel
4.1 Introduction
4.2 Corpus Comparables
4.2.1 Wikip´edia comme corpus comparable
4.2.2 Corpus du projet TTC
4.2.3 Normalisation des corpus
4.3 Dictionnaires bilingues
4.4 Listes de r´ef´erences
4.5 Param`etres exp´erimentaux
4.5.1 Fenˆetre contextuelle
4.5.2 Mesure d’association
4.5.3 Mesure de similarit´e
4.6 Param`etres d’´evaluation
4.7 Conclusion
5 D´esambigu¨ısation lexicale des vecteurs de contexte
5.1 Introduction
5.2 Aper¸cu g´en´eral de l’approche
5.3 Ressources s´emantiques
5.3.1 WordNet
5.3.2 Mesures de similarit´e s´emantique
5.3.2.1 `A base de distance taxinomique
5.3.2.2 `A base de traits
5.3.3 ´Evaluation des mesures de similarit´e
5.4 Algorithme de d´esambigu¨ısation
5.5 ´Evaluations
5.5.1 Approches de r´ef´erence
5.5.2 Polys´emie dans les corpus comparables
5.5.3 Fusion de donn´ees par syst`eme de vote
5.5.4 R´esultats exp´erimentaux et analyse
5.6 Conclusion
6 Analyse s´emantique explicite pour l’extraction de lexiques bilingues
6.1 Introduction
6.2 Analyse s´emantique explicite (ESA)
6.3 Aper¸cu g´en´eral de l’approche
6.4 Repr´esentation contextuelle
6.4.1 Repr´esentation directe
6.4.2 Repr´esentation `a partir de contextes
6.4.3 Combinaison de repr´esentations
6.5 Graphe de traduction
6.6 Identification de traductions candidates
6.7 ´Evaluations
6.7.1 Repr´esentations contextuelle
6.7.1.1 Cadre exp´erimental
6.7.1.2 R´esultats et discussion
6.7.2 Sp´ecificit´e au domaine
6.7.2.1 Sp´ecificit´e des mots
6.7.2.2 Dictionnaire g´en´erique
6.7.2.3 Analyse des r´esultats
6.8 Conclusion
Conclusion
Bibliographie
Télécharger le rapport complet
