Télécharger le fichier pdf d’un mémoire de fin d’études
Le developpement´ de l’aide a` la traduction
Difficultes´ de la traduction technique
Contexte industriel
|
Table des matières
Introduction
I Contexte scientifique et applicatif
1 Exploitation des corpus comparables pour la traduction assist´ee par ordinateur
1.1 Perspective historique : des premiers traducteurs automatiques aux corpus comparables
1.1.1 Premi`eres recherches en traduction automatique
1.1.2 Le d´eveloppement de l’aide `a la traduction
1.1.3 Limites des corpus parall `eles et avantages des corpus comparables
1.1.4 Difficult ´es de la traduction technique
1.1.5 Contexte industriel
1.2 Techniques d’alignement de termes en corpus comparables
1.2.1 Principe de l’approche distributionnelle
1.2.2 E´ valuation des techniques d’alignement en corpus comparables
1.2.3 Am´ eliorations et variantes de l’approche distributionnelle
1.2.4 Influence des donn´es et du param´ etrage sur la qualit ´e des r ´ esultats
1.2.5 Limites de l’approche distributionnelle
1.3 Prototypage d’un outil de TAO destin ´e aux corpus comparables
1.3.1 Implantation d’une m´ethode d’acquisition de lexiques bilingues
1.3.2 Extraction de fiches terminologiques
1.3.3 Interface de consultation des lexiques extraits
1.4 Synth`ese
2 E´ valuation applicative des lexiques issus de corpus comparables
2.1 M´ethodologies d’ ´evaluation de la qualit ´e des traductions
2.1.1 L’ ´evaluation en traduction automatique
2.1.2 L’ ´evaluation en traductologie
2.1.3 Discussion
2.2 Conception et exp´ erimentation d’un protocole d’ ´evaluation applicative
2.2.1 Reflexions m´ethodologiques
2.2.2 Exp´ erimentation du protocole
2.2.3 R´ esultats obtenus
2.3 Discussion
3 G´en´eration automatique de traductions de termes
3.1 Approches compositionnelles
3.1.1 Principe de la traduction compositionnelle
3.1.2 Traduction compositionnelle d’unit ´es polylexicales
3.1.3 Traduction compositionnelle d’unit ´es monolexicales
3.1.4 Filtrage des traductions g´en´ er ´ees
3.2 Approches empiriques
3.2.1 Traduction par inf ´erence analogique
3.2.2 Apprentissage de r `egles de r ´e´ecriture de caract `eres
3.2.3 Traitement de la variation morphologique
3.3 E´ valuation des me´ thodes de ge´ne´ ration de traductions
3.4 Perspectives de recherche
II Contributions `a la traduction compositionnelle
4 Cadre m´ethodologique de la traduction morpho-compositionnelle
4.1 M´ethode de traduction morpho-compositionnelle
4.1.1 Positionnement
4.1.2 D´ efinitions
4.1.3 Hypoth`eses sous-jacentes
4.1.4 Int ´ er ˆ et de l’approche pour l’exploitation des corpus comparables et la traduction sp´ ecialis ´ee
4.2 Probl ´ematiques abord´ees et contributions
4.2.1 G´en´ eration de traductions fertiles
4.2.2 Vari ´ et ´e des structures morphologiques traduites
4.2.3 Ordonnancement des traductions candidates
4.3 M´ethodologie d’ ´evaluation
4.3.1 R´ ef ´erence a priori
4.3.2 R´ ef ´erence a posteriori
4.4 Synth`ese
5 Donn´ees exp´erimentales
5.1 Corpus comparables
5.2 Termes sources
5.3 Donn´ees de r ´ ef ´erence pour l’ ´evaluation de la g´en´ eration de traduction
5.3.1 R´ ef ´erence a priori
5.3.2 R´ ef ´erence a posteriori
5.4 Donn´ees pour l’apprentissage et l’ ´evaluation du mod` ele d’ordonnancement
5.5 Ressources linguistiques
Ressources linguistiques
5.5.1 Dictionnaire bilingue g´en´ eraliste
5.5.2 Dictionnaire de synonymes
5.5.3 Table de traduction de morph`emes li ´es
5.5.4 Lexiques pour la d´ecomposition des termes sources
5.5.5 Familles morphologiques
5.5.6 Dictionnaire de cognats
5.6 Synth`ese
6 Formalisation et ´evaluation de la g´en´eration de traductions candidates
6.1 Algorithme de g´en´ eration de traductions
6.1.1 D´ecomposition
6.1.2 Traduction
6.1.3 Recomposition
6.1.4 S´ election
6.2 E´ valuation du de´coupage morphologique
6.3 E´ valuation des traductions ge´ne´ re´es
6.3.1 R´ ef ´erences et mesures d’ ´evaluation
6.3.2 Apport de la g´en´ ericit ´e du mod` ele
6.3.3 Apport des ressources linguistiques
6.3.4 Apport de la strat ´egie de repli
6.3.5 Apport des traductions fertiles
6.3.6 Apport du corpus vulgaris ´e
6.3.7 Analyse qualitative
6.4 Discussion
6.4.1 Bilan
6.4.2 Perspectives
7 Formalisation et ´evaluation de l’ordonnancement de traductions candidates
7.1 Crit `eres d’ordonnancement
7.1.1 Similarit ´e des contextes
7.1.2 Fr ´equence du terme cible
7.1.3 Probabilit ´e de traduction des parties du discours
7.1.4 Mode de traduction des composants
7.2 Combinaison de crit `eres
7.2.1 Standardisation des valeurs
7.2.2 Combinaison lin ´ eaire
7.2.3 Apprentissage d’un mod` ele d’ordonnancement
7.3 E´ valuation
7.3.1 R´ eference et mesures d’ ´evaluation
7.3.2 Bases de comparaison
7.3.3 R´ esultats obtenus
7.4 Discussion
7.4.1 Bilan
7.4.2 Perspectives de recherche
Conclusion et perspectives
Annexes
A Mesures
A.1 Normalisation des vecteurs
A.1.1 Taux de vraisemblance
A.1.2 Discounted log-ods
A.1.3 Information mutuelle
A.1.4 TFIDF
A.2 Similarit ´e de deux vecteurs
A.2.1 Cosine
A.2.2 Jaccard pond´ er ´e
A.2.3 Distance euclidienne
A.2.4 Distance euclidienne normalis´ee
A.3 Comparabilit ´e de deux corpus
A.4 Standardisation des valeurs
A.4.1 Obtention du percentile d’une valeur
A.4.2 Obtention du score-z associ´e au percentile
A.5 Mesures d’ ´evaluation
A.5.1 Couverture
A.5.2 TopN / Precision au rang N
A.5.3 Rappel au rang N
A.5.4 F1-mesure au rang N
A.5.5 MRR : Mean Reciprocal Rank
A.5.6 MAP : Mean Average Precision
A.5.7 NDCG : Normalised Discounted Cumulative Gain
A.6 Accord inter-annotateur
A.6.1 Calcul du Kappa
A.6.2 Interpr ´ etation du Kappa
B Donn´ees
B.1 Corpus comparables
B.1.1 Sciences de l’eau
B.1.2 Cancer du sein
B.2 Textes `a traduire et traductions de r ´ ef ´erence
B.2.1 Sciences de l’eau
B.2.2 Cancer du sein
B.3 Ressources linguistiques
B.3.1 Dictionnaire bilingue g´en´ eraliste
B.3.2 Dictionnaire de synonymes
B.3.3 Tables de traduction des morph`emes
B.3.4 Familles morphologiques
B.3.5 Dictionnaires de cognats
B.3.6 Probabilit ´es de traduction de parties du discours
B.4 Termes sources
B.5 Donn´ees de r ´ ef ´erence pour l’ ´evaluation de la g´en´ eration de traduction
B.5.1 R´ ef ´erence a priori
B.5.2 R´ ef ´erence a posteriori
B.6 Donn´ees pour l’apprentissage et l’ ´evaluation du mod` ele d’ordonnancement
B.6.1 Extraits des donn´ees d’apprentissage
B.6.2 Extrait des donn´ees d’ ´evaluation
B.6.3 Extrait des sorties du syst `eme ordonn´ees
C Interface de consultation des lexiques extraits de corpus comparables
Références
Liste des tableaux
Liste des figures
Liste des algorithmes
Liste des extraits
Bibliographie
Télécharger le rapport complet
