Télécharger le fichier pdf d’un mémoire de fin d’études
Notion de norme linguistique
Variété linguistique de référence
Entre sociolinguistique et linguistique
|
Table des matières
1 Introduction
1.1 Contexte d’étude
1.2 Problématique et objectifs de la thèse
1.3 Organisation du manuscrit
2 La variation linguistique
2.1 Notion de norme linguistique
2.1.1 Norme(s) linguistique(s)
2.1.2 Variété linguistique de référence
2.2 Entre sociolinguistique et linguistique
2.2.1 En sociolinguistique
2.2.2 En linguistique
2.3 Partitionnement de l’espace linguistique
2.3.1 Représentation de l’espace linguistique : entre modalités orale et écrite
2.3.2 Partitionnement de l’espace linguistique
2.4 Conclusion
3 Constitution de corpus
3.1 Contexte et motivations
3.2 Notre modèle d’apprentissage automatique
3.2.1 Approche générale du modèle
3.2.2 Enjeux et problématiques des étapes du modèle
3.3 Travaux préliminaires : corpus TREMoLo-Web
3.3.1 Corpus et sous-corpus
3.3.2 Description du processus d’apprentissage semi-supervisé
3.3.3 Validation de la technique d’apprentissage semi-supervisée
3.3.4 Exploration linguistique du corpus TREMoLo-Web
3.4 Corpus de référence pour les registres de langue français : TREMoLo-Tweets
3.4.1 Constitution du corpus TREMoLo-Tweets
3.4.2 Annotation manuelle de la graine
3.4.3 Étiquetage automatique du corpus TREMoLo-Tweets
3.4.4 Exploration linguistique du corpus TREMoLo-Tweets
3.5 Conclusion
4 La fouille de motifs comme outil automatique
4.1 Fouille de motifs ensemblistes
4.1.1 Cadre théorique
4.1.2 Algorithmes de fouille de motifs ensemblistes
4.1.3 Synthèse
4.2 Fouille de motifs séquentiels
4.2.1 Cadre théorique
4.2.2 Algorithme de fouille de motifs séquentiels
4.2.3 Synthèse
4.3 Application des techniques de fouille de motifs séquentiels à des données textuelles
4.3.1 Fouille de motifs séquentiels dans des données biomédicales
4.3.2 Fouille de motifs séquentiels à partir de textes
4.3.3 Synthèse
4.4 Conclusion
5 Fouille des ensembles de motifs séquentiels émergents caractéristiques des registres de langue
5.1 Chaîne de traitement complète pour la fouille de motifs séquentiels émergents
5.1.1 Vision globale de la chaîne de traitement
5.1.2 Enjeux et problématiques des étapes de la chaîne de traitement
5.2 Preuve de concept à partir de langages artificiels
5.2.1 Construction de la base de vérité et du corpus de langages artificiels
5.2.2 Fouille des motifs séquentiels émergents
5.3 Fouille de motifs séquentiels émergents à partir du corpus TREMoLo-Tweets
5.3.1 Transformation des tweets en séquences
5.3.2 Fouille des motifs séquentiels émergents
5.4 Conclusion
6 Constitution d’un sous-ensemble interprétable de motifs séquentiels émergents
6.1 Réduction de la redondance des motifs séquentiels émergents
6.1.1 Contexte et motivations
6.1.2 Partitionnement de l’ensemble des motifs séquentiels émergents
6.1.3 Synthèse
6.2 Réduction du nombre de motifs séquentiels émergents
6.2.1 Présentations des méthodes de sélections de motifs représentants
6.2.2 Résultats des sélections de motifs représentants
6.3 Évaluation des résultats expérimentaux
6.3.1 Évaluation automatique
6.3.2 Évaluation perceptuelle
6.4 Conclusion
7 Généralisation de notre chaîne de traitement 197
7.1 Introduction
7.2 Corpus TextToKids
7.3 Caractérisation des genres de textes à partir du corpus TextToKids
7.4 Constitution d’un sous-ensemble de résultats
7.5 Conclusion
8 Conclusion 209
8.1 Bilan de la thèse
8.2 Perspectives
8.2.1 Pistes d’approfondissements de notre travail
8.2.2 Pistes d’ouverture à d’autres questions de recherche et applications 213
9 Annexes 217
Bibliographie personnelle 227
Bibliographie 229
Télécharger le rapport complet
