Résultats de recherche

filters logos

Filtrer les résultats

arrow down
Années
Type de contenu
Exporter les résultats Sauvegarder les résultats
1 résultats de recherche
pen icon Colloque
Contraintes et atouts du corpus Érudit pour le traitement automatique de la langue
quote

La présentation procédera à un examen systématique des caractéristiques du corpus d'Éruditd'un point de vue de traitement automatique de la langue (TAL). Celles‐ci incluent les suivantes :(1) ses caractéristiques informatiques, dont principalement le format des documents, laprésence de métadonnées explicites et l'existence de balisage sémantique étendu; (2) lescaractéristiques linguistiques du corpus, notamment le degré de multilinguisme des textes, levocabulaire utilisé, étudié à la fois d'un point de vue terminologique et de sémantique lexicale,ainsi que quelques éléments de linguistique textuelle telle qu'observée dans un échantillon ducorpus; (3) un certain nombre de critères pragmatiques, incluant les distinctions entre revuesscientifiques et culturelles ainsi …

quote