Veuillez choisir le dossier dans lequel vous souhaitez ajouter ce contenu :
Filtrer les résultats
Nous présentons le projet QALB (Qatar Arabic Language Bank) qui porte sur la création d’un corpus en langue arabe de 2 millions de mots annotés manuellement avec les erreurs et leurs corrections (orthographe, syntaxe, grammaire, ponctuation et l’usage des dialectes). Le deuxième volet de ce projet porte sur la création d’un système de correction automatique des erreurs pour la langue arabe.Afin de couvrir une plus grande variété de textes, le corpus couvre trois sources : commentaires sur des articles en ligne par des lecteurs du site Aljazeera.net, des travaux d’étudiants natifs arabophones, des travaux d’apprenants de l’arabe ainsi qu’un ensemble …