w Par vahé ter minassian 12 Un conducteur français égaré pourra facilement retrouver son chemin en se laissant guider par la voix de son GPS. Mais si ce chauffeur parle uniquement l’islandais, l’irlandais ou le maltais, il risque d’avoir beaucoup plus de problèmes. En effet, selon la dernière étude internationale Meta-Net 1, ces langues comptent parmi les 21 d’Europe qui sont sous-équipées en technologies du langage : leurs locuteurs sont ainsi privés d’accès à la plupart des services communicants. Correcteurs orthographiques et grammaticaux, assistants personnels interactifs, systèmes de dialogue par téléphone, outils de traduction automatique, moteurs de recherche sur le Web, synthétiseurs vocaux des GPS… À l’ère du toutnumérique, les technologies du langage se sont largement démocratisées. Mais sont-elles réellement accessibles dans toutes les langues européennes ? Et, lorsqu’elles le sont, leur qualité et leur diffusion sont-elles satisfaisantes ? Un constat inquiétanT C’est à ces différentes questions qu’ont voulu répondre les quelque 200 experts du réseau d’excellence européen Meta-Net. Celui-ci réunit une soixantaine de centres de recherche spécialisés dans les logiciels de traitement automatique du langage, écrit, parlé ou signé. Ils sont implantés dans une trentaine de pays européens, dont la France. Pour la première fois, ces experts ont dressé un état des lieux des équipements disponibles dans une trentaine des quelque 80 langues européennes. Au mois de septembre, ce travail de recensement et de comparaison s’est concrétisé dans une série de livres blancs. Celui consacré au français a été élaboré sous la coordination de Joseph-Jean Mariani, directeur de l’Institut des | Actualités cnrs I LE JOURNAL Technologie Le développement des outils numériques avantage certaines langues européennes, tandis que d’autres souffrent d’un cruel déficit de moyens. 21 langues menacées d’extinction numérique EN LIGNE. Les livres blancs sont téléchargeables à l’adresse suivante : > www.meta-net.eu/whitepapers/overview © I. Mojzes/FOTOLIA q Les outils numériques vocaux, tels les GPS, ne sont pas disponibles dans toutes les langues parlées en Europe. technologies multilingues et multimédias de l’information (Immi) 2. Et le constat final est inquiétant. Au moins 21 des 30 langues européennes étudiées (27 langues nationales et 3 langues régionales) seraient actuellement en danger « d’extinction numérique ». D’ailleurs, aucune d’entre elles ne disposerait d’un soutien technologique « excellent ». Comme on pouvait s’y attendre, l’anglais tire son épingle du jeu ; en revanche, la situation du français, de l’allemand, de l’italien, de l’espagnol et du néerlandais ne serait que « moyenne ». Enfin, 5 langues (l’irlandais, l’islandais, le letton, le lituanien et le maltais) seraient presque totalement démunies d’outils de qualité : à cet égard, elles seraient encore plus mal loties que certaines langues régionales comme le basque ou le catalan. un enjeu politique Comment expliquer de tels résultats ? Bien sûr, la mise au point des outils requiert l’existence de volumes importants de données écrites ou parlées. Mais si les 5 langues précitées pâtissent de leur faible nombre de locuteurs, tel n’est pas forcément le cas des autres. Le français, par exemple, compte 220 millions de locuteurs dans le monde et plus de 100 millions d’apprenants. « On doit imputer l’importance des écarts technologiques à la concentration des efforts de R & D sur l’anglais, au manque d’investissements sur le long terme pour les autres langues, mais aussi à l’absence d’une démarche européenne coordonnée », regrette Joseph-Jean Mariani. Par ailleurs, l’Europe, et la France en particulier, pourtant dotées d’une recherche de qualité, sont pénalisées par la faiblesse de leur tissu industriel et par l’absence de grandes entreprises investies sur le sujet. Face à ce constat, Meta-Net préconise donc un effort concerté de grande envergure et de longue haleine, au niveau européen, portant un double objectif : créer les technologies nécessaires, mais aussi les déployer vers l’ensemble de ces langues. Toutefois, prévient Joseph-Jean Mariani : « Ce problème ne saurait être abordé sous le seul angle technologique. » Cette question doit aussi mobiliser une volonté politique, comme cela a été le cas pour l’Inde, qui s’est lancée dans un vaste chantier pour doter ses 22 langues constitutionnellement reconnues d’outils numériques. Pour avancer sur le sujet, l’Europe doit faire du multilinguisme un enjeu majeur, et de la disponibilité des technologies de la langue, la seule solution pour l’assurer pleinement. 1. Meta-Net est l’abréviation de Multilingual Europe Technology Alliance Network. 2. Unité CNRS/Université Paris-Sud/Institut de technologie de Karlsruhe/Université RWTH Aachen. Contact : Institut des technologies multilingues et multimédias de l’information, Orsay Joseph-Jean Mariani > joseph.mariani@limsi.fr |