Title-tribunes

La Nouvelle surveillance

RGI, le Référentiel Général Inachevé
Par Jean-Marie Gouarné

La programmation par contraintes pour sauver l'environnement
Par Jean-Marie Chauvet

Standardisation : uniformisation ou valeur ?
Par Sabine Bohnké, fondatrice du cabinet Sapientis

Où est le cloud computing ? par Jean-Marie Chauvet

Toute les tribunes

Title-video
IP Convergence 200916233662:jpeg_preview_smallLogo-itrtv
Title-themes Applat_menu_gauche2 Applat_menu_gauche_cmt

Le green IT et les TIC pourront ils sauver la planète ?

par Frederic_L
le 03/07/2009 à 11:55

Un logiciel (gratuit) pour comparer et gérer ses offres de financement

par kay
le 02/07/2009 à 23:48

Les internautes aiment Bing mais restent sur Google, pour l’instant

par jack
le 01/07/2009 à 11:23

L’administration française au cœur des actions du plan de relance numérique

par EPI
le 30/06/2009 à 07:47

540 suppressions de postes en projet chez HPF-HPCCF

par meetxav
le 27/06/2009 à 12:03

Rechercher
Services
Logo_abonn Nerim Flash-securite Job Derniers Proposer un communiqué de presse
Fils RSS : Top 10 quotidien

La Commission européenne facilite la traduction assistée par ordinateur et la rend plus accessible

lundi 21 janvier 2008

 

La Commission européenne a franchi une nouvelle étape dans sa volonté de promouvoir le multilinguisme comme un élément essentiel de l'unité européenne dans la diversité. Son corpus, qui contient environ 1 million de phrases et leurs traductions de haute qualité dans 22 des 23 langues officielles de l'UE - y compris celles des nouveaux États membres -, est le plus grand jamais réuni dans autant de langues et est désormais librement accessible. Ce type de données est très recherché par les concepteurs de systèmes de traduction automatique dans lesquels le logiciel «apprend», à partir de textes traduits par l'homme, à traduire correctement des mots et des expressions remis en contexte. Ces données peuvent également faciliter le développement d'autres outils logiciels linguistiques tels que les correcteurs grammaticaux et orthographiques, les dictionnaires en ligne et les systèmes de catégorisation de textes multilingues.

 

Les institutions de l'UE possèdent un nombre de textes multilingues plus important que n'importe quelle autre organisation du fait de l'obligation de traduire le droit communautaire dans chacune des 23 langues officielles. Leurs services de traduction travaillent avec 253 combinaisons de paires de langues potentielles et traduisent environ 1,5 million de pages par an.

 

S'il existe de nombreuses traductions de textes anglais ou français sur l'Internet, les ressources sont plus rares pour des langues comme le letton ou le roumain et elles sont pratiquement inexistantes pour les combinaisons de deux langues pour lesquelles peu de ressources existent.

 

La Commission publie donc, grâce à la coopération de ses traducteurs et de ses chercheurs en interne, un vaste corpus de phrases extraites de documents juridiques couvrant les domaines technique, politique et social, disponibles en 22 langues. Dans ce recueil de traduction, il est possible de trouver des phrases et leur équivalent dans toutes les autres langues officielles. Seules les traductions en gaélique ne sont pas encore disponibles. La publication de ces données linguistiques constitue un bon exemple de la politique transparente menée par la Commission pour la réutilisation de ses informations et suit l'ouverture au public des bases de données documentaires et terminologiques de l'Union européenne, Eur-Lex et IATE.

 

La Commission possède une vaste expérience dans le développement d'outils pour le traitement de textes multilingues et se trouve à l'avant-garde du multilinguisme, en offrant au public la possibilité de rechercher des articles de presse dans 35 langues sur son site European Media Monitoring. Le volet «Technologies de l'information et de la communication» du 7e programme-cadre de recherche et de développement soutient la recherche sur la traduction automatique et sur d'autres technologies liées au langage.

 

 

Pour de plus amples informations sur les données de traduction

Printer Imprimer l'article
Email Transférer par mail

Les 10 derniers articles mis en ligne

On en a parlé
ATI BI Bouygues Canon EFI EMC INFOGERANCE INFOR LG MedPi PC SOA SUN TEL acer afrique alerte amazon aol apple application archivage ares bande bull ca cast crm dell difficultés dvd eds epson erp ever facturation factures fnac free fujitsu ged google gps hervier hp ibm ilog inde iona lexmark logitech lyon m& media micro application microsoft migration mobilité nec nokia open source oracle orange pac pc portable pilotage reporting restructuration rsa rss sage samsung sap sas sauvegarde sfr si sony stockage symantec telephone tendance tic tma toshiba virtualisation vista voip web xbox