Apertium
Apertium : plate-forme libre/de code source ouvert pour traduction automatique
Qu'est-ce que c'est Apertium ?
Apertium est une plate-forme de traduction automatique libre/de code source ouvert. Initialement conçue pour des paires de langues apparantées, Apertium a été récemment développé pour d'autres paires de langues plus éloignées (comme l'anglais–catalan). La plate-forme fournit
- un moteur de traduction automatique indépendant d'une langue quelconque
- des outils pour gérer les données linguistiques nécessaires pour construire un système de traduction automatique pour une paire donnée
- des données linguistiques pour un nombre toujours croissant de paires de langues.
Apertium utilise un moteur de traduction automatique par transfert superficiel qui traite en plusieurs étapes le texte d'entrée, comme dans une chaîne de montage : déformatage, analyse morphologique, transfert superficiel des structures, transfert lexical, génération morphologique, et reformatage.
Apertium utilise un transducteur d'état fini pour toutes les opérations du traitement lexical (analyse morphologique et génération morphologique, transfert lexical), des modèles de Markov cachés pour le balisage des catégories grammaticales, une décomposition en plusieurs étapes à des états finis pour le transfert des structures.
Les premières versions étaient en grande partie fondées sur des systèmes développés par le groupe Transducens de la Université d'Alacant, comme par exemple interNOSTRUM (espagnol-catalan, et) Traductor Universia (espagnol-portugais).
Il est possible d'utiliser Apertium pour créer des systèmes de traduction automatique pour d'autres paires de langues. Pour ce faire, Apertium utilise des simples fichiers au format XML pour encoder les données linguistiques nécessaires (cela peut se faire manuellement ou en convertissant les données déjà existantes), qui sont compilées grâce aux outils disponibles pour obtenir des formats très rapides utilisées par le moteur d'Apertium.
Qui développe Apertium?
L'architecture Apertium est développée par le groupe de recherche Transducens du Departament de Llenguatges i Sistemes Informàtics de l' Universitat d'Alacant en partenariat avec Prompsit Language Engineering.
Les données linguistiques pour Apertium sont développées par:
Transducens et Prompsit
- espagnol–catalan
- espagnol–portugais
- catalan–français
- occitan–catalan
- anglais–catalan
le Seminario de Lingüística Informática de la Universidade de Vigo:
- espagnol–Galician
et de l' Institut Universitari de Lingüística Aplicada de l' Universitat Pompeu Fabra à Barcelone
- occitan–catalan
- anglais–catalan
- français–catalan
D'autres nombreux développeurs ont créé des nouvelles paires. Vous pouvez visiter le dépôt SVN pour voir la dernière version en développement. Vous pouvez aussi voir certaines modifications sur l'ancien dépôt CVS.
Apertium souhaite toujours accueillir des nouveaux développeurs dans son équipe. Si vous pensez que vous pouvez améliorer le moteur, les outils, les données linguistiques, n'hésitez pas à nous contacter (voir ci-dessous)
Financement
Apertium est l'un des deux moteurs de traduction automatique développé au sein du projet OpenTrad (2004–2005). Apertium est conçu pour développer des paires de langues apparentées (consultez la documentation). Le consortium OpenTRad était mené par Eleka Ingeniaritza Linguistikoa.
Le projet Opentrad ("Logiciel libre de traduction automatique pour les langues de l'État espagnol") a été financé par le Ministère de l'Industrie, le Tourisme et le Commerce de l'Espagne par le biais de bourses PROFIT ayant pour référence FIT340101-2004-0003 et FIT340001-2005-0002.
Plus récemment, Apertium a aussi reçu un financement de la Generalitat de Catalogne (le gouvernement de la communauté autonome de Catalagone, en Espagne) pour développer des nouvelles paires de langues et une nouvelle architecture(Apertium 2.0) pour traiter des paires plus difficiles comme l'anglais–catalan et à nouveau du Ministère de l'Industrie, le Tourisme et le Commerce d'Espagne par le biais d'une bourse PROFIT ayant pour réference FIT350401-2006-05 (EurOpenTrad).
Certaines parties d'Apertium ont été financées par l'Universitat d'Alacant.