Apertus alimente le système de traduction IA du canton du Tessin

Alps Supercomputer © 2026 CSCS - CC-BY-SA 4.0
Langues multiples, documents sensibles et règles strictes en matière de confidentialité : pour les employés du canton du Tessin, la traduction automatique n’est pas une mince affaire. L’administration met désormais en place un système de traduction interne basé sur le grand modèle de langage suisse Apertus, luipermettant de garder le contrôle sur les données sensibles.
Italien, allemand, français, espagnol, roumain, ukrainien : ce sont là quelques-unes des languesque les employés du canton du Tessin doivent traduire. Étant l’un des deux seuls cantons suisses ayant l’italien comme langue officielle, le Tessin traite un volume important de documents nécessitant une traduction. Souvent, les informations contenues dans ces documents sont sensibles et doivent rester confidentielles. C’est pourquoi l’administration cantonalemet en place une solution interne fermée et sécurisée. Le Centre des systèmes informatiques du Tessin (Centro sistemi informativi, CSI) a désormais installé un outil de traduction basé sur l’IA qui utilise Apertus comme mgrand modèle de langage (LLM).
Lancé en septembre 2025, Apertus est le grand modèle transparent et entièrement open source de la Suisse. Il a été développé dans le cadre de l’Initiative suisse pour l’IA par l’ETH Zurich, l’EPFL et le Centre suisse de calcul scientifique (CSCS). Le Laboratoire de traitement du langage naturel et le Laboratoire d’apprentissage automatique et d’optimisation de l’IC ont joué un rôle déterminant dans cette initiative.
Le modèle de base est disponible gratuitement en deux versions : l’une comptant 8 milliards de paramètres, l’autre 70 milliards. Les deux modèles sont publiés sous une licence open source permissive, ce qui permet leur utilisation dans l’enseignement et la recherche, ainsi que dans des applications sociétales et commerciales plus larges. Une entreprise basée au Tessin, Artificialy, a désormais développé pour le canton une version optimisée du plus petit modèle, Apertus 8b.
Les performances du modèle Apertus plus petit
Pour affiner le modèle de base Apertus 8b, les experts d’Artificialy ont utilisé des ensembles de données conçus pour optimiser le modèle en vue de la traduction – non seulement pour les langues officielles de la Suisse, mais aussi, par exemple, pour le roumain et l’ukrainien. Au cours d’un processus en plusieurs étapes, des ensembles de données soigneusement sélectionnés ont été utilisés pour améliorer progressivement l’exactitude et la précision linguistiques. Lors de la dernière étape, le modèle est adapté à la traduction à l’aide de textes d’exemple traduits manuellement et de retours d’expérience humains.
«Même s’il s’agit du plus petit des deux modèles publiés, l’Apertus 8b optimisé fonctionne très bien pour la traduction », explique Luca Gambardella, PDG et cofondateur d’Artificialy et professeur d’IA à l’Università della Svizzera italiana (USI).
D’après les tests de performance réalisés par l’entreprise pour comparer différents modèles, Apertus 8b a obtenu un score de 90 % avant le rfine-tuning (ou réglage), tandis que le modèle plus puissant Apertus 70b a atteint 92 %. À titre de comparaison, le modèle LLaMa Scout de Meta a obtenu un score de 91,4 %. Après le fine-tuning, l’outil basé sur Apertus 8b a atteint 94 % — un résultat élevé, comme le souligne Luca Gambardella. « Ces bons résultats aux tests de performance ont été un facteur déterminant dans notre décision d’utiliser Apertus pour notre outil de traduction », explique-t-il.
Une solution basée sur Apertus : confidentielle, éthique, souveraine
Pour le canton du Tessin, cet outil de traduction basé sur Apertus s’inscrit dans le prolongement d’un projet pilote en cours. « Bon nombre de nos documents contiennent des informations privées et sensibles, et nous devons garantir une protection des données appropriée », explique Rudi Belotti, responsable des systèmes et du support utilisateurs au Centre cantonal des systèmes informatiques (CSI). Si l’utilisation d’outils de traduction IA en ligne tels que DeepL est autorisée pour les employés cantonaux, ceux-ci doivent strictement respecter les réglementations en matière de protection des données et anonymiser les documents manuellement lorsque cela est nécessaire. Ces complications disparaissent avec l’outil de traduction IA interne basé sur Apertus. La solution est hébergée dans le centre de données du CSI, où des processeurs GPU ont été installés pour exécuter des solutions d’IA locales.
Jusqu’à présent, l’outil de traduction d’Artificialy, intégré à sa « PrivateAI Suite », utilisait Mixtral comme LLM sous-jacent, un modèle développé par la société française Mistral AI. Cependant, ce modèle n’est que partiellement open source : si les paramètres du modèle sont rendus publics, l’ensemble des données d’entraînement et le pipeline d’entraînement ne le sont pas. En revanche, Apertus est entièrement open source : les paramètres du modèle, le code d’entraînement, les données d’entraînement et l’intégralité du pipeline d’entraînement sont documentés et accessibles au public.
« C'est là une autre raison importante qui nous a poussés à opter pour Apertus », explique Rudi Belotti. « En tant qu’administration publique, nous nous sentons tenus d’utiliser des applications logicielles éthiques. Avec Apertus, nous avons la certitude que le modèle a été entraîné en Suisse et conformément aux normes éthiques les plus strictes, ce qui signifie qu’il utilise des données qui n’étaient ni propriétaires ni protégées par des droits d’auteur, mais qui ont été publiées à des fins d’entraînement de l’IA. » De plus, grâce à cette solution, le canton retrouve la maîtrise de ses procédures de traduction, puisque tant le matériel que la solution d’IA sont situés sur place plutôt que dans des centres de données hors de Suisse.
De la phase de test à la mise à disposition complète
Dans un premier temps, le nouvel outil basé sur Apertus sera testé par une centaine d’employés cantonaux qui ont besoin de traductions au quotidien et ont demandé une solution de traduction automatisée par IA pour faciliter leur travail. Leurs retours seront recueillis et, dans la mesure du possible, intégrés à l’outil. « La phase de test débutera dans les semaines à venir », explique Rudi Belotti. « D’après les tests de performance, cette solution semble très prometteuse. Nous sommes impatients de la mettre à la disposition de nos utilisateurs internes, en commençant par les collaborateurs qui traitent des données confidentielles devant rester dans le périmètre de notre centre de données. »