Archives pour la catégorie Ressources

Apertus, un LLM suisse open-source

Le 2 septembre 2025, l‘Initiative suisse pour l’IA, une collaboration entre l’EPFL, l’ETH Zurich et le Centre suisse de calcul scientifique (CSCS), a lancé Apertus, le premier modèle linguistique ouvert à grande échelle du pays. Conçu dans le respect des valeurs suisses – transparence, multilinguisme et service public –, Apertus est un modèle de base entièrement open source disponible en deux versions (8B et 70B) sous licence Apache 2.0.

En juillet, l’EPFL, l’ETH Zurich et le CSCS ont annoncé leur initiative commune visant à créer un grand modèle linguistique (LLM). Ce modèle est désormais disponible et sert de base aux développeurs et aux organisations pour de futures applications telles que les chatbots, les systèmes de traduction ou les outils pédagogiques.

Le modèle s’appelle Apertus, qui signifie « ouvert » en latin, soulignant ainsi sa caractéristique distinctive : l’ensemble du processus de développement, y compris son architecture, les poids du modèle, les données d’entraînement et les recettes, est librement accessible et entièrement documenté.

Les chercheurs en IA, les professionnels et les passionnés expérimentés peuvent soit accéder au modèle via le partenaire stratégique Swisscom, soit le télécharger depuis Hugging Face – une plateforme dédiée aux modèles et applications d’IA – et le déployer pour leurs propres projets. Apertus est disponible gratuitement en deux tailles, avec 8 milliards et 70 milliards de paramètres, le modèle le plus petit étant plus adapté à un usage individuel. Les deux modèles sont publiés sous une licence open source permissive, ce qui permet leur utilisation dans l’enseignement et la recherche, ainsi que dans de nombreuses applications sociales et commerciales.

Il s’agit désormais de l’un des modèles linguistiques multilingues les plus puissants jamais publiés par une institution publique, et il est accessible à tous via l’utilitaire Public AI Inference Utility.

Si vous êtes en Suisse, vous pouvez essayer Apertus via Swisscom ou lors des événements Swiss AI Weeks. Si vous êtes en dehors de la Suisse, ou si vous êtes simplement curieux, vous pouvez essayer Apertus ici même, via l’utilitaire public d’inférence IA.

Ouverture par conception

Le nom « Apertus » vient du latin et signifie « ouvert ». Tout dans ce modèle est transparent et reproductible :

  • l’architecture de formation, les ensembles de données et les recettes
  • les poids du modèle, y compris les points de contrôle intermédiaires
  • le code source, les journaux et les guides de déploiement

Contrairement aux modèles qui offrent un accès partiel, Apertus est entièrement inspectable et modifiable, ce qui permet aux développeurs, aux chercheurs et aux institutions d’avoir une visibilité complète sur la manière dont le modèle a été construit et sur son comportement.

Multilingue et inclusif

Apertus a été entraîné sur 15 000 milliards de tokens dans plus de 1 500 langues, dont 40 % des données d’entraînement dans des langues autres que l’anglais. Cela inclut des langues suisses telles que le romanche et l’allemand, ainsi que de nombreuses autres langues historiquement sous-représentées dans les LLM privés grand public.

Pour la recherche, prêt à l’emploi dans l’industrie

Apertus est conçu à la fois pour la recherche et les applications concrètes. Le modèle 70B offre des performances de pointe et est idéal pour un déploiement à grande échelle. La version 8B offre des performances rapides et nécessite moins de ressources, ce qui la rend adaptée à la mise au point ou à une utilisation locale. Sous licence Apache 2.0, les deux modèles peuvent être utilisés pour :

  • Recherche et enseignement
  • Applications commerciales
  • Traduction, résumé, chatbots, systèmes de tutorat, etc.

Pratiques responsables en matière de données

Le LLM est développé en tenant dûment compte des lois suisses sur la protection des données, des droits d’auteur, ainsi que des obligations de transparence du règlement européen sur l’IA (Loi sur l’IA de l’UE). Une étude récente menée par les responsables du projet montre qu’exclure le contenu protégé par copyright lors de la collecte de données ne détériore en rien les performances du modèle sur la plupart des tâches quotidiennes et l’acquisition de connaissances générales.

A propos d’Apertus et de l’Initiative Swiss AI

Apertus a été développé dans le cadre de l’Initiative Swiss AI, menée par l’EPFL et l’ETH Zurich. Il résulte d’un effort collaboratif réunissant chercheurs, ingénieurs et étudiants de toute la Suisse, avec le soutien technique du Centre national suisse de calcul scientifique (CSCS) qui dispose d’une infrastructure de premier plan en matière de puissance de calcul. Cette expertise collective, issue de plusieurs institutions et disciplines, a rendu le développement d’Apertus possible.

Financement et partenariats stratégiques

Le développement de ce modèle linguistique de grande ampleur, ainsi que la recherche sur les modèles de fondation spécifiques à certains domaines, est financé par le Conseil des EPF, l’organe de direction stratégique du Domaine des EPF (comprenant l’ETH Zurich, l’EPFL, le WSL, le PSI, l’Empa et l’Eawag). Ce financement est complété par la contribution de partenaires stratégiques, notamment Swisscom, premier fournisseur de télécommunications de Suisse.A propos de Swiss {ai} Weeks
Les Swiss {ai} Weeks sont une initiative collaborative visant à transformer les avancées de la recherche suisse en IA en un impact concret pour la société et l’économie. Par le biais de hackathons, d’événements d’experts, de rencontres publiques et d’incubation de startups, elles rassemblent chercheurs, développeurs, entrepreneurs et citoyens autour d’un objectif commun : promouvoir une IA éthique, ouverte et digne de confiance. Au cœur de cette initiative se trouve le premier grand modèle de langage open source suisse — développé dans l’esprit des valeurs suisses : transparence, responsabilité et multilinguisme. Les Swiss {ai} Weeks insufflent ainsi un élan collectif en faveur d’applications d’IA responsables — décentralisées, pratiques et orientées vers le bien commun. L’initiative est portée par le EPFL AI Center, l’ETH AI Center, Swisscom, Impact Hub Switzerland, Kickstart Innovation, Panter et Wildcard Media.


Auteurs: Melissa Anchisi / EPFLFlorian Meyer ETH Zurich, CSCS

Source: EPFL

Via https://actu.epfl.ch/news/un-grand-modele-de-langage-concu-pour-le-bien-publ/