
Avec Anaouder, Dizale propose un logiciel libre de reconnaissance vocale en breton. Un projet collaboratif, frugal et réplicable, qui pourrait inspirer d'autres communautés linguistiques en quête d'outils adaptés à l'ère de l’IA.
Dans la continuité de la table ronde “IA & Créativité” du Interceltic Business Forum de Lorient, où les échanges ont mis en lumière l’urgence pour les langues minoritaires de s’imposer dans le paysage numérique émergent, nous donnons aujourd’hui la parole à un acteur clé du terrain.
Jean-Marie Ollivier, ingénieur du son au sein de Dizale, association bretonne spécialisée dans le doublage audiovisuel, nous présente Anaouder – Istitlañ, le tout premier logiciel libre de reconnaissance vocale et de sous-titrage automatique en langue bretonne.
Dans cet entretien, il revient sur la genèse de ce projet unique, les défis techniques liés aux langues peu dotées, et la manière dont cette approche locale, frugale et collaborative peut inspirer d’autres communautés linguistiques en quête d’outils adaptés à leurs besoins.
Dizale est une association spécialisée dans le doublage en langue bretonne, basée à Quimper. Depuis les années 2000, elle adapte en breton des films, séries, dessins animés et d’autres contenus audiovisuels.
L’association a aussi une vocation pédagogique : ses productions servent autant aux apprenants qu’aux locuteurs natifs qui souhaitent renforcer leur maîtrise de la langue. Dizale a d’ailleurs lancé sa propre plateforme de vidéo à la demande, BreizhVOD, pour diffuser ces contenus plus largement.
Le logiciel s’appelle Anaouder - Istitlañ (reconnaissance & sous-titrage). Il s’agit du premier outil de sous-titrage automatique en langue bretonne, basé sur de la reconnaissance vocale. Il génère automatiquement des sous-titres en breton. Ce logiciel est gratuit et open-source et fonctionne sur Mac, Windows et Linux.
Anaouder – Istitlañ, c’est vraiment le résultat de quatre années de recherches et d’expérimentations. À l’origine, c’est un projet initié par Gweltaz Duval-Guennoc, un développeur passionné… et un ami d’enfance ! On a fait toute notre scolarité à Diwan ensemble. Un jour, Gweltaz est passé au studio de Dizale, où je travaille comme ingénieur du son. On a discuté d’un problème que l’on traînait depuis longtemps : on manque de moyens pour sous-titrer en breton toutes les œuvres que nous doublons. Et comme aucun outil n’existait sur le marché, l’idée est venue assez naturellement : et si on créait nous-mêmes un logiciel basé sur la reconnaissance vocale ?
À partir de là, tout s’est accéléré. Gweltaz a créé sa micro-entreprise, O-Tilde, et Dizale s’est impliqué dans le projet pour tester les versions successives, apporter notre expertise en audiovisuel et vérifier comment les sous-titres générés se comportaient sur nos propres productions. Grâce au soutien de la Région Bretagne, le projet a pu se structurer, gagner en ambition et passer d’une idée portée à deux, à un véritable outil professionnel, devenu aujourd’hui le premier logiciel de sous-titrage automatique en langue bretonne.
Le premier obstacle, c’est clairement le manque de données. Pour les grandes langues, il existe des milliers d’heures d’audio déjà annotées, mais en breton… il faut quasiment tout construire nous-mêmes. Chaque archive compte, et rassembler un corpus suffisamment riche représente énormément de travail.
Ensuite, le breton est une langue très diverse qui connaît comme la plupart des langues une grande variété de parlers : léonard, cornouaillais, trégorrois, vannetais… Toutes ces variantes ont leurs sonorités propres. Certaines, comme le vannetais, sont plus complexes à modéliser. Pour obtenir un outil fiable pour tout le monde, il faut réunir des sources très variées.
Et puis il y a la réalité économique : il n’existe pas de marché massif pour un logiciel en breton. Personne ne va investir des sommes énormes dans ce domaine. Ça nous oblige à travailler autrement : de façon collaborative, ouverte, frugale… et c’est précisément ça qui nous a permis d’avancer.
À court et moyen terme, Anaouder - Isitilañ peut servir à :
Déjà, il faut savoir que Gweltaz vient du monde de l'open source. D’ailleurs, son tout premier prototype de reconnaissance vocale, il l’a développé… en français ! C’était lors d’un atelier au fablab quimpérois Les Portes Logiques, le temps d’un week-end. Donc, forcément, quand on a commencé à parler du projet ensemble, l’idée de l’ouvrir s’est imposée assez naturellement. Ensuite, on voulait vraiment que tout le monde puisse s’en servir : les bretonnants, les développeurs, les associations, les entreprises… On ne voulait pas créer un outil enfermé dans une structure ou réservé à certains usages.
L’objectif, c’était au contraire qu’il soit gratuit, accessible, et que chacun puisse l'adapter à ses propres besoins afin de faciliter au maximum son utilisation. Et puis il y a la dimension linguistique. Pour une langue comme le breton, l’ouverture est presque une nécessité. Plus l’outil est libre, plus il peut être amélioré, réutilisé, détourné. Ça stimule les initiatives locales, ça permet à des compétences de circuler, et ça augmente les chances pour le breton — et peut-être pour d’autres langues ensuite — de bénéficier d’outils technologiques modernes.
Anaouder – Istitlañ a été pensé dès le départ comme un outil qu’on puisse répliquer. Techniquement, il suffit qu’une communauté dispose d’un minimum d’archives audio pour pouvoir entraîner son propre modèle — on fonctionne avec VOSK, qui permet justement de créer des modèles de reconnaissance vocale adaptés à chaque langue. L’idée, c’est d’offrir un cadre clair : un outil open source, une méthode accessible et un système qui ne demande pas d’avoir un grand laboratoire de recherche derrière soi.
C’est une approche réaliste pour des langues minorisées, où les moyens sont limités mais où l’envie d’avancer est forte. Et on en a déjà eu la preuve. Lors d'un Workshop en début d'année, Gweltaz a collaboré avec des chercheurs de l'Université de Bangor, et en quelques jours seulement ils ont pu reproduire un modèle analogue, mais pour le Gallois ! Puisqu'il est de même architecture, le modèle gallois pourrait également s'utiliser dans Anaouder.
Pour nous, c’est exactement ce que permet l’open source : chaque langue peut s’emparer de l’outil, l’adapter, le faire évoluer. Que ce soit le gallois, le corse, l’occitan ou d’autres langues menacées, Anaouder montre qu’il est possible de construire des technologies modernes localement, sans budgets colossaux.
Comparer la Bretagne aux autres régions celtiques n’a rien d’évident : l’Irlande, le Pays de Galles ou l’Écosse disposent de budgets dédiés, de financements clairement identifiés et multiples, car leurs langues sont officielles. Ils bénéficient ainsi de laboratoires universitaires et même de services speech-to-text proposés par les grands acteurs du numérique. Nous, en Bretagne, malgré un budget dédié au breton de la part de collectivités locales comme la région Bretagne, notre absence de statut de langue officielle nous oblige à travailler avec moins de moyens.
Mais justement, c’est là que notre approche apporte quelque chose de différent : un modèle léger, local et réplicable, qui ne dépend pas d’infrastructures cloud et qui fonctionne avec des ressources modestes. Grâce à l’open-source, on prouve qu’il est possible de créer des outils efficaces pour des langues minorisées, même sans gros budgets ni écosystèmes industriels.
Là où la Bretagne peut vraiment contribuer, c’est en montrant qu’une autre voie est possible. Nous développons des outils frugaux, qui fonctionnent sans infrastructures coûteuses et qui peuvent tourner localement, même sur des machines modestes. Grâce à l’open source, cette approche est facilement transférable : n’importe quelle communauté linguistique peut s’en emparer, l’adapter et l’améliorer.
C’est ce modèle-là que nous pouvons partager : une approche agile, reproductible et communautaire, qui donne à chaque langue minorisée la possibilité d’exister aussi dans le numérique.

Avec Anaouder, Dizale propose un logiciel libre de reconnaissance vocale en breton. Un projet collaboratif, frugal et réplicable, qui pourrait inspirer d'autres communautés linguistiques en quête d'outils adaptés à l'ère de l’IA.
Read More
Interceltic Business Forum Hosts Dublin Dinner Gathering AI Leaders to Champion Local Innovation Across Celtic Nations
Read More
EXID-CD rencontre Mark O’Connor au Interceltic Business Forum 2025 et soutient son défi : la Mini Transat, une aventure humaine et interceltique.
Read More
Discover how Celtic identity is powering cross-border innovation, investment, and community on the Scottish Business Network Podcast with Charles Kergaravat.
Read More