Le contexte
Depuis sa création en 2016, le direct de franceinfo: est partiellement sous-titré par france•tvaccess., filiale de France Télévisions. 6 heures et 15 minutes réparties comme ceci :
En 2021, un projet de sous-titrage automatique a été prototypé, avec l'objectif de compléter l'offre.
Ce projet a été présenté aux associations de personnes sourdes et malentendantes. Une version expérimentale a été mise en ligne sur le site francetvlab pendant l’été 2022, un questionnaire associé a permis recueillir en priorité les avis des futurs utilisateurs de ces sous-titres.
Les retours de cette enquête s'étant avérés particulièrement positifs, suite à la consultation de l'ARCOM et du CNCPH*, Delphine Ernotte-Cunci a demandé à la Direction des technologies et des Systèmes d’Information d'industrialiser la solution. Elle sera prête un an plus tard, en novembre 2023.
Des travaux de réfection de l’infrastructure de diffusion de la chaine étaient nécessaires à la régie finale de France Télévisions. Lancés après les JOP de Paris 2024, il a fallu attendre leur achèvement pour lancer la solution.
*CNCPH : Conseil National Consultatif des Personnes Handicapées
Comment ça marche ?
Le signal franceinfo: est envoyé à la plateforme MCAI*. Trois micro-services vont alors être opérés :
14 secondes sont nécessaires à l’exécution de ces trois étapes afin de laisser le temps à l’IA d’assurer la meilleure orthographe possible puis de former des sous-titres sur 2 lignes.
On retarde d’autant le signal franceinfo;, de manière à ce que les sous-titres soient parfaitement synchronisés à l’image.
L’ensemble du procédé est enclenché par la régie de diffusion des sous-titres de france•tvstudio (filiale de franceTV) et supervisé par le cockpit de diffusion de la régie finale de France Télévisions.
Cette prouesse technologique est permise par le recours à un ensemble de micro services Data & IA scalable qui repose sur la technologie Kubernetes du programme ALIX. Le sous titrage est monitoré en direct par l'offre ALIX Eyes Promethus / Grafana pour garantir la haute disponibilité des infrastructures qui soutiennent le processus.
« Cette offre de service s’inscrit dans le programme ALIX Data porté par la direction de l’IT Transverse de France Télévisions. Je suis fière que la technologie de DaIA serve de base au sous-titrage automatique et ainsi participe à notre mission commune de service public » dit Pauline Maury, directrice du département Data & IA de France Télévisions.
Afin d’améliorer le service, franceinfo: enrichit continuellement l’outil de transcription en lui communiquant la phonétique des nouveaux mots (principalement des noms propres).
« Lorsque nous avons démarré ce projet en 2021 à DaIA, il a fallu repenser notre plate-forme d’IA pour traiter des flux en direct. Ensuite nous nous sommes attachés à rendre le service d’IA robuste et résilient en rassemblant le savoir-faire de plusieurs experts de la Direction des Technologies et des Systèmes d’Information. Ces sous-titres automatiques sont particulièrement attendus par 3 millions de malentendants » dit Matthieu Parmentier qui dirigeait le département DaIA (Data & Intelligence Artificielle) à France Télévisions avant de devenir directeur de france•tvaccess en avril 2023.
*Media Cloud Artificial Intelligence est une plateforme open source développée au sein du département Data & Intelligence Artificielle de France Télévisions. Elle permet de manipuler des médias dans un environnement Cloud en appliquant des outils IA ou classiques.
https://media-cloud.ai/blast.html
*ALIX : programme de modernisation des services et technologies mené par la direction des l’IT Transverse de France Télévisions
Le service
Ce sont donc 12 heures de sous-titrage automatique qui s’ajoutent aux 6 heures 15 déjà produites par france•tvaccess. Le tout synchronisé à l’image, ce qui représente un confort pour les usagers et qui manquait regrettablement jusque-là.
Il s'agit pour l'instant d'une exclusivité de la plateforme france•tv (sur le web, l'appli, les applications iOS, Android et TV connectées ainsi que les univers france.tv présentes sur certaines box des fournisseurs d'accès Internet). Le service n'est pas disponible sur les vecteurs où franceinfo: se retrouve en concurrence avec les autres chaines d'information tels que la TNT, le satellite et les box des FAI.
Pour activer le service, il faut se rendre dans le menu audio et sous-titres en bas à droite du lecteur vidéo de franceinfo:. Sont proposés deux choix :
Les sous-titres automatiques ne sont pas prévus pour les personnes sourdes car de nombreux critères de qualité manquent encore, tels que le code couleurs ainsi qu’une identification fiable des différents locuteurs. Il s’agit néanmoins d’une première étape d’accessibilité qui repose surtout sur la synchronisation entre les sous-titres et l’audio attendue de longue date.