Pour un journaliste, la retranscription d’une interview est une angoisse. Des heures et des heures à écouter, réécouter et écrire chaque mot, chaque phrase. Ils sont nombreux à avoir passer des nuits blanches sur cet exercice qui fait toutefois partie des grands genres du métier. Heureusement, avec la technologie, ce travail harassant pourrait être allégé.
C’est l’une des utilisations très concrètes de l’intelligence artificielle : la transcription automatique en texte à partir d’un fichier audio. Une révolution pour les étudiants, les médecins, les journalistes notamment, mais aussi en entreprises. Depuis un an, le nombre de solutions logicielles ou matérielles de transcription automatique a explosé. Pour être précis, la sortie de la solution de retranscription Whisper, mise à disposition par OpenAI, sert de fondation à une multitude d’applications de conversion de fichier audio vers du texte.
Whisper, une IA moins entrainée sur la langue française
Prenons l’exemple d’un journaliste qui réalise une interview, et qui a besoin de transcrire le son des questions-réponses : un exercice fastidieux qui peut prendre plusieurs heures. Désormais, grâce à l’IA, il suffit d’importer le fichier audio dans une application ou un logiciel pour obtenir, en quelques secondes, la transcription intégrale de l’interview sous forme de texte. Toutefois, la fidélité du texte dépend de la qualité audio, de la qualité de l’IA et de son modèle. Plus il est grand, plus il nécessite de la mémoire et de la puissance, plus le traitement demande du temps mais aussi plus la transcription est précise.
La fidélité du texte dépend enfin de la langue. Les IA américaines sont moins entraînées sur le français que l’anglais. Il reste dès lors des erreurs à corriger mais le gain de temps est, dans tous les cas, spectaculaire. Pour profiter de ces transcriptions automatiques avec l’IA, on peut donc utiliser une application ou un logiciel. Il en existe des dizaines qui reposent soit sur Whisper, soit sur d’autres technologies comme Watson d’IBM.
Le Plaud Note et les applications de retranscriptions automatiques
Par exemple, sur Android, Speechnotes de Google ; Transcribe sur iPhone ; sur PC, la reconnaissance vocale intégrée à Windows ; et sur Mac, MacWhisper. Dans cette galaxie, on rencontre plusieurs modèles économiques : du gratuit au payant en passant par des abonnements avec un quota de minutes de transcription par mois, voire de traduction dans d’autres langues.
Et puis, il y a cet accessoire, le Plaud Note, lancé en Europe, lors du salon Viva Technology 2024, à Paris. Imaginez un dictaphone révolutionnaire en aluminium, au format carte de crédit, et aussi fin, collé magnétiquement, dans son étui, au dos de votre smartphone. Une pression sur un bouton et le Plaud Note enregistre, via des micros et des capteurs de vibration, soit le son autour de vous, soit votre conversation téléphonique. Le passage en mode enregistrement est confirmé par une vibration haptique, et par l’activation d’une diode rouge. L’application mobile permet ensuite d’obtenir la transcription, et même un résumé bluffant.
K. Bruno
(Source : MSN)