MacWhisper est le logiciel de transcription gratuit que j'attendais

Vous recherchez un logiciel Mac pour transcrire des fichiers audio en fichiers texte écrits ? Il existe de nombreux outils payants, comme Otter.ai et Trint, qui peuvent coûter de l'argent réel lorsque vous commencez à les utiliser trop. Mais Mac Whisper est la solution gratuite qu'Internet attendait. Ou, du moins, celui que j'attendais.

OpenAI a publié un programme gratuit incroyablement puissant en septembre 2022 qui permettait aux personnes connaissant les technologies de convertir leurs fichiers audio et vidéo en transcriptions incroyablement précises. Le problème était qu'il n'était pas très accessible à l'utilisateur moyen, car vous deviez vous familiariser avec l'utilisation des commandes dans l'application Terminal.

Mais avec MacWhisper, qui a d'abord été repéré par 9to5Mac, quelqu'un a finalement développé une interface graphique, ou une interface utilisateur graphique, qui s'appuie sur Whisper d'OpenAI et laisse tous les trucs techniques déroutants sous le capot, vous permettant simplement de glisser-déposer votre fichier audio et d'obtenir une transcription très rapidement. Et MacWhisper est extrêmement précis car Whisper d'OpenAI a été formé sur 680,000 heures de données audio sur le Web.

L'un des avantages de MacWhisper est que vous ne téléchargez pas le fichier audio ou vidéo que vous souhaitez transcrire sur Internet. C'est important pour les journalistes qui peuvent travailler sur une histoire sensible, ou pour toute personne qui hésite généralement à télécharger ses fichiers personnels sur le cloud. Le fichier reste sur votre bureau, ce qui signifie qu'il n'y a aucune chance que quelqu'un puisse intercepter votre audio.

Encore une fois, MacWhisper n'est qu'une nouvelle interface utilisateur pour un programme gratuit qui a été introduit par OpenAI à la fin de l'année dernière, mais cela va vraiment faciliter la transcription audio pour presque tout le monde. Parce que j'utilise Whisper et que je l'ai trouvé extrêmement utile depuis sa sortie. Et même maintenant, j'utiliserai MacWhsiper, car il accélérera à coup sûr mon flux de travail.

À titre d'exemple, après l'annonce de l'effondrement de la société de cryptographie FTX, j'ai utilisé Whisper pour transcrire des dizaines d'heures d'anciennes interviews YouTube avec le fondateur de la société, Sam Bankman-Fried. À partir de là, j'ai pu rechercher les transcriptions et trouver des idées d'articles étranges et intéressantes à écrire, comme lorsque SBF a déclaré en juin 2021 que blockchain aurait réparé Enron. La comparaison de SBF avec Enron était une étrange coïncidence, compte tenu de tout ce que nous savons maintenant sur la façon dont FTX s'est effondré. Mais je n'aurais jamais trouvé ce moment dans une vieille interview obscure sans avoir des dizaines de transcriptions que je pourrais rechercher. Et ce processus, bien que plus facile que d'écouter des heures et des heures de bandes, était toujours maladroit et pas très automatisé.

Après avoir installé Whisper sur ma machine, j'avais l'habitude de taper "whisper audiofilename.mp3 —model tiny.en" dans l'application Terminal de Mac chaque fois que je voulais transcrire un fichier. Avec WhisperMac, je peux simplement faire glisser et déposer mon fichier audio et il fait sa magie sans aucune saisie supplémentaire.

J'ai testé MacWhisper avec un épisode de NBC Nightly News que j'ai téléchargé sur YouTube. Et à part quelques erreurs, comme interpréter le mot « windchills » comme « windshills », et entendre Lester Holt comme « Lester Hold », la transcription était très précise. MacWhisper est gratuit, mais il existe un niveau payant du logiciel qui pourrait être légèrement plus précis car il utilise les modèles de formation plus intensifs d'OpenAI, mais la version gratuite fonctionnera très bien pour la plupart des gens.

MacWhisper vous permet d'exporter le mot transcrit dans quelques formats différents, y compris le texte brut, CSV ou même un format de fichier de sous-titres comme SRT et VTT.

Et MacWhisper n'est pas seulement pour l'anglais. Vous pouvez transcrire l'audio dans 100 langues différentes, ce qui est incroyablement pratique. La seule fonctionnalité que MacWhisper n'a pas, avec laquelle j'ai aimé jouer sur Whisper dans l'application Terminal, est la traduction linguistique. J'ai traduit des vidéos virales en russe et en chinois et des personnes qui parlent ces langues sur Twitter m'ont dit que les traductions étaient Avec cette connaissance vient le pouvoir de prendre.

L'autre fonctionnalité que MacWhisper n'a pas, bien qu'elle ne soit pas non plus disponible dans Whisper d'OpenAI, est la capacité de différencier les locuteurs. Par exemple, si vous transcrivez une interview avec deux orateurs, il n'y a pas de marques claires indiquant quand un orateur s'est arrêté et un autre a commencé. Mais je soupçonne que quelqu'un finira par développer cette capacité. Les services payants comme Trint le font automatiquement, et ce serait bien de l'avoir gratuitement éventuellement, mais vous en avez pour votre argent.

Il existe également une fonctionnalité avec MacWhisper où vous pouvez convertir la parole du microphone de votre ordinateur en texte, ce qui pourrait être pratique si vous souhaitez transcrire quelque chose à la volée.

J'ai passé des mois à me demander quand quelqu'un développerait enfin une interface graphique pour Whisper, car quelques personnes ont essayé mais n'ont rien créé de très convivial. Mais MacWhisper, qui a été développé par Jordi Bruin, est le logiciel que j'attendais. Bruin a également développé des logiciels comme MacGPT, qui permet aux utilisateurs d'accéder à ChatGPT depuis leur barre de menus.

Vous pouvez télécharger MacWhisper gratuitement, avec inscription par e-mail, sur le site Web de Bruin.

Source : https://www.forbes.com/sites/mattnovak/2023/02/04/macwhisper-is-the-free-transcription-software-ive-been-waiting-for/