MacWhisper er den gratis transskriptionssoftware, jeg har ventet på

Leder du efter Mac-software til at transskribere lydfiler til skrevne tekstfiler? Der er masser af betalte værktøjer, som Otter.ai og Trint, der kan koste rigtige penge, når du begynder at bruge dem for meget. Men MacWhisper er den gratis løsning, internettet har ventet på. Eller i det mindste den jeg har ventet på.

OpenAI udgav et utroligt kraftfuldt gratis program tilbage i september 2022, der gjorde det muligt for folk med en vis teknisk viden at konvertere deres lyd- og videofiler til utroligt nøjagtige transskriptioner. Problemet var, at det ikke var særlig tilgængeligt for den gennemsnitlige bruger, da du skulle være fortrolig med at bruge kommandoer i Terminal-appen.

Men med MacWhisper, som først blev opdaget af 9to5Mac, nogen har endelig udviklet en GUI, eller grafisk brugergrænseflade, der bygger oven på OpenAI's Whisper og efterlader alle de forvirrende tekniske ting under motorhjelmen, så du bare kan trække og slippe din lydfil og få en transskription meget hurtigt. Og MacWhisper er ekstremt præcis, fordi OpenAI's Whisper er blevet trænet på 680,000 timer af lyddata på nettet.

En af de gode ting ved MacWhisper er, at du ikke uploader den lyd- eller videofil, som du vil have transskriberet til internettet. Det er vigtigt for journalister, der måske arbejder på en følsom historie, eller alle, der bare generelt er på vagt over for at uploade deres personlige filer til skyen. Filen forbliver på dit skrivebord, hvilket betyder, at der ikke er nogen chance for, at nogen kan opsnappe din lyd.

Igen er MacWhisper bare en ny brugergrænseflade til et gratis program, der blev introduceret af OpenAI i slutningen af ​​sidste år, men det vil virkelig gøre lydtransskription let for næsten alle. Fordi jeg har brugt Whisper og har fundet det enormt nyttigt, siden det blev udgivet. Og selv jeg vil nu bruge MacWhsiper, for det vil helt sikkert fremskynde min arbejdsgang.

Som blot et eksempel, efter nyheden om kryptovirksomheden FTX's kollaps, brugte jeg Whisper til at transskribere snesevis af timers gamle YouTube-interviews med virksomhedens grundlægger Sam Bankman-Fried. Derfra var jeg i stand til at søge i transskriptionerne og finde mærkelige og interessante ideer til artikler at skrive, som da SBF sagde i juni 2021, at blockchain ville have rettet Enron. SBF's sammenligning med Enron var et mærkeligt tilfælde i betragtning af alt, hvad vi nu ved om, hvordan FTX kollapsede. Men jeg ville aldrig have fundet det øjeblik i et gammelt obskurt interview uden at have dusinvis af transskriptioner, jeg kunne søge. Og selv om den proces var nemmere end at lytte til timevis af bånd, var den stadig klodset og ikke særlig automatiseret.

Efter at have installeret Whisper på min maskine, plejede jeg at skrive "whisper audiofilename.mp3 —model tiny.en" i Mac's Terminal-app, hver gang jeg ønskede at transskribere en fil. Med WhisperMac kan jeg bare trække og slippe min lydfil, og den gør sin magi uden ekstra indtastning.

Jeg testede MacWhisper med en episode af NBC Nightly News, som jeg downloadede fra YouTube. Og bortset fra nogle få fejl, som at fortolke ordet "windchills" som "windshills", og at høre Lester Holt som "Lester Hold", var udskriften meget nøjagtig. MacWhisper er gratis, men der er et betalt niveau af softwaren, der kunne være lidt mere præcis, fordi den bruger OpenAIs mere intensive træningsmodeller, men den gratis version vil fungere rigtig godt for de fleste mennesker.

MacWhisper giver dig mulighed for at eksportere det transskriberede ord i et par forskellige formater, inklusive almindelig tekst, CSV eller endda et undertekstfilformat som SRT og VTT.

Og MacWhisper er ikke kun for engelsk. Du kan transskribere lyd på 100 forskellige sprog, hvilket er utroligt praktisk. Den eneste funktion MacWhisper ikke har, som jeg har nydt at lege med på Whisper i Terminal-appen, er sprogoversættelse. Jeg har oversat virale videoer til russisk og kinesisk og har fået at vide af folk, der taler sprogene på Twitter, at oversættelserne er præcis.

Den anden funktion, som MacWhisper ikke har, selvom den heller ikke er tilgængelig fra OpenAI's Whisper, er evnen til at differentiere højttalere. Hvis du for eksempel transskriberer et interview med to talere, er der ingen tydelige markeringer, der viser, hvornår en højttaler er stoppet, og en anden er startet. Men jeg formoder, at nogen vil bygge den evne til sidst. Betalte tjenester som Trint gør dette automatisk, og det ville være fantastisk at have gratis til sidst, men du får, hvad du betaler for.

Der er også en funktion med MacWhisper, hvor du kan konvertere tale fra din computers mikrofon til tekst, hvilket kunne være praktisk, hvis du vil transskribere noget i farten.

Jeg brugte måneder på at spekulere på, hvornår nogen endelig ville udvikle en GUI til Whisper, da nogle få mennesker gav det et skud, men ikke skabte noget meget brugervenligt. Men MacWhisper, som er udviklet af Jordi Bruin, er den software, jeg har ventet på. Bruin har også udviklet software som MacGPT, som giver brugerne adgang til ChatGPT fra deres menulinje.

Du kan downloade MacWhisper gratis, med e-mail tilmelding, på Bruins hjemmeside.

Kilde: https://www.forbes.com/sites/mattnovak/2023/02/04/macwhisper-is-the-free-transcription-software-ive-been-waiting-for/