Empfehlungen für Audio-Transkriptions-Dienste?
Also, nehmen wir an, es wäre Euer Job, regelmäßig Protokolle zu Terminen mit unterschiedlichen Teilnehmer*innen zu erstellen: Wie würdet Ihr das machen?
(Gern Tipps, die auf realen Erfahrungen basieren.)
@anneroth Whisper von OpenAI. Gibt es auch als "offline" Variante von Drittanbietern, auch kostenlos. Je nach Betriebssystem gibt es da unterschiedliche Optionen.
@larsschwarz @anneroth Absolute Zustimmung. Whisper hat mich in der Qualität so sehr beeindruckt, dass ich es unbedingt empfehle: https://pypi.org/project/openai-whisper/
PS: Ich habe auch Live-Transkription probiert, da fand ich bisher (leider) Microsoft Word am besten. Die Diktierfunktion, klappt auch super und für inoffizielle Protokolle reicht's mit schnell nochmal drüberlesen.
@anneroth @izo @larsschwarz wenn die Daten durch eine 3rd party verarbeitet werden dürfen ist auch dieses Google Colab Notebook nicht schlecht: https://colab.research.google.com/github/keatonkraiger/Whisper-Transcription-Tutorial/blob/main/Whisper_Tutorial.ipynb
Google stellt darüber kostenlosen GPU compute bereit und du hast die volle Kontrolle über das Modell.
Vor allem das Large Modell liefert auch mehrsprachig echt gute Ergebnisse.
@larsschwarz @anneroth @izo deswegen der Hinweis auf die Verarbeitung durch dritte. Ich vermute tatsächlich, dass die Daten hier nicht direkt verwertet werden. Ausschließen kann man das aber natürlich nicht