Mit den heutigen KI-Technologien ist die Erstellung und Weiterverarbeitung von Audio-Transkripten direkt auf lokaler Hardware möglich. Es werden zwei aktuelle Software-Lösungen um diese Transkripte zu erstellen demonstriter: Whisper von OpenAI und Pyannote. Diese arbeiten im Fall von Whisper ohne Speaker Diarization (="Sprecher-Trennung") und im Fall von Pyannote mit Speaker Diarization. Zudem wird in dem Weekly kurz angerissen, welche Vorteile die Speaker Diarization für die weitere Verarbeitung des Transkripts mit LLMs hat.
Weiterführende Hinweise:
- Link zum Podcast.
- Das was gezeigt wird ist ein "Proof of Concept", macht in der vorgestellten Form für die Praxis jedoch keinen Sinn (fehlende Automatisierung). Wir beraten Sie jedoch gerne zu möglichen Erweiterungen und Automatisierungen (schreiben Sie uns eine Mail).
