Whisper läuft lokal auf deinem Apple Silicon. Keine Cloud für die Transkription, keine Abos, keine Aufnahmen die das Gerät verlassen. Einmal zahlen, keine Abrechnung pro Minute.
Diktieren sollte sich anfühlen wie Tippen, nur schneller. Du drückst eine Taste, sprichst, und der Text steht dort wo dein Cursor steht. Fertig.
Whisper large-v3-turbo transkribiert komplett auf deinem Mac. Kein Server, kein Account, auch ohne Internet. Nur optionale Smart Modes schicken den bereits transkribierten Text an einen Anbieter deiner Wahl (Claude, Gemini) – mit deinem eigenen API-Key, du siehst jede Anfrage. Reines Diktat: 100 % lokal.
Metal-beschleunigt auf Apple Silicon. Whisper transkribiert im Hintergrund schon während du sprichst – wenn du loslässt, wird der Text in 200–700 ms eingefügt statt nach mehreren Sekunden. Für echte Live-Ausgabe während du sprichst: Continuous Mode (⌃⌥C).
Keine Telemetrie, keine Analytics, keine Tracker. Eine Einmalzahlung statt Abo-Falle. Dein Audio gehört dir, nicht einer Cloud.
Eine Taste startet die Aufnahme, egal in welcher App du gerade bist. Erneut drücken, fertig. Der Text landet exakt dort, wo dein Cursor steht.
Optionale KI-Politur: Polish, Email, Bullet-Point, Rage-Mode. Du wählst den Anbieter – Anthropic API, Google Gemini API (jeweils BYOK, Pay-per-use direkt beim Anbieter) oder Apple Intelligence lokal. Roh-Text bleibt immer verfügbar.
Siehst was du sagst, echte RMS-Levels in Echtzeit. Kein Rätselraten ob das Mic gerade hört.
Dicta kennt die Apps in denen du tippst – Notes, Mail, Safari, Pages, Slack, Claude Desktop, Cursor, VS Code, Chrome, Arc – und fügt direkt ins Textfeld ein statt ins Result-Panel.
Kein fokussiertes Textfeld? Dicta zeigt das Ergebnis in einem Panel mit Copy-Button. Nichts geht verloren.
Apple-notarisiert, Universal Binary, Metal-beschleunigt. Keine Electron-Hülle, kein 200-MB-Bundle. Native Swift.
Whisper läuft schon während der Aufnahme auf den Audio-Chunks – wenn du die Taste loslässt, wird der Text in 200–700 ms eingefügt statt in 2–5 Sekunden. Nicht zu verwechseln mit Continuous Mode (unten) – dort erscheint Text live während du sprichst.
Für lange Diktate: ⌃⌥C startet, der Text wandert laufend in dein Textfeld. Kein End-Wait, kein Timeout.
| Dicta | Wispr Flow | Typeless | Apple Dictation | |
|---|---|---|---|---|
| Audio bleibt auf dem Gerät | ✓ | ✕ Cloud | ✕ Cloud | ✓ |
| LLM-Politur ohne Cloud | ✓ Apple Intelligence | ✕ | ✕ | ✕ |
| Sprach-Edit auf Auswahl | ✓ | ✓ Command Mode | ✕ | ✕ |
| App-bewusster Ton | ✓ 4 Presets | ✓ | ✕ | ✕ |
| Sprach-Snippets / Makros | ✓ | ✕ | ✕ | ✕ |
| Lange Diktate ohne Limit | unbegrenzt | ✓ | 6-Min-Limit | ✓ |
| 9+ eigene Hotkey-Modi | ✓ | 2 | 1 | 1 |
| Code/IDE-bewusst | ✓ Whitelist | ✕ | ✕ | ✕ |
| Gespräch mit LLM (Klyvo) | ✓ | ✕ | ✕ | ✕ |
| Offline nutzbar | ✓ | ✕ | ✕ | teilweise |
| Preis | 1× zahlen | $15/Mon. | $30/Mon. | gratis |
Quellen: Wispr Trust Gap (Ryan Shrott), Typeless Privacy Issues (Voibe). Benchmark "180 ms first token": WhisperKit large-v3-turbo auf M3 Max, WhisperKit Bench-Suite.
Nach dem Kauf erhältst du sofort einen Lizenzschlüssel per E-Mail. Aktivieren in den Dicta-Settings. Fertig. Updates inklusive (Major-Releases ggf. als Upgrade).
Einmalzahlung, kein Abo. Installierte Versionen bleiben deine. Weiterentwicklung und Kompatibilität hängen von der aktiven Entwicklung und dem Apple Developer Programm ab.