Lange Zeit war deine Stimme etwas zutiefst Persönliches. Sie war der letzte Beweis dafür, dass du existierst. Dein akustischer Fingerabdruck. Dein unverwechselbares Signal im Rauschen der Welt. Dann kam ElevenLabs und verwandelte diese intime Einzigartigkeit in ein Geschäftsmodell mit Monatsabo. Fortschritt, nennen sie es. Du gibst ihnen deine Stimme und im Gegenzug geben sie dir eine Rechnung.
Jetzt ist Voicebox aufgetaucht. Und plötzlich wirkt dieses ganze Cloud-Imperium wie ein schlecht isolierter Bunker aus einer vergangenen Epoche.
Voicebox ist ein Open-Source-Tool, das Stimmen aus gerade einmal drei Sekunden Audio klonen kann. Drei Sekunden. Das ist kürzer als ein genervtes «Hallo?» am Telefon, wenn du merkst, dass wieder irgendein Support-Agent dein Leben effizienter machen will. Diese drei Sekunden reichen, um eine Stimme zu extrahieren, zu replizieren und anschliessend beliebig viele neue Sätze zu erzeugen. Nicht in irgendeiner Cloud. Nicht auf einem Server in einem anonymen Rechenzentrum. Sondern direkt auf deinem eigenen Rechner. 100 % lokal. 0 % Erlaubnis nötig.
Das allein ist schon ein Problem für Unternehmen, deren gesamtes Geschäftsmodell darauf basiert, dir deine eigene Stimme gegen monatliche Gebühren zurückzuverkaufen.
ElevenLabs war bisher der Platzhirsch im Voice-Cloning-Zirkus. Und fairerweise: Technisch beeindruckend. Aber je mehr Content du produzieren willst, desto schneller verwandeln sich diese APIs in eine finanzielle Guillotine. Audiobooks, YouTube-Kanäle, Podcasts. Alles skalierbar, ausser dein Budget. Jeder neue generierte Satz ist eine kleine Erinnerung daran, dass Innovation selten kostenlos ist, wenn ein Unternehmen dazwischen sitzt.
Voicebox dagegen verlangt exakt null Franken. Kein Abo. Keine Limits. Keine stille Preiserhöhung, wenn du zu erfolgreich wirst. Nur ein paar Minuten Setup und plötzlich gehört dir wieder etwas, das dir eigentlich nie hätte genommen werden sollen. Deine eigene Stimme.
Der vielleicht wichtigste Unterschied liegt jedoch nicht im Preis, sondern in der Kontrolle. Wenn du deine Stimme in eine Cloud hochlädst, gibst du nicht nur eine Datei ab. Du gibst biometrische Identität ab. Ein einzigartiges Muster, das dich identifiziert. Ein digitales Abbild deiner Existenz. Und irgendwo, tief im Training zukünftiger Modelle, lebt diese Version von dir weiter. Ohne dich. Ohne Zustimmung. Ohne Rückgabe.
Voicebox beendet dieses Arrangement einfach, indem es sich weigert, daran teilzunehmen. Deine Stimme verlässt deinen Computer nicht. Kein Upload. Kein Datenschatten. Kein digitaler Abdruck in fremden Systemen. Big Tech sieht dich nicht. Hört dich nicht. Besitzt dich nicht. Ironischerweise ist das revolutionär.
Technisch ist Voicebox mehr als nur ein Klon-Werkzeug. Es ist ein vollständiges Voice-Studio. Mit Multi-Track-Timeline-Editor, Audio-Mixing, Conversation-Design und Unterstützung moderner Sprachmodelle wie Qwen3-TTS. Weitere Modelle wie XTTS und Bark sind bereits auf dem Weg. Alles läuft nativ. Schnell. Effizient. Kein Python-Chaos, keine Cloud-Abhängigkeit, kein Browser-Gefängnis.
Besonders auf Apple-Silicon-Geräten erreicht Voicebox dank Metal-Beschleunigung eine Geschwindigkeit, die Cloud-Services alt aussehen lässt. Vier- bis fünfmal schneller. Ohne Internet. Ohne Erlaubnis. Das ist der eigentliche Bruch im System.
Jahrelang hat man uns beigebracht, dass Fortschritt zwangsläufig bedeutet, Kontrolle abzugeben. Dass alles besser wird, wenn es in der Cloud ist. Dass Eigentum ein veraltetes Konzept ist und Zugang die neue Realität. Voicebox erinnert uns daran, dass das nicht stimmen muss. Dass Technologie nicht zwangsläufig zentralisiert sein muss. Dass du nicht um Erlaubnis bitten musst, um du selbst zu sein.
Natürlich wird diese Technologie missbraucht. Jede mächtige Technologie wird missbraucht. Aber die Alternative ist ein System, in dem deine Stimme bereits missbraucht wird. Nur eleganter. Mit Terms of Service. Voicebox ist kein Produkt. Es ist ein Statement. Und irgendwo in dieser Aussage steckt eine unbequeme Wahrheit: Deine Stimme war nie sicher. Sie war nur noch nicht frei…


«Dravens Tales from the Crypt» bezaubert seit über 15 Jahren mit einer geschmacklosen Mischung aus Humor, seriösem Journalismus – aus aktuellem Anlass und unausgewogener Berichterstattung der Presse Politik – und Zombies, garniert mit jeder Menge Kunst, Entertainment und Punkrock. Draven hat aus seinem Hobby eine beliebte Marke gemacht, welche sich nicht einordnen lässt.








