← Alle cases

Open Source

Lexaloud

Neural tekst-til-tale daemon til akademisk medlaesning pa Linux

Python Kokoro-82M ONNX Runtime GTK3 systemd Privacy

Om Lexaloud

HAVEN Intelligence har udviklet Lexaloud, en open source tekst-til-tale daemon designet til akademisk medlaesning pa Linux. Vaerktoejet demonstrerer vores tilgang til privatlivsfokuserede AI-loesninger: neural stemmemodel koerer lokalt pa GPU, ingen data forlader maskinen, ingen telemetri indsamles.

Lexaloud bruger Kokoro-82M stemmemodellen via ONNX Runtime til at generere naturlig tale i realtid. Brugeren markerer tekst, trykker pa en global genvejstast, og Lexaloud laeser hoejt med saetningsgranularitet og fuld kontrol over pause, spring over og tilbage.

Arkitektur

Lexaloud er bygget som en Unix domain socket daemon med en GTK3 tray-indikator og kontrolvindue. Arkitekturen adskiller inferens fra brugerflade, sa talemodellen koerer stabilt i baggrunden.

Komponent 1

Daemon (Unix socket)

En baggrundstjeneste der lytter pa en Unix domain socket. Daemonen modtager tekst, opdeler i saetninger, og streamer tale via Kokoro-82M. Kan styres med systemd eller startes manuelt.

Komponent 2

Kokoro-82M via ONNX Runtime

Neural stemmemodel med 82 millioner parametre koerer lokalt pa GPU. ONNX Runtime sikrer hurtig inferens med lav latenstid, sa tale genereres i realtid med naturlig prosodi.

Komponent 3

GTK3 tray-indikator og kontrolvindue

En systembakke-indikator giver hurtigt overblik over status. Kontrolvinduet viser den aktuelle saetning og giver adgang til pause, spring over og tilbage. Global genvejstast aktiverer afspilning fra enhver applikation.

Noeglefunktioner

167 tests
i testsuiten
100% lokalt
ingen data forlader maskinen
  • Kokoro-82M neural stemmemodel pa lokal GPU via ONNX Runtime
  • Saetningsgranularitet med streaming, pause, spring over og tilbage
  • Global genvejstast der virker fra enhver applikation
  • GTK3 tray-indikator og kontrolvindue
  • Multi-distro support: Ubuntu, Fedora og Arch Linux
  • Privatliv: ingen telemetri, ingen cloud, ingen dataindsamling
  • Open source under MIT-licens

Kildekode

Lexaloud er open source og tilgaengeligt pa GitHub. Se koden, laes dokumentationen eller bidrag til projektet.

Se pa GitHub

Brug for praktiske AI-loesninger?

Brug casen som teknisk reference, men start nye projekter med en rådgivende afklaring af arbejdsgange, data og risiko.

Book 20 min. afklaringssamtale

Svar fra Gustav personligt. Ingen automatiseret salgssekvens.