GitHub — publication prochaine

TranscriptIT

Petit utilitaire speech-to-text hors-ligne. Cette page montre une courte vidéo du projet ; le code et la documentation suivront sur GitHub.

Moteurs STT interchangeables · Python 3.9+ · Linux, macOS, Windows

Le dépôt TranscriptIT n’est pas encore créé sur GitHub — publication prochaine.

Ce que fait TranscriptIT

TranscriptIT capture le micro, transcrit en local et affiche le texte en direct. Vous pouvez modifier le texte en direct et continuer à dicter en même temps. Vous pourrez utiliser différents moteurs STT — Vosk aujourd’hui, d’autres backends locaux au fil des prochaines versions.

Transcription en direct

Résultats partiels mot-à-mot, puis phrases complètes validées par Vosk.

Moteurs STT interchangeables

Utilisez différents moteurs : il n’y a pas que Vosk — Whisper et d’autres backends locaux sont prévus au fil des versions.

Zone de texte éditable

En mode GUI : corrigez et complétez pendant la retranscription. Vous pouvez dicter à la position du curseur, ou toujours à la fin.

Bips de statut

Bip de démarrage (440 Hz) et d’arrêt (880 Hz) — feedback sans fichier audio externe.

7 thèmes visuels

Palettes Catppuccin et variantes (Mocha, Latte, Orange, Vert, Bleu, Violet, Rouge).

Presse-papier & raccourcis

Copie multiplateforme (xclip, pbcopy, clip) Indication visuelle lors du copier/coller

Deux modes d’utilisation

Terminal pour l’automation et les scripts ; interface graphique Tkinter pour une utilisation quotidienne sans ligne de commande.

Mode terminal

Transcription dans le terminal — idéal pour scripts, CI et pipelines.

  • ./setup.sh — mode continu (Ctrl+C pour quitter)
  • ./setup.sh --once 5 — enregistre 5 secondes puis affiche le résultat
  • ./setup.sh --loop — transcription continue explicite

Mode interface graphique

Fenêtre claire : zone de texte, boutons Start / Stop / Copier / Effacer, pastille de statut.

  • ./setup.sh --gui — lance la fenêtre Tkinter
  • Pastille verte = enregistrement, grise = arrêté
  • Bouton ◑ pour changer de thème (7 palettes)

Chaîne audio → texte

PortAudio capture le micro ; sounddevice streame à 16 kHz mono ; Vosk transcrit ; Tkinter ou le terminal affiche le résultat.

  1. Microphone (PortAudio — PulseAudio, CoreAudio, WASAPI)
  2. Flux audio 16 000 Hz, mono, blocs 50 ms (sounddevice)
  3. Vosk KaldiRecognizer — partial + phrases finalisées
  4. Affichage GUI éditable ou terminal interactif

Spécifications & confidentialité

Moteur STT
Vosk par défaut ; architecture multi-moteurs (Whisper, etc.)
Audio
16 kHz, mono, PortAudio / sounddevice
Dépendances
sounddevice, vosk, numpy (pas de PyTorch)
Plateformes
Linux, macOS, Windows

Raccourcis GUI

Ctrl+Shift+S
Démarrer / arrêter la transcription
Ctrl+Shift+C
Copier le texte dans le presse-papier
Escape
Fermer l’overlay « À propos »

Pas de compte, pas de clé API, pas de télémétrie : votre voix et vos transcriptions ne quittent jamais votre machine après installation du modèle.

Version Pro & évolutions

À l’étude

En attendant GitHub

Le dépôt TranscriptIT n’est pas encore sur GitHub — publication prochaine. Parcourez les dépôts publics @JeanSebastienBash, d’autres projets #DreamprojectAI ou contactez-nous.

Hashtags du projet dans l’index