Comment un streamer frustré a décidé de construire l'outil qui lui manquait — avec l'aide de l'IA.
Je m'appelle THORINOU. Je suis streamer depuis plusieurs années, et comme beaucoup d'entre vous, je passe des heures en live chaque semaine. Des streams de jeu, des sessions de dev en direct, des discussions avec ma communauté — du contenu que j'adorais créer, mais que je n'arrivais jamais vraiment à valoriser.
Le problème ? Mes VODs. Des heures de contenu qui dormaient sur mon disque dur, inaccessibles. Impossible de retrouver rapidement ce moment drôle à 2h47 du matin. Impossible de créer facilement des clips à partir des passages les plus importants. Et encore moins de générer des sous-titres pour rendre mes streams accessibles.
Chaque semaine, je passais des heures à regarder mes propres streams pour en extraire les moments forts. Avancer, reculer, noter les timestamps à la main dans un carnet. Une tâche répétitive, épuisante et inefficace pour quelqu'un qui veut passer du temps à créer.
J'ai essayé des dizaines d'outils. Soit ils étaient trop chers et complexes (pensés pour les studios pro), soit ils uploadaient tout sur le cloud sans garantie de confidentialité, soit la qualité de transcription en français était catastrophique. Rien qui corresponde aux besoins d'un streamer solo.
En 2023, j'ai découvert WhisperX d'OpenAI. La qualité de transcription était bluffante, même en français avec des accents. Mais l'outil n'existait qu'en ligne de commande — inaccessible pour la majorité des streamers. C'est là que l'idée a germé : et si je construisais l'interface qui manquait ?
Mon objectif était simple : rendre la transcription IA accessible à n'importe quel streamer, sans avoir besoin d'être développeur. Un double-clic pour ouvrir, glisser-déposer pour importer, cliquer pour transcrire. La puissance de WhisperX, avec la simplicité d'un outil grand public.
Un script Python de 200 lignes, une interface graphique basique avec Tkinter, et un seul bouton : "Transcrire". Ça marchait, mais c'était moche et instable. Mais pour la première fois, je pouvais voir mes VODs en texte en quelques minutes. La magie opérait.
C'est en début 2024 que j'ai commencé à travailler sérieusement avec Claude, l'IA d'Anthropic. Ce qui m'a frappé, c'est la qualité des échanges : pas juste "voici le code", mais "voici pourquoi cette architecture est meilleure, voici les trade-offs". Claude est devenu mon co-développeur, disponible à 3h du matin quand l'inspiration frappe.
On a décidé ensemble de reconstruire l'app avec Tauri (Rust + TypeScript) plutôt qu'Electron. Le résultat : une application 10x plus légère, plus rapide au démarrage, avec un vrai feeling "natif" sur Windows. Un choix technique ambitieux, mais qui en valait la peine.
La partie la plus complexe du projet. Embarquer WhisperX avec tous ses modèles Python dans un installateur Windows autonome est un défi monumental. Il a fallu plusieurs semaines de débogage, de tests en sandbox Windows, pour que ça fonctionne sur toutes les configurations.
Une fonctionnalité réclamée par ma communauté Discord dès les premiers tests. "Je veux juste coller un lien YouTube" — c'est exactement ce qu'on a construit. Une intégration yt-dlp qui rend l'import aussi simple que possible, avec gestion des formats et de la qualité.
La communauté Discord commence à grandir. Les premiers bêta-testeurs remontent des bugs, proposent des fonctionnalités, partagent des cas d'usage auxquels je n'avais pas pensé. Un streamer utilise Sonify pour ses interviews, un podcasteur pour ses 3 heures d'enregistrements hebdomadaires. Le projet prend une autre dimension.
Après des mois de tests intensifs en sandbox Windows et de corrections de bugs, la v2.0.0 est sortie. Une version dont je suis fier : stable, rapide, et qui fait exactement ce qu'elle promet. Ce site que vous lisez, cette infrastructure Supabase, tout ça a aussi été construit avec Claude.
Je veux être transparent sur quelque chose que beaucoup de créateurs cachent : Sonify a été développé en grande partie avec l'aide de l'intelligence artificielle. Et je pense que c'est une force, pas une faiblesse.
Claude n'a pas simplement écrit du code. On a eu de vraies discussions d'architecture, des débats sur les choix techniques, des explorations de solutions alternatives. Chaque fonctionnalité est le résultat d'un dialogue, pas d'une simple génération automatique.
Beaucoup de projets utilisent l'IA en cachette. J'ai choisi d'en faire un élément central de l'histoire de Sonify. Parce que je crois que l'IA, bien utilisée, est un outil extraordinaire de démocratisation — pour permettre à des créateurs solo de construire des produits de qualité professionnelle.
Sonify est encore jeune. Il y a beaucoup de choses que je veux construire :
IA qui identifie les passages drôles, émouvants ou importants de vos streams.
Consulter et partager vos transcriptions depuis votre téléphone.
Générer automatiquement un résumé de votre stream pour les réseaux sociaux.
Étendre Sonify au-delà de Windows pour toucher tous les créateurs.
Chaque téléchargement, chaque retour, chaque étoile sur GitHub est une motivation immense. Ce projet est le mien, mais il grandit grâce à vous.
— THORINOU