Assistant vocal DIY : local ou cloud ?

Le vendredi 30 mai 2025 à 13:17:41
Salut à tous,
Je développe un assistant vocal DIY pour contrôler mes équipements domotiques via un Raspberry Pi 4. L’idée est d’éviter toute dépendance au cloud en hébergeant le modèle de reconnaissance vocale directement en local. Mon souci c’est que les solutions open source comme Vosk ou DeepSpeech demandent trop de ressources et provoquent des latences importantes sur le Pi, surtout quand j’essaie de lancer des modèles plus récents et précis. J’ai essayé d’optimiser avec TensorFlow Lite, mais c’est pas simple à mettre en place.
Est-ce que je devrais insister sur un modèle plus léger en local ou plutôt envisager une solution cloud pour améliorer la réactivité?
Merci pour vos conseils !
Je développe un assistant vocal DIY pour contrôler mes équipements domotiques via un Raspberry Pi 4. L’idée est d’éviter toute dépendance au cloud en hébergeant le modèle de reconnaissance vocale directement en local. Mon souci c’est que les solutions open source comme Vosk ou DeepSpeech demandent trop de ressources et provoquent des latences importantes sur le Pi, surtout quand j’essaie de lancer des modèles plus récents et précis. J’ai essayé d’optimiser avec TensorFlow Lite, mais c’est pas simple à mettre en place.
Est-ce que je devrais insister sur un modèle plus léger en local ou plutôt envisager une solution cloud pour améliorer la réactivité?
Merci pour vos conseils !
Le jeudi 5 juin 2025 à 10:19:22
Salut @Maxyme,
A moins d'équiper ton Rpi d'une carte graphique (même pas sûr que ce soit possible...) ça me parait chaud. Si tu veux resté en self hosting mieux vaut dédier un PC pour ça ou tu risque d'avoir une latence bcp trop élevée.
Sinon le cloud :)
A moins d'équiper ton Rpi d'une carte graphique (même pas sûr que ce soit possible...) ça me parait chaud. Si tu veux resté en self hosting mieux vaut dédier un PC pour ça ou tu risque d'avoir une latence bcp trop élevée.
Sinon le cloud :)