Il y a quelques mois que je chemine vers l’idée de babiller en chinois avec une i a. Notamment le soir ou en m’endormant enfin bref du coup je veux pas un truc avec des écrans, , pas une app de Play Store, je veux une machine autonome.
celle qui prononce le mieux le chinois d’après mes recherches c est Xiaomi speaker pro.
-C’est un point important mais pas suffisant
-Les autres bidules du même style ont une mauvaise prononciation ou alors ne fonctionne que en Chine
Mais xiaomi speaker pro a un niveau de conversation un peu limité…
qui pourrait être grandement amélioré en implémentant une application tierce ..( je sais pas si on dit exactement comme ça).
et là c’est du boulot d’informaticien un petit peu chiadé.
c’est pas juste télécharger une app. Ce qui suit va être compréhensible uniquement pour des informaticiens
si quelqu’un se sent intéressé par ce projet welcome.
Reste Xiaomi Xiao AI Speaker pro (小爱音箱)
( attention il y a trois modèles différent il faut choisir le speaker pro)
En ce moment il est au rabais sur AliExpress :
Haut-parleur intelligent Xiaomi Pro Bluetooth 5.0, IA chinoise, questions et réponses, son stéréo, interface Type-C, Xiaomi Mesh 2.0, télécommande infrarouge
https://a.aliexpress.com/_EH8nIEy
Mais ça c’est que le début
La suite du projet la voilà.
Aucune idée du volume de travail que ça représente les détails techniques ont été proposés par une IA : utiliser un Xiaomi Xiao AI Speaker comme interface vocale pour une application avec des dialogues complexes en chinois (ex : chatbot, outil d’apprentissage, jeu de rôle). Voici les infos clés et des ressources pour démarrer rapidement.
Objectif
Permettre à Xiao AI de :
- Recevoir des commandes vocales en chinois.
- Envoyer ces commandes à une app externe (ex : un chatbot Python, une API comme ChatGPT, ou une base de données de dialogues).
- Lire à voix haute les réponses générées par l’app, avec une synthèse vocale naturelle (grâce à Xiao AI).
Solutions Techniques (par ordre de complexité)
Solution Simple : IFTTT + Webhook (pour non-développeurs)
- Outils : IFTTT, Mi Home, un serveur web basique (ex : Flask).
- Fonctionnement :
- Xiao AI → IFTTT (déclencheur vocal) → Webhook → Ton app → Réponse via l’API TTS de Xiao AI.
- Limites : Latence (~1–2 sec), dialogues ponctuels (pas de conversation fluide).
- Tutoriel :
Solution Avancée : API Xiao AI (pour développeurs)
- Prérequis :
- Compte développeur Xiaomi : Mi AI Developer Platform.
- SDK Xiao AI (Python/Java) : Documentation officielle.
- Étapes :
- Créer une skill personnalisée dans le Mi AI Console.
- Utiliser le SDK pour :
- Écouter les commandes vocales de Xiao AI.
- Envoyer les requêtes à ton app (ex : API ChatGPT, base de données locale).
- Retourner la réponse via
XiaoAI.speak().
- Exemple de code (Python) :
from xiaomi_ai import XiaoAI import openai openai.api_key = "TA_CLE_API_OPENAI" def chat_with_gpt(prompt): response = openai.Completion.create( engine="text-davinci-003", prompt=prompt, max_tokens=150 ) return response.choices[0].text.strip() def handle_command(command): if "聊天" in command: # Si l'utilisateur dit "聊天" (discuter) gpt_response = chat_with_gpt(command) return gpt_response return "我不明白,请再说一次。" # "Je ne comprends pas" xiaoai = XiaoAI() xiaoai.on_command(handle_command)
- Avantages : Dialogues fluides, intégration native avec Xiao AI.
- Ressources :
Solution DIY : Proxy Vocal (Raspberry Pi + Rhasspy)
- Pour qui : Si tu veux une solution 100% locale et personnalisable.
- Matériel :
- Raspberry Pi 4 + microphone USB.
- Xiao AI Speaker (pour la synthèse vocale).
- Outils :
- Étapes :
- Installer Rhasspy sur le Pi pour capturer la voix.
- Configurer Rhasspy pour envoyer les commandes à ton app via MQTT/HTTP.
- Ton app génère une réponse, que le Pi envoie à Xiao AI via son API TTS.
- Tutoriel :
Ressources Utiles
| Ressource | Lien | Description |
|---|---|---|
| SDK Xiao AI | Mi AI Developer Docs | Documentation officielle pour les développeurs. |
| API ChatGPT | OpenAI API | Pour générer des dialogues complexes. |
| IFTTT Webhooks | IFTTT Maker Webhooks | Automatiser les commandes vocales sans coder. |
| Rhasspy (reco vocale) | Rhasspy Docs | Alternative open-source à Alexa/Google Assistant. |
| Exemple de skill Xiao AI | GitHub - MiHome Protocol | Exemple de code pour interagir avec Xiao AI. |
Idées de Projets Concrets
- Chatbot chinois avancé :
- Xiao AI + API ChatGPT pour discuter de sujets techniques/culturels.
- Outil d’apprentissage du chinois :
- Xiao AI pose des questions, ton app vérifie les réponses et donne des feedbacks.
- Jeu de rôle interactif :
- Xiao AI joue un personnage (ex : un professeur, un ami) et ton app gère la logique du jeu.
- Assistant vocal pour la domotique :
- Xiao AI contrôle tes appareils Xiaomi et lance des dialogues complexes (ex : « 小爱,给我讲个笑话 » → « Xiao AI, raconte-moi une blague »).
Points d’Attention
- Latence : Les solutions DIY (Raspberry Pi) ou via IFTTT peuvent avoir un délai de 1–3 secondes.
- API Xiao AI : Certaines fonctionnalités sont réservées aux développeurs approuvés par Xiaomi.
- Synthèse vocale : La qualité de la voix de Xiao AI est bonne, mais moins naturelle que des outils comme Azure TTS ou Google WaveNet.
- Langue : Xiao AI est optimisé pour le mandarin, mais les dialogues complexes peuvent nécessiter un pré-traitement (ex : segmentation des phrases).
Prochaines Étapes
Si tu veux tester rapidement :
- Crée un compte développeur sur Mi AI Platform.
- Fork ce repo pour un exemple de skill Xiao AI : GitHub - Xiao AI Skill Example.
- Essaie l’API ChatGPT avec ce notebook Colab pour générer des dialogues.