Enseignable Comment fonctionne la machine enseignable : décrivez son fonctionnement

2>Présentation générale de la machine enseignable

Teachable Machine, développée par Google, est une plateforme cloud interactive qui permet à toute personne, même sans connaissances techniques, de créer des modèles d’apprentissage automatique. L’avantage de cette solution réside dans sa simplicité d’utilisation : l’utilisateur télécharge des exemples (images, sons ou poses vidéo), attribue les étiquettes correspondantes et commence à entraîner le modèle. En fin de compte, le produit est un fichier JavaScript ou TensorFlow Lite pouvant être intégré directement dans un site Web ou une application mobile. Comprendre le fonctionnement de cette chaîne est essentiel pour tirer le meilleur parti de vos capacités et éviter les pièges courants.

Architecture technique sous-jacente

2.1 Les principaux composants

  1. Collecte de données – l’interface propose trois types de polices :

    • Images : télécharger ou capturer via webcam.
    • Audio : Enregistrement interne ou chargement de fichiers MP3/WAV.
    • Posture : Capture 3D d’une pose via MediaPipe.
  2. Prétraitement – chaque modalité passe par une série d’opérations pour normaliser les entrées avant la formation:

    • Images : redimensionnement, renormalisation des pixels, boost (rotation, bruit).
    • Audio : décodage, normalisation de volume, extraction de spectrogramme.
    • Posture : extraction des coordonnées principales, normalisation vectorielle.
  3. Modèle – Teachable Machine utilise des réseaux de neurones convolutif (CNN) pour les images, réseaux de neurones récurrents (RNN) tu transformateurs simplifié pour l’audio et les architectures entièrement connecté pour les postures. Le choix du modèle est automatisé : l’outil optimise la profondeur et la largeur des couches en fonction du nombre d’exemples.

  4. Entraînement – l’algorithme d’optimisation est basé sur Adam (adaptable au moment). Les paramètres (taux d’apprentissage, époques, taille du lot) sont sélectionnés automatiquement, mais l’utilisateur peut les ajuster via l’interface.

  5. Exporter – après convergence, le modèle est converti en fichiers model.json et weights.bin (TensorFlow.js) ou model.tflite (TensorFlow Lite), prêt à être utilisé dans le navigateur ou sur votre téléphone portable.

2.2 Fonctionnalité de TensorFlow.js

TensorFlow.js est la couche d’exécution du navigateur. Il interprète les fichiers JSON/pesée, exécute le modèle et renvoie les probabilités de classe en temps réel. L’utilisation de WebGL pour accélérer les calculs rend l’inférence possible même sur des smartphones à faible consommation : le pipeline peut fonctionner à 20 ips sur un iPhone 8, par exemple.

Processus de formation étape par étape

3.1 Création de projet

  • Choisissez la catégorie (« Image », « Audio » ou « Pose »).
  • Sélectionnez le nombre et le nom des classes (minimum 2 : un « Oui » et un « Non » par exemple).
  • Téléchargez ou capturez des exemples pour chaque leçon. Atlas recommande de fournir au moins 30 exemples par leçon pour garantir une variation suffisante.

3.2 Préparation des données

  • Le logiciel applique automatiquement augmente (retournement horizontal, zoom, bruit gaussien) pour rompre la redondance.
  • Si l’utilisateur remarque valeurs aberrantes (par exemple, images floues), il peut supprimer ou retester ces exemplaires avant la formation.

3.3 Formation

  • Cliquer sur «Train» démarre la session. Le spectateur montre en temps réel le perte (perte) et le précision (précision) sur l’ensemble d’entraînement.
  • Lorsque la perte cesse de diminuer sur 5 époques consécutives, l’entraînement s’arrête automatiquement, empêchant ainsi le surapprentissage.

3.4 Validation

Teachable Machine rapporte l’exactitude de l’ensemble de validation interne (environ 20% des données). Pour une mesure plus robuste, l’utilisateur peut:

10 modeles Excel + memo dates fiscales 2026 (kit TPE)

Bilan simplifie, suivi tresorerie, calcul TVA, fiche de paie - 10 templates prets a remplir + planning annuel des declarations.

Pas de spam. Desinscription en 1 clic.

  • Exportez des données brutes et entraînez le modèle à l’aide de TensorFlow‑Python.
  • Utiliser l’API model.evaluate() à tester sur un sous-ensemble dédié.

Intégration et déploiement

4.1 Exporter au format Web

  • Dans l’onglet À partagerà choisir Exporter Alors JavaScript côté client.
  • Les fichiers résultants sont chargés dans une page HTML: tf.loadGraphModel('model.json') initialise le modèle.
  • Un exemple de code complet:


  async function init() {
    const model = await tf.loadGraphModel('model.json');
    const input = document.querySelector('#camera').captures || tf.browser.fromPixels(video);
    const prediction = model.predict(input).dataSync();
    console.log('classe la plus probable :', prediction);
  }
  init();

4.2 Exporter vers un mobile

Le format TFLite est adapté à Android/iOS: ajoutez simplement le fichier au répertoire assets et utilisez le SDK officiel (Interpreter en Java/Kotlin ou tflite_flutter en vibrations). Les performances sont généralement plus élevées grâce à la compilation native.

4.3 Déploiement côté serveur

Pour les services nécessitant un traitement en arrière-plan, vous pouvez convertir le modèle en Modèle enregistré TensorFlow à travers tf.keras.models.save_model. Le serveur Node.js ou Python peut alors accueillir les requêtes API. Ceci est utile lorsque vous souhaitez garder vos données d’entraînement privées ou faire des prédictions massives.

Limites et bonnes pratiques

Limitation Impact Solution
Petite base de données Surapprentissage Utilisez la fonction augmenter intégré ou collecter davantage de données.
Pas de réglage hyperparamétrique Précision limitée Exportez le modèle, puis affinez-le en Python.
Pas de versionnage du modèle Gestion de versions lourdes Conservez les exportations avec la convention de dénomination (date_classify_v1.tflite).
Modèle limité à trois modalités Supprimer du texte ou un tableau Utilisez des solutions tierces (TensorFlow Hub).

5.1 Contrôle de la qualité des données

Avant l’entraînement, inspectez visuellement ou auditivement chaque exemple : bruit, éclairage, cohérence de l’étiquetage. Les erreurs de classification sont souvent dues à des biais de données plutôt qu’à un problème technique.

5.2 Confidentialité

Les modèles exportés ne conservent aucune trace des données d’entraînement. Cependant, lors de l’intégration du modèle dans une application publique, il est crucial de rappeler aux utilisateurs où leurs données sont traitées (client : local, serveur : cloud).

Cas d’usage concrets

  • Éducation : création d’un mini-jeu d’identification d’oiseaux dont l’objectif est d’entraîner les enfants à reconnaître les espèces à partir de photos.
  • Accessibilité : Plugin Web de reconnaissance vocale locale qui convertit les commandes audio en actions GUI.
  • Collecte de données IoT : Capteur réseau qui exclut le son du freinage du véhicule sur l’appareil local avant de le transmettre de manière anonyme aux chercheurs.

Conclusion

Teachable Machine simplifie considérablement le pipeline d’apprentissage automatique, de la collecte de données à l’inférence dans le navigateur. En comprenant ses fondamentaux – architecture, processus de formation et bonnes pratiques d’intégration – l’utilisateur peut aller au-delà du simple « cliquer et partir » et développer des solutions véritablement robustes et personnalisées. Votre prochain projet de détection, qu’il s’agisse d’image, de son ou de pose, n’a plus besoin d’attendre un data scientist : il suffit d’une interface conviviale, d’une bonne collecte de données et d’un peu d’attention aux détails, et le modèle sera prêt à être déployé directement sur le Web ou sur les appareils mobiles.