Guide

Comment suivre ses dépenses à la voix, étape par étape

Mis à jour le 10 avril 2026 · 7 min de lecture

Saisir « 4,50 $ café Starbucks » dans une application prend environ 12 secondes. Dire « café quatre cinquante Starbucks » prend trois secondes. Sur un mois de suivi quotidien, cela représente environ 4 minutes gagnées. Ce n’est pas spectaculaire en soi. Mais le vrai avantage n’est pas la vitesse. C’est le fait que vous le faites vraiment. Plus la saisie paraît simple, moins vous risquez de la zapper.

En bref

Dans ce guide

  1. Pourquoi la voix bat la saisie
  2. Démarrer en 30 secondes
  3. Commandes vocales de base
  4. Commandes avancées
  5. Comment fonctionne le moteur de TALN
  6. Cas limites et situations délicates
  7. Conseils pour plus de précision
  8. Erreurs courantes à éviter

Comment ce guide garde la saisie vocale fiable

Le flux de ce guide suit toujours le même ordre : gardez des commandes courtes, placez le montant près de l’article, puis vérifiez l’aperçu avant d’enregistrer. Cela garde la saisie rapide sans la transformer en devinette.

68%
des personnes qui commencent à suivre leurs dépenses manuellement abandonnent dans le premier mois
Source : Pew Research Center, 2024

Pourquoi la voix bat la saisie

Le plus grand ennemi du suivi des dépenses n’est pas la complexité. C’est la friction. Chaque tap supplémentaire, chaque menu déroulant de catégorie, chaque instant passé à se demander « c’était 4,50 $ ou 4,75 $ ? » vous rapproche du moment où vous n’allez tout simplement plus le faire. Et une fois qu’on saute une journée, on en saute deux. Puis une semaine. Puis on regarde son relevé bancaire en se demandant « c’était quoi ces 47 $ ? »

La voix supprime la plupart de cette friction. Pas de formulaire. Pas de catégorie à choisir dans une liste. Vous parlez, et l’application fait le reste.

Saisie vocale
~3 sec
Saisie rapide (montant seul)
~6 sec
Saisie manuelle complète
~12 sec
Saisie dans un tableur
~18 sec
Temps moyen pour enregistrer une dépense. Basé sur les benchmarks NNGroup de saisie mobile, 2025.

Une étude Pew de 2024 a montré que 68 % des personnes qui essaient de suivre leurs dépenses manuellement abandonnent au bout de 30 jours. La raison principale ? « Trop chronophage. » La saisie vocale réduit ce temps des deux tiers. Ce n’est pas ce qui rend le suivi agréable, mais c’est suffisamment fluide pour ne pas abandonner.

Démarrer en 30 secondes

Voici la configuration dans Money Vault. Elle est courte.

  1. Ouvrez l’application. Appuyez sur le bouton micro de l’écran d’accueil. C’est le gros bouton en bas au centre.
  2. Accordez l’autorisation micro. La première fois seulement. iOS vous le demandera. Touchez « Autoriser ». La reconnaissance vocale se fait sur l’appareil via le framework Speech d’Apple, donc votre audio ne quitte pas votre téléphone.
  3. Parlez. Dites quelque chose comme « café quatre cinquante ». L’application affichera ce qu’elle a compris : montant (4,50 $), catégorie (Alimentation et boissons), compte (par défaut). Confirmez ou corrigez.

C’est tout. Pas de création de compte obligatoire pour le suivi de base. Pas de tutoriel impossible à passer. Pas d’assistant d’onboarding qui prend 5 minutes avant votre première dépense.

Commandes vocales de base

Le moteur de TALN de Money Vault comprend le langage naturel, pas des modèles rigides. Vous n’avez pas besoin de mémoriser une syntaxe précise. Mais voici des modèles qui fonctionnent de façon fiable :

Dépenses simples

Avec notes

Avec dates

Revenus

Astuce finale

Vous n’avez pas besoin de dire « dollars » ni le nom de votre devise. L’application utilise automatiquement votre devise par défaut. Dites simplement le montant. « Café quatre cinquante » fonctionne exactement comme « café quatre dollars cinquante ».

Commandes avancées

Quand les bases sont maîtrisées, ces commandes plus précises permettent de gagner encore plus de temps.

Transferts entre comptes

Devises étrangères

Catégories précises

Essayez le suivi des dépenses à la voix

Parlez une fois, c’est enregistré. Money Vault est gratuit sur iOS.

Télécharger sur l’App Store

Comment fonctionne le moteur de TALN

Quand vous parlez, trois choses se produisent en environ une seconde :

  1. Parole vers texte. Le framework Speech d’Apple convertit votre audio en texte sur l’appareil. Cela se fait localement, sur votre téléphone. Pas de serveur, pas d’internet requis pour la reconnaissance de base.
  2. Extraction des entités. L’analyseur TALN parcourt le texte pour repérer les montants, dates, mots-clés de catégorie, noms de comptes et devises. Il combine des règles et un modèle NER (Named Entity Recognition) entraîné.
  3. Mise en cache intelligente. Si vous avez déjà dit quelque chose de similaire (« café quatre cinquante » mardi dernier, « café quatre dollars » aujourd’hui), l’application se souvient de la catégorie et du compte de la dernière fois. C’est pour cela que la précision s’améliore avec l’usage. Le cache utilise un seuil de similarité de 85 %, donc les petites variantes aboutissent toujours à la bonne catégorie.

L’analyseur gère plutôt bien les ambiguïtés. Dites « déjeuner douze cinquante » et il comprend 12,50 $, pas 1 250 $. Dites « loyer douze cinquante » et il comprend 1 250 $ parce que le loyer est rarement de 12,50 $. Le contexte compte, et le moteur utilise des heuristiques basées sur la catégorie pour trancher.

Cas limites et situations délicates

La vraie vie n’est pas toujours « café quatre dollars ». Voici comment gérer les cas bizarres.

Partager une addition

Dites le montant total que vous avez payé, pas le total du ticket. « Dîner quarante-cinq dollars ma part » enregistre vos 45 $, pas le total du groupe. Ajoutez une note sur le partage si vous voulez un contexte plus tard.

Pourboire inclus ou séparé

Si vous voulez enregistrer le total avec le pourboire, dites simplement le montant final. « Dîner soixante-deux dollars avec pourboire » enregistre 62 $. Si vous voulez suivre le pourboire séparément, créez deux entrées : « Dîner cinquante dollars » puis « Pourboire douze dollars ».

Dépenses récurrentes

La saisie vocale ne crée pas automatiquement d’entrées récurrentes. Pour les abonnements, enregistrez-les une fois quand le prélèvement arrive. Ou utilisez la saisie manuelle pour configurer un suivi récurrent. La voix est surtout utile pour les dépenses ponctuelles, au moment où elles arrivent.

Montants décimaux dans différentes langues

En français, dites « quatre cinquante » ou « quatre virgule cinquante ». Dans les langues qui utilisent la virgule comme séparateur décimal, l’application s’adapte à la locale de votre appareil. Les utilisateurs allemands peuvent dire « vier funfzig » naturellement.

Bruit de fond

Le framework Speech d’Apple gère plutôt bien un bruit modéré. Du bavardage de café ? En général, pas de problème. Un chantier très bruyant ? Les résultats peuvent se dégrader. Dans un environnement bruyant, rapprochez le téléphone de votre bouche ou attendez un moment plus calme. La qualité de reconnaissance baisse nettement au-delà d’environ 70 dB de bruit ambiant.

Conseils pour plus de précision

  1. Dites le montant en premier ou juste après l’article. « Café quatre cinquante » et « quatre cinquante café » fonctionnent tous les deux, mais placer le montant près du nom de l’article donne plus de contexte à l’analyseur. « J’ai pris un très bon café dans ce nouvel endroit de la Cinquième Rue quatre cinquante » est plus difficile à analyser, car le montant est trop éloigné du mot-clé.
  2. Utilisez des montants ronds quand c’est possible. « Vingt dollars » est analysé plus vite et plus précisément que « dix-neuf quatre-vingt-dix-sept ». Si la précision est importante, soyez exact. Si vous arrondissez pour aller plus vite, l’analyseur gère les deux très bien.
  3. Parlez à vitesse normale. Vous n’avez pas besoin de ralentir ni de sur-articuler comme un robot. Le moteur vocal est entraîné sur un débit de conversation naturel. Trop articuler peut parfois le perturber, car les motifs audio ne correspondent plus aux données d’entraînement.
  4. Gardez les commandes sous 10 mots. Plus c’est court, mieux c’est. « Uber douze dollars aéroport » fonctionne très bien. Une phrase de 25 mots avec du contexte marchera encore, mais il y aura plus de risques de mauvaise interprétation.
  5. Vérifiez l’aperçu avant de confirmer. L’application affiche ce qu’elle a analysé avant l’enregistrement. Jetez un œil au montant et à la catégorie. Cela prend une seconde et évite que les erreurs ne s’accumulent pendant des semaines.

Erreurs courantes à éviter

Erreur n°1 : ne pas vérifier la catégorie. L’analyseur est bon, mais « Shell » peut être une station-service ou une pause café. Vérifiez toujours la catégorie assignée automatiquement. La corriger une fois apprend au cache intelligent pour la prochaine fois.

Erreur n°2 : attendre la fin de la journée. La voix fonctionne mieux sur le moment. Vous venez de payer ? Dites-le tout de suite. Enregistrer 8 dépenses le soir ruine l’intérêt. Vous oublierez des montants, sauterez des articles et mélangerez les achats.

Erreur n°3 : lutter contre l’analyseur. S’il se trompe souvent, ne répétez pas la même commande plus fort. Reformulez. Au lieu de « café chez Starbucks quatre cinquante » (où « chez » peut perturber l’analyseur), essayez « Starbucks café quatre cinquante ».

Erreur n°4 : ignorer le cache intelligent. Quand vous corrigez une catégorie, l’application s’en souvient. Mais si vous ne la corrigez jamais, la mauvaise catégorie persiste. Passez 30 secondes à corriger les mauvaises affectations pendant votre première semaine. Ensuite, le cache gère de lui-même plus de 85 % des entrées correctement.

Suivez vos dépenses en parlant

Saisie vocale, scan des reçus, chat IA. Tout est gratuit sur iOS.

Télécharger sur l’App Store