Guida

Come tenere traccia delle spese con i comandi vocali (passo dopo passo)

Aggiornato il 10 aprile 2026 · 7 min di lettura

Digitare "$4.50 coffee Starbucks" in un'app richiede circa 12 secondi. Dire "coffee four fifty Starbucks" ne richiede tre. In un mese di tracciamento quotidiano, la differenza equivale a circa 4 minuti risparmiati. Da solo non cambia la vita. Ma il vero vantaggio non è la velocità. È che lo fai davvero. Più la registrazione è rapida, meno è probabile che tu la salti.

Riassunto rapido

In questa guida

  1. Perché la voce batte la digitazione
  2. Per iniziare (30 secondi)
  3. Comandi vocali di base
  4. Comandi avanzati
  5. Come funziona il motore NLP
  6. Casi limite e situazioni difficili
  7. Consigli per una maggiore precisione
  8. Errori comuni da evitare

Come questa guida mantiene affidabile il tracciamento vocale

Il flusso di lavoro in questa guida segue sempre lo stesso ordine: tieni i comandi brevi, posiziona l'importo vicino all'articolo, poi controlla l'anteprima prima di salvare. Questo mantiene la registrazione vocale rapida senza trasformarla in un gioco di ipotesi.

68%
delle persone che iniziano a tracciare le spese manualmente abbandonano entro il primo mese
Fonte: Pew Research Center, 2024

Perché la voce batte la digitazione

Il peggior nemico del tracciamento delle spese non è la complessità. È l'attrito. Ogni tap in più, ogni menu a tendina delle categorie, ogni momento in cui pensi "era $4.50 o $4.75?" ti avvicina al non farlo affatto. E una volta che salti un giorno, ne salti due. Poi una settimana. Poi guardi il tuo estratto conto pensando "cos'era quella spesa di $47?"

La voce elimina la maggior parte di quell'attrito. Non apri un modulo. Non scegli una categoria da un elenco. Parli e basta. L'app si occupa del resto.

Input vocale
~3 sec
Aggiunta rapida
~6 sec
Inserimento manuale completo
~12 sec
Registro su foglio di calcolo
~18 sec
Tempo medio per registrare una spesa. Basato sui benchmark NNGroup per la velocità di input mobile, 2025.

Uno studio Pew del 2024 ha rilevato che il 68% delle persone che prova il tracciamento manuale delle spese abbandona entro 30 giorni. Il motivo principale? "Richiede troppo tempo." L'input vocale riduce quel tempo di due terzi. Non renderà il tracciamento delle spese divertente, ma lo renderà abbastanza indolore da non mollare.

Per iniziare (30 secondi)

Ecco la configurazione in Money Vault. È breve.

  1. Apri l'app. Tocca il pulsante del microfono nella schermata principale. È il grande in basso al centro.
  2. Concedi il permesso al microfono. Solo la prima volta. iOS lo chiederà. Tocca "Consenti". Il riconoscimento vocale avviene sul dispositivo utilizzando il framework Speech di Apple, quindi il tuo audio non lascia il telefono.
  3. Inizia a parlare. Di' qualcosa come "coffee four fifty". L'app ti mostrerà cosa ha capito: importo ($4.50), categoria (Cibo e bevande), conto (predefinito). Conferma o modifica.

Tutto qui. Non è necessaria la creazione di un account per il tracciamento di base. Nessun tutorial che non puoi saltare. Nessuna procedura guidata di onboarding che richiede 5 minuti prima di poter registrare la prima spesa.

Comandi vocali di base

Il motore NLP di Money Vault comprende il linguaggio naturale, non modelli rigidi. Non devi memorizzare una sintassi specifica. Ma ecco i pattern che funzionano in modo coerente:

Spese semplici

Con note

Con date

Entrate

Suggerimento pratico

Non è necessario dire "dollari" o il nome della tua valuta. L'app usa automaticamente la tua valuta predefinita. Di' solo il numero. "Coffee four fifty" funziona esattamente come "coffee four dollars and fifty cents".

Comandi avanzati

Una volta che ti senti a tuo agio con le basi, questi comandi più specifici fanno risparmiare ancora più tempo.

Trasferimenti tra conti

Valute estere

Categorie specifiche

Prova il tracciamento vocale delle spese

Dillo una volta, è registrato. Money Vault è gratuito su iOS.

Scarica su App Store

Come funziona il motore NLP

Quando parli, in circa un secondo accadono tre cose:

  1. Voce in testo. Il framework Speech di Apple sul dispositivo converte il tuo audio in testo. Questo avviene localmente sul tuo telefono. Nessun server, nessuna connessione internet richiesta per il riconoscimento di base.
  2. Estrazione delle entità. Il parser NLP scansiona il testo alla ricerca di importi, date, parole chiave di categoria, nomi di conti e riferimenti a valute. Utilizza una combinazione di corrispondenza di pattern e un modello NER (Named Entity Recognition) addestrato.
  3. Caching intelligente. Se hai detto qualcosa di simile in precedenza ("coffee four fifty" martedì scorso, "coffee four dollars" oggi), l'app ricorda la categoria e il conto dell'ultima volta. Ecco perché la precisione migliora con l'uso. La cache utilizza una soglia di somiglianza dell'85%, quindi le piccole variazioni colpiscono comunque la categoria giusta.

Il parser gestisce bene l'ambiguità. Di' "lunch twelve fifty" e capisce $12.50, non $1.250. Di' "rent twelve fifty" e capisce $1.250 perché l'affitto raramente costa $12.50. Il contesto è importante e il motore usa euristiche basate sulle categorie per risolvere questi casi.

Casi limite e situazioni difficili

La vita reale non è sempre "coffee four dollars". Ecco come gestire le situazioni particolari.

Divisione del conto

Di' l'importo totale che hai pagato tu, non il totale del conto. "Dinner forty-five dollars my share" registra i tuoi $45, non il totale del gruppo. Aggiungi una nota sulla divisione se vuoi il contesto in seguito.

Mancia inclusa o separata

Se vuoi registrare il totale inclusa la mancia, di' semplicemente il numero finale. "Dinner sixty-two dollars with tip" registra $62. Se vuoi tracciare la mancia separatamente, fai due voci: "Dinner fifty dollars" poi "Tip twelve dollars".

Spese ricorrenti

L'input vocale non configura automaticamente le voci ricorrenti. Per gli abbonamenti, registrali una volta quando arriva l'addebito. Oppure usa l'inserimento manuale per configurare il tracciamento ricorrente. La voce è ideale per la registrazione occasionale, nel momento.

Importi decimali in lingue diverse

In inglese, di' "four fifty" o "four point five zero". Nelle lingue che usano la virgola come separatore decimale, l'app si adatta alla lingua del dispositivo. Gli utenti tedeschi possono dire "vier funfzig" naturalmente.

Rumore di fondo

Il framework Speech di Apple gestisce bene il rumore di fondo moderato. Chiacchiere in un bar? Di solito nessun problema. Un cantiere rumoroso? Potresti ottenere risultati confusi. In ambienti rumorosi, avvicina il telefono alla bocca o aspetta un momento più tranquillo. La qualità del riconoscimento cala notevolmente oltre i 70 dB di rumore ambientale.

Consigli per una maggiore precisione

  1. Di' l'importo per primo o subito dopo l'articolo. "Coffee four fifty" e "four fifty coffee" funzionano entrambi, ma mettere l'importo vicino al nome dell'articolo dà al parser più contesto. "I had a really great coffee at that new place on Fifth Street four fifty" è più difficile da analizzare perché l'importo è lontano dalla parola chiave.
  2. Usa numeri tondi quando puoi. "Twenty dollars" viene analizzato più velocemente e accuratamente di "nineteen ninety-seven". Se la precisione è importante, sii specifico. Se stai arrotondando per velocità, il parser gestisce entrambi bene.
  3. Parla a velocità normale. Non devi rallentare o scandire le parole come un robot. Il motore vocale è addestrato sulla velocità naturale della conversazione. Un'eccessiva enfasi a volte lo confonde perché i pattern audio non corrispondono ai dati di addestramento.
  4. Mantieni i comandi sotto le 10 parole. Più corto è meglio. "Uber twelve dollars airport" funziona benissimo. Una frase di 25 parole con retroscena funzionerà comunque, ma avrà più possibilità di interpretazione errata.
  5. Controlla l'anteprima prima di confermare. L'app ti mostra cosa ha analizzato prima di salvare. Dai un'occhiata all'importo e alla categoria. Richiede un secondo e previene il cumulo degli errori nelle settimane.

Errori comuni da evitare

Errore n. 1: non controllare la categoria. Il parser è buono, ma "Shell" potrebbe essere un benzinaio o una caffetteria. Guarda sempre la categoria assegnata automaticamente. Correggerla una volta insegna alla cache intelligente per la prossima volta.

Errore n. 2: aspettare fino alla fine della giornata. Il tracciamento vocale funziona meglio sul momento. Hai appena pagato? Dillo subito. Registrare 8 spese in batch la sera vanifica lo scopo. Dimenticherai gli importi, salterai voci e confondi cosa hai comprato dove.

Errore n. 3: combattere il parser. Se continua a sbagliare qualcosa, non ripetere lo stesso comando più forte. Prova a riformulare. Invece di "coffee at Starbucks four fifty" (dove "at" potrebbe confondere il parser), prova "Starbucks coffee four fifty".

Errore n. 4: ignorare la cache intelligente. Quando correggi una categoria, l'app la ricorda. Ma se non la correggi mai, la categoria sbagliata persiste. Dedica 30 secondi a correggere le categorie assegnate in modo errato nella prima settimana. Dopodiché, la cache gestisce correttamente l'85%+ delle voci da sola.

Traccia le spese parlando

Input vocale, scansione ricevute, chat AI. Tutto gratuito su iOS.

Scarica su App Store