Cómo registrar gastos con comandos de voz (paso a paso)
Escribir "$4.50 café Starbucks" en una app tarda unos 12 segundos. Decir "café cuatro cincuenta Starbucks" tarda tres. A lo largo de un mes, esa diferencia suma unos 4 minutos ahorrados. No cambia la vida por sí sola. Lo importante es que lo haces. Cuanto más rápido se siente el registro, menos probable es que lo saltes.
- La voz es 3-4x más rápida que el registro manual para gastos cotidianos
- El NLP de Money Vault extrae importe, categoría, fecha y notas en una sola frase
- Funciona en 17 idiomas y admite comandos mixtos (importe en uno, descripción en otro)
- Cubre casos límite: propinas, gastos compartidos, divisas, fechas pasadas y transferencias
En esta guía
Cómo esta guía mantiene el registro por voz fiable
El flujo de esta guía sigue siempre el mismo orden: comandos cortos, importe cerca del artículo y revisión antes de guardar. Así el registro por voz es rápido sin volverse un juego de adivinanzas.
- Usa un gasto por comando para que el parser tenga un objetivo claro.
- Coloca el importe cerca del nombre del artículo para mejorar el reconocimiento.
- Confirma la vista previa antes de pasar al siguiente gasto.
Por qué la voz vence a escribir
El mayor enemigo del registro de gastos no es la complejidad. Es la fricción. Cada toque extra, cada desplegable de categorías, cada momento pensando "¿eran $4.50 o $4.75?" te acerca a no hacerlo. Y cuando te saltas un día, te saltas dos. Luego una semana. Y acabas mirando el extracto bancario diciendo "¿qué fue ese cargo de $47?"
La voz elimina casi toda esa fricción. No abres un formulario. No eliges categoría de una lista. Solo hablas. La app se encarga del resto.
Un estudio de Pew de 2024 encontró que el 68% de las personas que intentan registrar gastos de forma manual abandona en 30 días. La razón principal: "lleva demasiado tiempo". La voz reduce ese tiempo a un tercio. No hace que registrar sea divertido, pero sí lo bastante fácil como para no abandonar.
Primeros pasos (30 segundos)
Así se configura en Money Vault. Es rápido.
- Abre la app. Toca el botón del micrófono en la pantalla principal. Es el grande, abajo en el centro.
- Concede permiso al micrófono. Solo la primera vez. iOS preguntará. Toca "Permitir". El reconocimiento de voz ocurre en el dispositivo usando el framework Speech de Apple, así que tu audio no sale del teléfono.
- Empieza a hablar. Di algo como "café cuatro cincuenta". La app mostrará lo que entendió: importe ($4.50), categoría (Comida y bebida), cuenta (predeterminada). Confirma o edita.
Eso es todo. No necesitas crear cuenta para el registro básico. No hay tutorial largo. No hay onboarding de 5 minutos antes de poder registrar tu primer gasto.
Comandos básicos de voz
El motor NLP de Money Vault entiende lenguaje natural, no plantillas rígidas. No necesitas memorizar una sintaxis específica. Pero estos patrones funcionan siempre:
Gastos simples
- "Café cuatro cincuenta" → $4.50, categoría Comida y bebida
- "Uber doce dólares" → $12.00, categoría Transporte
- "Supermercado sesenta y tres veinte" → $63.20, categoría Supermercado
- "Cuota gimnasio cuarenta dólares" → $40.00, categoría Salud y fitness
Con notas
- "Almuerzo quince dólares en el italiano" → $15.00, Comida y bebida, nota: "en el italiano"
- "Gasolina cuarenta y dos dólares Shell en autopista" → $42.00, Transporte, nota: "Shell en autopista"
Con fechas
- "Ayer taxi ocho dólares" → $8.00, Transporte, fecha de ayer
- "Viernes pasado cena noventa dólares" → $90.00, Comida y bebida, fecha del viernes pasado
Ingresos
- "Ingreso tres mil quinientos" → entrada de $3,500
- "Pago freelance ochocientos" → $800 de ingreso
No necesitas decir "dólares" ni el nombre de tu moneda. La app usa automáticamente tu moneda predeterminada. Solo di el número. "Café cuatro cincuenta" funciona igual que "café cuatro dólares con cincuenta".
Comandos avanzados
Cuando domines lo básico, estos comandos más específicos ahorran aún más tiempo.
Transferencias entre cuentas
- "Transferir doscientos de la cartera al ahorro" → mueve $200 entre cuentas
- "Mover cincuenta de cuenta corriente a efectivo" → transferencia entre cuentas
Divisas extranjeras
- "Café tres euros" → registra en EUR y convierte a tu moneda base
- "Taxi quinientos yenes" → registra en JPY con tipo de cambio en tiempo real
- "Hotel ochenta libras" → registra en GBP
Categorías específicas
- "Entretenimiento veinte dólares Netflix" → $20.00, categoría Entretenimiento
- "Copago médico treinta y cinco dólares" → $35.00, categoría Salud
Cómo funciona el motor NLP
Cuando hablas, pasan tres cosas en aproximadamente un segundo:
- Voz a texto. El framework Speech de Apple convierte tu audio en texto en el dispositivo. Esto ocurre localmente en tu teléfono. Sin servidor, sin internet para el reconocimiento básico.
- Extracción de entidades. El parser NLP escanea el texto en busca de importes, fechas, palabras clave de categoría, nombres de cuentas y menciones de divisas. Usa una combinación de patrones y un modelo NER (Named Entity Recognition) entrenado.
- Caché inteligente. Si ya has dicho algo similar antes ("café cuatro cincuenta" el martes pasado, "café cuatro dólares" hoy), la app recuerda la categoría y la cuenta de la última vez. Por eso la precisión mejora cuanto más la usas. El caché utiliza un umbral de similitud del 85%, así que pequeñas variaciones siguen acertando la categoría.
El parser maneja bastante bien la ambigüedad. Si dices "almuerzo doce cincuenta", entiende $12.50, no $1,250. Si dices "alquiler doce cincuenta", entiende $1,250 porque el alquiler rara vez es $12.50. El contexto importa, y el motor usa heurísticas basadas en la categoría para resolverlo.
Casos límite y situaciones difíciles
La vida real no siempre es "café cuatro dólares". Así se maneja lo raro.
Dividir una cuenta
Di el importe total que pagaste, no el total de la cuenta. "Cena cuarenta y cinco dólares mi parte" registra tus $45, no el total del grupo. Añade una nota sobre el reparto si quieres contexto después.
Propina incluida vs separada
Si quieres registrar el total con propina, di el número final. "Cena sesenta y dos dólares con propina" registra $62. Si quieres registrar la propina aparte, crea dos entradas: "Cena cincuenta dólares" y luego "Propina doce dólares".
Gastos recurrentes
La entrada por voz no crea registros recurrentes automáticamente. Para suscripciones, regístralas una vez cuando llegue el cargo. O usa la entrada manual para configurar un seguimiento recurrente. La voz es mejor para gastos puntuales, en el momento.
Importes decimales en distintos idiomas
En español, puedes decir "cuatro cincuenta" o "cuatro coma cincuenta". En idiomas que usan coma como separador decimal, la app se adapta a la configuración regional del dispositivo. Los usuarios alemanes pueden decir "vier funfzig" de forma natural.
Ruido de fondo
El framework Speech de Apple maneja bien el ruido moderado. ¿Cafetería ruidosa? Normalmente bien. ¿Obra ruidosa? Puedes obtener resultados confusos. En entornos ruidosos, acerca el teléfono a la boca o espera un momento más silencioso. La calidad de reconocimiento cae notablemente por encima de 70 dB de ruido ambiente.
Consejos para mayor precisión
- Di el importe primero o justo después del artículo. "Café cuatro cincuenta" y "cuatro cincuenta café" funcionan, pero poner el importe cerca del artículo da más contexto. "Me tomé un café increíble en ese sitio nuevo de la Quinta Calle cuatro cincuenta" es más difícil de parsear porque el importe queda lejos.
- Usa números redondos cuando puedas. "Veinte dólares" se parsea más rápido y con más precisión que "diecinueve noventa y siete". Si la precisión importa, sé específico. Si redondeas para ir rápido, el parser maneja ambos casos.
- Habla a velocidad normal. No necesitas hablar lento ni vocalizar como un robot. El motor de voz está entrenado con conversación natural. Sobre-articular a veces confunde porque los patrones no coinciden con los datos de entrenamiento.
- Mantén los comandos en menos de 10 palabras. Cuanto más corto, mejor. "Uber doce dólares aeropuerto" funciona perfecto. Una frase de 25 palabras con contexto también puede funcionar, pero tiene más probabilidades de malinterpretación.
- Revisa la vista previa antes de confirmar. La app muestra lo que entendió antes de guardar. Mira el importe y la categoría. Tarda un segundo y evita errores que se acumulen durante semanas.
Errores comunes a evitar
Error #1: No revisar la categoría. El parser es bueno, pero "Shell" puede ser gasolinera o café. Mira siempre la categoría asignada automáticamente. Corregirla una vez enseña al caché inteligente para la próxima.
Error #2: Esperar hasta el final del día. El registro por voz funciona mejor en el momento. ¿Acabas de pagar? Dilo ahí. Registrar 8 gastos por la noche mata el propósito. Olvidarás importes, omitirás artículos y mezclarás lo que compraste.
Error #3: Luchar contra el parser. Si se equivoca, no repitas el mismo comando más alto. Reformula. En lugar de "café en Starbucks cuatro cincuenta" (donde "en" puede confundir), prueba "Starbucks café cuatro cincuenta".
Error #4: Ignorar el caché inteligente. Cuando corriges una categoría, la app lo recuerda. Pero si nunca corriges, la categoría errónea persiste. Dedica 30 segundos a corregir las primeras asignaciones en tu primera semana. Después, el caché acierta en más del 85% de los registros.