Guía

Cómo registrar gastos con comandos de voz (paso a paso)

Actualizado el 10 de abril de 2026 · 7 min de lectura

Escribir "$4.50 café Starbucks" en una app tarda unos 12 segundos. Decir "café cuatro cincuenta Starbucks" tarda tres. A lo largo de un mes, esa diferencia suma unos 4 minutos ahorrados. No cambia la vida por sí sola. Lo importante es que lo haces. Cuanto más rápido se siente el registro, menos probable es que lo saltes.

Resumen rápido

En esta guía

  1. Por qué la voz vence a escribir
  2. Primeros pasos (30 segundos)
  3. Comandos básicos de voz
  4. Comandos avanzados
  5. Cómo funciona el motor NLP
  6. Casos límite y situaciones difíciles
  7. Consejos para mayor precisión
  8. Errores comunes a evitar

Cómo esta guía mantiene el registro por voz fiable

El flujo de esta guía sigue siempre el mismo orden: comandos cortos, importe cerca del artículo y revisión antes de guardar. Así el registro por voz es rápido sin volverse un juego de adivinanzas.

68%
de las personas que empiezan a registrar gastos manualmente lo dejan en el primer mes
Fuente: Pew Research Center, 2024

Por qué la voz vence a escribir

El mayor enemigo del registro de gastos no es la complejidad. Es la fricción. Cada toque extra, cada desplegable de categorías, cada momento pensando "¿eran $4.50 o $4.75?" te acerca a no hacerlo. Y cuando te saltas un día, te saltas dos. Luego una semana. Y acabas mirando el extracto bancario diciendo "¿qué fue ese cargo de $47?"

La voz elimina casi toda esa fricción. No abres un formulario. No eliges categoría de una lista. Solo hablas. La app se encarga del resto.

Entrada por voz
~3 s
Añadir rápido (solo importe)
~6 s
Entrada manual completa
~12 s
Registro en hoja de cálculo
~18 s
Tiempo medio para registrar un gasto. Basado en benchmarks de velocidad de entrada móvil de NNGroup, 2025.

Un estudio de Pew de 2024 encontró que el 68% de las personas que intentan registrar gastos de forma manual abandona en 30 días. La razón principal: "lleva demasiado tiempo". La voz reduce ese tiempo a un tercio. No hace que registrar sea divertido, pero sí lo bastante fácil como para no abandonar.

Primeros pasos (30 segundos)

Así se configura en Money Vault. Es rápido.

  1. Abre la app. Toca el botón del micrófono en la pantalla principal. Es el grande, abajo en el centro.
  2. Concede permiso al micrófono. Solo la primera vez. iOS preguntará. Toca "Permitir". El reconocimiento de voz ocurre en el dispositivo usando el framework Speech de Apple, así que tu audio no sale del teléfono.
  3. Empieza a hablar. Di algo como "café cuatro cincuenta". La app mostrará lo que entendió: importe ($4.50), categoría (Comida y bebida), cuenta (predeterminada). Confirma o edita.

Eso es todo. No necesitas crear cuenta para el registro básico. No hay tutorial largo. No hay onboarding de 5 minutos antes de poder registrar tu primer gasto.

Comandos básicos de voz

El motor NLP de Money Vault entiende lenguaje natural, no plantillas rígidas. No necesitas memorizar una sintaxis específica. Pero estos patrones funcionan siempre:

Gastos simples

Con notas

Con fechas

Ingresos

Consejo práctico

No necesitas decir "dólares" ni el nombre de tu moneda. La app usa automáticamente tu moneda predeterminada. Solo di el número. "Café cuatro cincuenta" funciona igual que "café cuatro dólares con cincuenta".

Comandos avanzados

Cuando domines lo básico, estos comandos más específicos ahorran aún más tiempo.

Transferencias entre cuentas

Divisas extranjeras

Categorías específicas

Prueba el registro de gastos por voz

Dilo una vez y queda registrado. Money Vault es gratis en iOS.

Descargar en el App Store

Cómo funciona el motor NLP

Cuando hablas, pasan tres cosas en aproximadamente un segundo:

  1. Voz a texto. El framework Speech de Apple convierte tu audio en texto en el dispositivo. Esto ocurre localmente en tu teléfono. Sin servidor, sin internet para el reconocimiento básico.
  2. Extracción de entidades. El parser NLP escanea el texto en busca de importes, fechas, palabras clave de categoría, nombres de cuentas y menciones de divisas. Usa una combinación de patrones y un modelo NER (Named Entity Recognition) entrenado.
  3. Caché inteligente. Si ya has dicho algo similar antes ("café cuatro cincuenta" el martes pasado, "café cuatro dólares" hoy), la app recuerda la categoría y la cuenta de la última vez. Por eso la precisión mejora cuanto más la usas. El caché utiliza un umbral de similitud del 85%, así que pequeñas variaciones siguen acertando la categoría.

El parser maneja bastante bien la ambigüedad. Si dices "almuerzo doce cincuenta", entiende $12.50, no $1,250. Si dices "alquiler doce cincuenta", entiende $1,250 porque el alquiler rara vez es $12.50. El contexto importa, y el motor usa heurísticas basadas en la categoría para resolverlo.

Casos límite y situaciones difíciles

La vida real no siempre es "café cuatro dólares". Así se maneja lo raro.

Dividir una cuenta

Di el importe total que pagaste, no el total de la cuenta. "Cena cuarenta y cinco dólares mi parte" registra tus $45, no el total del grupo. Añade una nota sobre el reparto si quieres contexto después.

Propina incluida vs separada

Si quieres registrar el total con propina, di el número final. "Cena sesenta y dos dólares con propina" registra $62. Si quieres registrar la propina aparte, crea dos entradas: "Cena cincuenta dólares" y luego "Propina doce dólares".

Gastos recurrentes

La entrada por voz no crea registros recurrentes automáticamente. Para suscripciones, regístralas una vez cuando llegue el cargo. O usa la entrada manual para configurar un seguimiento recurrente. La voz es mejor para gastos puntuales, en el momento.

Importes decimales en distintos idiomas

En español, puedes decir "cuatro cincuenta" o "cuatro coma cincuenta". En idiomas que usan coma como separador decimal, la app se adapta a la configuración regional del dispositivo. Los usuarios alemanes pueden decir "vier funfzig" de forma natural.

Ruido de fondo

El framework Speech de Apple maneja bien el ruido moderado. ¿Cafetería ruidosa? Normalmente bien. ¿Obra ruidosa? Puedes obtener resultados confusos. En entornos ruidosos, acerca el teléfono a la boca o espera un momento más silencioso. La calidad de reconocimiento cae notablemente por encima de 70 dB de ruido ambiente.

Consejos para mayor precisión

  1. Di el importe primero o justo después del artículo. "Café cuatro cincuenta" y "cuatro cincuenta café" funcionan, pero poner el importe cerca del artículo da más contexto. "Me tomé un café increíble en ese sitio nuevo de la Quinta Calle cuatro cincuenta" es más difícil de parsear porque el importe queda lejos.
  2. Usa números redondos cuando puedas. "Veinte dólares" se parsea más rápido y con más precisión que "diecinueve noventa y siete". Si la precisión importa, sé específico. Si redondeas para ir rápido, el parser maneja ambos casos.
  3. Habla a velocidad normal. No necesitas hablar lento ni vocalizar como un robot. El motor de voz está entrenado con conversación natural. Sobre-articular a veces confunde porque los patrones no coinciden con los datos de entrenamiento.
  4. Mantén los comandos en menos de 10 palabras. Cuanto más corto, mejor. "Uber doce dólares aeropuerto" funciona perfecto. Una frase de 25 palabras con contexto también puede funcionar, pero tiene más probabilidades de malinterpretación.
  5. Revisa la vista previa antes de confirmar. La app muestra lo que entendió antes de guardar. Mira el importe y la categoría. Tarda un segundo y evita errores que se acumulen durante semanas.

Errores comunes a evitar

Error #1: No revisar la categoría. El parser es bueno, pero "Shell" puede ser gasolinera o café. Mira siempre la categoría asignada automáticamente. Corregirla una vez enseña al caché inteligente para la próxima.

Error #2: Esperar hasta el final del día. El registro por voz funciona mejor en el momento. ¿Acabas de pagar? Dilo ahí. Registrar 8 gastos por la noche mata el propósito. Olvidarás importes, omitirás artículos y mezclarás lo que compraste.

Error #3: Luchar contra el parser. Si se equivoca, no repitas el mismo comando más alto. Reformula. En lugar de "café en Starbucks cuatro cincuenta" (donde "en" puede confundir), prueba "Starbucks café cuatro cincuenta".

Error #4: Ignorar el caché inteligente. Cuando corriges una categoría, la app lo recuerda. Pero si nunca corriges, la categoría errónea persiste. Dedica 30 segundos a corregir las primeras asignaciones en tu primera semana. Después, el caché acierta en más del 85% de los registros.

Registra gastos hablando

Entrada por voz, escaneo de recibos, chat con IA. Todo gratis en iOS.

Descargar en el App Store