Гайд

Как отслеживать расходы голосом (пошагово)

Обновлено 10 апреля 2026 · 7 мин чтения

Печатать "$4.50 coffee Starbucks" в приложении каждый раз, когда вы что-то купили, - это примерно 12 секунд на одну запись. Сказать "кофе четыре пятьдесят Starbucks" - три секунды. За месяц ежедневного учета это дает около 4 минут экономии. Само по себе не выглядит революцией. Но главный выигрыш не в скорости. А в том, что вы реально это делаете. Чем быстрее ощущается запись, тем меньше вероятность, что вы её пропустите.

Коротко

В этом гайде

  1. Почему голос лучше набора текста
  2. Как начать за 30 секунд
  3. Базовые голосовые команды
  4. Продвинутые команды
  5. Как работает NLP-движок
  6. Сложные случаи и необычные ситуации
  7. Советы для лучшей точности
  8. Частые ошибки, которых стоит избегать

Как этот гайд делает голосовой учет надежным

Рабочий процесс здесь всегда идет в одном порядке: короткая команда, сумма рядом с предметом, затем проверка предпросмотра перед сохранением. Так голосовой учет остается быстрым и не превращается в угадайку.

68%
людей, которые начинают вести учет расходов вручную, бросают это в течение первого месяца
Источник: Pew Research Center, 2024

Почему голос лучше набора текста

Главный враг учета расходов — не сложность. Это трение. Каждый лишний тап, каждый выпадающий список категорий, каждая секунда, когда вы думаете «это было $4.50 или $4.75?» — всё это приближает вас к тому, чтобы просто не делать это. Пропустили один день — пропустите два. Потом неделю. Потом смотрите на выписку из банка и думаете: «что это за списание на $47?»

Голос убирает большую часть этого трения. Не нужно открывать форму. Не нужно выбирать категорию из списка. Просто говорите. Приложение разберется с остальным.

Голосовой ввод
~3 сек
Быстрое добавление
~6 сек
Полный ручной ввод
~12 сек
Запись в таблицу
~18 сек
Среднее время записи одного расхода. На основе бенчмарков NNGroup по скорости мобильного ввода, 2025.

Исследование Pew 2024 года выявило, что 68% людей, которые пробуют вести учет расходов вручную, бросают это в течение 30 дней. Главная причина? «Слишком много времени уходит». Голосовой ввод сокращает это время на две трети. Учет расходов не станет развлечением, но станет достаточно безболезненным, чтобы не бросить.

Как начать за 30 секунд

Вот что нужно сделать в Money Vault. Это быстро.

  1. Откройте приложение. Нажмите кнопку микрофона на главном экране. Это большая кнопка внизу по центру.
  2. Предоставьте разрешение на микрофон. Только первый раз. iOS спросит. Нажмите «Разрешить». Распознавание речи происходит на устройстве с использованием фреймворка Apple Speech, поэтому ваш голос не покидает телефон.
  3. Начните говорить. Скажите что-то вроде «кофе четыре пятьдесят». Приложение покажет, что оно поняло: сумма ($4.50), категория (Еда и напитки), счет (по умолчанию). Подтвердите или отредактируйте.

Всё. Для базового учета не нужно создавать аккаунт. Нет туториала, который нельзя пропустить. Нет мастера онбординга, который занимает 5 минут до того, как вы сможете записать первый расход.

Базовые голосовые команды

NLP-движок Money Vault понимает естественный язык, а не жесткие шаблоны. Не нужно запоминать конкретный синтаксис. Но вот паттерны, которые работают стабильно:

Простые расходы

С заметками

С датами

Доходы

Практический вывод

Не нужно говорить «долларов» или название вашей валюты. Приложение автоматически использует вашу валюту по умолчанию. Просто называйте цифру. «Coffee four fifty» работает так же, как «coffee four dollars and fifty cents».

Продвинутые команды

Когда освоите основы, эти более конкретные команды сэкономят ещё больше времени.

Переводы между счетами

Иностранные валюты

Конкретные категории

Попробуйте учет расходов голосом

Сказали один раз - записано. Money Vault бесплатно на iOS.

Загрузить в App Store

Как работает NLP-движок

Когда вы говорите, за примерно одну секунду происходит три вещи:

  1. Речь в текст. Фреймворк Apple Speech конвертирует ваш голос в текст прямо на устройстве. Это происходит локально на вашем телефоне. Никакого сервера, никакого интернета для базового распознавания не нужно.
  2. Извлечение сущностей. NLP-парсер сканирует текст на предмет сумм, дат, ключевых слов категорий, названий счетов и упоминаний валют. Используется комбинация сопоставления паттернов и обученной модели NER (распознавания именованных сущностей).
  3. Умное кэширование. Если вы уже говорили что-то похожее раньше («coffee four fifty» в прошлый вторник, «coffee four dollars» сегодня), приложение запомнит категорию и счет с прошлого раза. Именно поэтому точность растет по мере использования. Кэш использует 85% порог схожести, поэтому небольшие вариации всё равно попадают в нужную категорию.

Парсер довольно хорошо справляется с неоднозначностью. Скажите «lunch twelve fifty» — он поймет $12.50, а не $1 250. Скажите «rent twelve fifty» — он поймет $1 250, потому что аренда редко стоит $12.50. Контекст важен, и движок использует эвристику на основе категорий для разрешения таких ситуаций.

Сложные случаи и необычные ситуации

Реальная жизнь — это не всегда «coffee four dollars». Вот как справляться с нестандартными ситуациями.

Разделение счета

Говорите сумму, которую заплатили вы, а не общий счет. "Ужин сорок пять долларов моя доля" записывает ваши $45, а не общую сумму группы. Добавьте заметку о разделении, если хотите контекст позже.

Чаевые включены или отдельно

Если хотите записать итог вместе с чаевыми, просто назовите финальную цифру. "Ужин шестьдесят два доллара с чаевыми" записывает $62. Если хотите отслеживать чаевые отдельно, сделайте две записи: "Dinner fifty dollars", затем "Tip twelve dollars".

Повторяющиеся расходы

Голосовой ввод не настраивает повторяющиеся записи автоматически. Для подписок записывайте их вручную, когда приходит списание. Или используйте ручной ввод для настройки регулярного учета. Голос лучше всего подходит для разовых записей в моменте.

Дробные суммы на разных языках

По-английски говорите «four fifty» или «four point five zero». В языках, где запятая используется как десятичный разделитель, приложение адаптируется к локали вашего устройства. Немецкие пользователи могут говорить «vier funfzig» естественно.

Фоновый шум

Фреймворк Apple Speech хорошо справляется с умеренным фоновым шумом. Разговоры в кофейне? Обычно не проблема. Громкая стройка? Могут быть искажения. В шумных местах держите телефон ближе ко рту или подождите более тихого момента. Качество распознавания заметно падает при уровне шума выше 70 дБ.

Советы для лучшей точности

  1. Называйте сумму первой или сразу после предмета. «Coffee four fifty» и «four fifty coffee» оба работают, но чем ближе сумма к названию предмета, тем больше контекста у парсера. «I had a really great coffee at that new place on Fifth Street four fifty» труднее разобрать, потому что сумма далеко от ключевого слова.
  2. Используйте круглые числа, когда возможно. «Twenty dollars» разбирается быстрее и точнее, чем «nineteen ninety-seven». Если нужна точность — будьте конкретны. Если округляете для скорости, парсер справляется с обоими вариантами.
  3. Говорите в нормальном темпе. Не нужно замедляться или четко проговаривать каждый слог. Движок обучен на естественной скорости разговора. Чрезмерная дикция иногда сбивает его с толку, потому что аудио-паттерны не совпадают с тренировочными данными.
  4. Держите команды до 10 слов. Короче — лучше. «Uber twelve dollars airport» работает отлично. Предложение из 25 слов с предысторией тоже сработает, но с большей вероятностью неправильной интерпретации.
  5. Проверяйте предпросмотр перед подтверждением. Приложение показывает, что оно разобрало, до сохранения. Взгляните на сумму и категорию. Занимает секунду и предотвращает накопление ошибок.

Частые ошибки, которых стоит избегать

Ошибка №1: не проверять категорию. Парсер хорош, но «Shell» может быть заправкой или кофейней. Всегда смотрите на автоматически присвоенную категорию. Исправив один раз, вы обучаете умный кэш на будущее.

Ошибка №2: ждать до конца дня. Голосовой учет лучше всего работает в моменте. Только что заплатили? Скажите сразу. Пакетная запись 8 расходов вечером теряет смысл. Вы забудете суммы, пропустите позиции и перепутаете, что и где купили.

Ошибка №3: бороться с парсером. Если он постоянно неправильно понимает что-то, не повторяйте ту же команду громче. Попробуйте перефразировать. Вместо «coffee at Starbucks four fifty» (где «at» может сбивать парсер) попробуйте «Starbucks coffee four fifty».

Ошибка №4: игнорировать умный кэш. Когда вы исправляете категорию, приложение запоминает. Но если никогда не исправлять, неправильная категория сохранится. Потратьте 30 секунд на исправление неверных категорий в первую неделю. После этого кэш будет правильно обрабатывать 85%+ записей самостоятельно.

Отслеживайте расходы голосом

Голосовой ввод, сканирование чеков, чат с ИИ. Всё бесплатно на iOS.

Загрузить в App Store