Як відстежувати витрати голосом (покроково)
Вводити "$4.50 coffee Starbucks" у застосунок — це приблизно 12 секунд на один запис. Сказати "кава чотири п'ятдесят Starbucks" — три секунди. За місяць щоденного обліку це дає близько 4 хвилин економії. Саме по собі — не революція. Але головна перевага не в швидкості. А в тому, що ви реально це робите. Чим швидше відчувається запис, тим менша ймовірність його пропустити.
- Голос у 3-4 рази швидший за ручне введення при записі повсякденних витрат
- NLP Money Vault витягує суму, категорію, дату й нотатки з однієї фрази
- Працює на 17 мовах і підтримує змішані команди (сума однією мовою, опис іншою)
- Покрито складні випадки: чайові, розподіл рахунку, іноземні валюти, минулі дати та перекази між рахунками
У цьому гайді
Як цей гайд робить голосовий облік надійним
Робочий процес тут завжди йде в одному порядку: коротка команда, сума біля назви покупки, а потім перевірка попереднього перегляду перед збереженням. Так голосовий облік залишається швидким і не перетворюється на здогадки.
- Одна команда — одна витрата, щоб парсер бачив чітку ціль.
- Тримайте суму поруч із назвою покупки для кращого розпізнавання.
- Підтвердіть попередній перегляд перед переходом до наступного запису.
Чому голос кращий за набір тексту
Найбільший ворог обліку витрат — не складність, а тертя. Кожне зайве натискання, кожен спадний список категорій, кожна секунда, яку ви витрачаєте на роздуми "то $4.50 чи $4.75?" — все це штовхає вас до думки "та й ладно". А коли пропустили один день, пропускаєте два. Потім тиждень. А потім дивитеся на банківську виписку і гадаєте: "що це за списання на 47 доларів?"
Голос прибирає більшість цього тертя. Ви не відкриваєте форму. Не обираєте категорію зі списку. Просто говорите. Застосунок робить решту.
Дослідження Pew 2024 року виявило, що 68% людей, які пробують ручний облік витрат, кидають це протягом 30 днів. Головна причина? "Занадто багато часу займає." Голосове введення скорочує цей час удвічі. Це не зробить облік витрат захоплюючим, але зробить його достатньо безболісним, щоб ви не кинули.
Як почати за 30 секунд
Ось як налаштувати Money Vault. Це коротко.
- Відкрийте застосунок. Натисніть кнопку мікрофона на головному екрані. Це велика кнопка внизу по центру.
- Надайте дозвіл на мікрофон. Тільки перший раз. iOS запитає. Натисніть "Дозволити". Розпізнавання мовлення відбувається прямо на пристрої через фреймворк Apple Speech, тому ваш аудіозапис не залишає телефон.
- Починайте говорити. Скажіть щось на кшталт "кава чотири п'ятдесят". Застосунок покаже, що він зрозумів: сума (4,50 грн), категорія (Їжа & напої), рахунок (за замовчуванням). Підтвердіть або відредагуйте.
Ось і все. Для базового обліку створення облікового запису не потрібне. Жодного туторіалу, який не можна пропустити. Жодного помічника налаштування, який займає 5 хвилин перед тим, як ви зможете записати першу витрату.
Базові голосові команди
NLP-движок Money Vault розуміє природну мову, а не жорсткі шаблони. Вам не потрібно запам'ятовувати конкретний синтаксис. Але ось патерни, які стабільно працюють:
Прості витрати
- "Кава чотири п'ятдесят" → 4,50 грн, категорія Їжа & напої
- "Uber дванадцять гривень" → 12,00 грн, категорія Транспорт
- "Продукти шістдесят три двадцять" → 63,20 грн, категорія Продукти
- "Абонемент у спортзал сорок гривень" → 40,00 грн, категорія Здоров'я & фітнес
З нотатками
- "Обід п'ятнадцять гривень в італійському" → 15,00 грн, Їжа & напої, нотатка: "в італійському"
- "Бензин сорок дві гривні Shell на трасі" → 42,00 грн, Транспорт, нотатка: "Shell на трасі"
З датами
- "Вчора таксі вісім гривень" → 8,00 грн, Транспорт, датовано вчорашнім днем
- "Минула п'ятниця вечеря дев'яносто гривень" → 90,00 грн, Їжа & напої, датовано минулою п'ятницею
Доходи
- "Дохід три тисячі п'ятсот" → запис доходу 3 500 грн
- "Оплата фрілансу вісімсот" → 800 грн, дохід
Не потрібно говорити "гривень" або назву валюти. Застосунок автоматично використовує вашу валюту за замовчуванням. Просто скажіть число. "Кава чотири п'ятдесят" працює так само, як "кава чотири гривні п'ятдесят копійок".
Просунуті команди
Коли освоїтеся з базовими командами, ці більш конкретні збережуть ще більше часу.
Перекази між рахунками
- "Переказ двісті гривень з гаманця на заощадження" → переміщує 200 грн між рахунками
- "Перемістити п'ятдесят з картки на готівку" → переказ між рахунками
Іноземні валюти
- "Кава три євро" → записує в EUR, конвертує у вашу основну валюту
- "Таксі п'ятсот єн" → записує в JPY за поточним курсом
- "Готель вісімдесят фунтів" → записує в GBP
Конкретні категорії
- "Розваги двадцять гривень Netflix" → 20,00 грн, категорія Розваги
- "Медичний огляд тридцять п'ять гривень" → 35,00 грн, категорія Здоров'я
Як працює NLP-движок
Коли ви говорите, приблизно за одну секунду відбуваються три речі:
- Перетворення мовлення в текст. Фреймворк Apple Speech перетворює ваш аудіозапис на текст прямо на пристрої. Сервер або інтернет для базового розпізнавання не потрібні.
- Витягування сутностей. NLP-парсер сканує текст на суми, дати, ключові слова категорій, назви рахунків та згадки валют. Використовується поєднання зіставлення шаблонів і навченої моделі NER (Named Entity Recognition — розпізнавання іменованих сутностей).
- Розумний кеш. Якщо ви раніше вже говорили щось подібне ("кава чотири п'ятдесят" минулого вівторка, "кава чотири гривні" сьогодні), застосунок запам'ятовує категорію й рахунок з попереднього разу. Саме тому точність зростає з часом. Кеш використовує 85% зіставлення схожості, тому незначні варіації все одно потрапляють у правильну категорію.
Парсер непогано справляється з неоднозначністю. Скажіть "обід дванадцять п'ятдесят" — він знає, що це 12,50 грн, а не 1 250 грн. Скажіть "оренда дванадцять п'ятдесят" — зрозуміє, що це 1 250 грн, бо оренда рідко коштує 12,50 грн. Контекст важливий, і движок використовує категоріальну евристику для вирішення таких неоднозначностей.
Складні випадки й незвичайні ситуації
Реальне життя не завжди "кава чотири гривні". Ось як поводитися з нестандартними ситуаціями.
Розподіл рахунку
Говоріть повну суму, яку ви заплатили, а не загальний рахунок. "Вечеря сорок п'ять гривень моя частка" записує ваші 45 грн, а не загальну суму групи. Якщо потрібен контекст пізніше, додайте нотатку про розподіл.
Чайові включені або окремо
Якщо хочете записати загальну суму разом із чайовими, просто скажіть фінальне число. "Вечеря шістдесят дві гривні з чайовими" записує 62 грн. Якщо хочете відстежувати чайові окремо, зробіть два записи: "Вечеря п'ятдесят гривень", а потім "Чайові дванадцять гривень."
Регулярні витрати
Голосове введення не налаштовує регулярні записи автоматично. Для підписок записуйте їх вручну, коли надходить списання. Або використовуйте ручне введення для налаштування регулярного відстеження. Голос найкраще підходить для разових, миттєвих записів.
Десяткові числа в різних мовах
Українською можна казати "чотири п'ятдесят" або "чотири кома п'ятдесят". Для мов, що використовують кому як десятковий роздільник, застосунок адаптується до локалі вашого пристрою.
Фоновий шум
Фреймворк Apple Speech добре справляється з помірним фоновим шумом. Гомін у кафе? Зазвичай нормально. Гучний будівельний майданчик? Можуть бути спотворені результати. У шумному середовищі тримайте телефон ближче до рота або зачекайте тихішого моменту. При фоновому шумі понад 70 дБ якість розпізнавання помітно погіршується.
Поради для кращої точності
- Говоріть суму першою або одразу після назви товару. "Кава чотири п'ятдесят" і "чотири п'ятдесят кава" — обидва варіанти працюють, але розміщення суми поруч із назвою дає парсеру більше контексту. "Я випив чудову каву в новому місці на П'ятій вулиці чотири п'ятдесят" важче розпізнати, бо сума далеко від ключового слова.
- Використовуйте круглі числа, коли можливо. "Двадцять гривень" розпізнається швидше й точніше, ніж "дев'ятнадцять дев'яносто сім". Якщо точність важлива — будьте конкретні. Якщо округлюєте для швидкості — парсер однаково добре впорається.
- Говоріть у нормальному темпі. Не потрібно сповільнюватись або вимовляти як робот. Движок навчено на природній швидкості розмовного мовлення. Надмірна артикуляція іноді збиває його, бо аудіо-патерни не збігаються з тренувальними даними.
- Тримайте команди в межах 10 слів. Коротше — краще. "Uber дванадцять гривень аеропорт" — чудово. Речення з 25 слів і передісторією теж спрацює, але шанс неправильного трактування вищий.
- Перевіряйте попередній перегляд перед підтвердженням. Застосунок показує, що розпізнав, ще до збереження. Побіжно перевірте суму й категорію. Це займає секунду й запобігає накопиченню помилок протягом тижнів.
Поширені помилки, яких варто уникати
Помилка №1: Не перевіряти категорію. Парсер хороший, але "Shell" може означати АЗС або кафе. Завжди перевіряйте автоматично призначену категорію. Одне виправлення навчає розумний кеш для наступного разу.
Помилка №2: Чекати до кінця дня. Голосовий облік найкраще працює в момент витрати. Щойно заплатили — одразу скажіть. Пакетний запис 8 витрат увечері нівелює всю мету. Ви забудете суми, пропустите деякі позиції й переплутаєте, де що купили.
Помилка №3: Боротися з парсером. Якщо він постійно щось розуміє неправильно — не повторюйте ту саму команду голосніше. Спробуйте переформулювати. Замість "кава у Starbucks чотири п'ятдесят" (де "у" може збивати парсер) спробуйте "Starbucks кава чотири п'ятдесят".
Помилка №4: Ігнорувати розумний кеш. Коли ви виправляєте категорію — застосунок запам'ятовує. Але якщо ніколи не виправляти — неправильна категорія закріпиться. Витратьте 30 секунд на виправлення неправильно призначених категорій у перший тиждень. Після цього кеш самостійно коректно оброблятиме понад 85% записів.