如何扫描收据并自动分类支出
我有一个鞋盒,就放在桌子底下。里面塞了大约 200 张过去半年的收据,正在慢慢褪色到看不清。如果你也有同感,你已经知道问题所在了。收据堆积如山,因为整理它们的工作量比放着不管的后果更让人崩溃——直到报税季来临。收据扫描应用就是为了解决这个问题而存在的,好的应用不仅仅是捕获文字,还能帮你搞清楚买了什么并自动归档。
- Money Vault 在设备上扫描收据,使用 Apple Vision。无需上传云端,无需联网。
- 自动分类根据商户名称和商品明细将每张收据分配到正确的消费类别
- 支持 50+ 种货币和国际收据格式(日期、小数点、商户样式)
- 收据褪色了?使用闪光灯,把纸压平,尽量在 48 小时内扫描
本指南如何保持扫描准确
本指南中的扫描流程有意保持固定顺序:先把收据压平,再完整拍摄,然后在保存前检查提取的总金额和类别。这样既保证速度,又能及早发现 OCR 错误。
- 趁收据还能看清时扫描,不要等几周后再扫。
- 先检查总金额和商户名称,有需要时再看明细。
- 纠正一次错误的扫描结果,智能缓存就能改善下一次的识别。
为什么扫描比手动输入更好
手动输入意味着看着收据、输入金额、选择类别、添加日期,可能还要写个备注。即使动作快,每张收据也要 30-45 秒。周末出行的 5 张收据?将近 4 分钟的数据录入。大多数人根本不会去做。
扫描每张收据只需约 5 秒。对准手机、点击拍摄、确认结果。应用自动提取总金额、日期、商户名称和单项明细。你花时间确认,而不是打字。
但扫描的真正价值不仅仅是速度,更是准确性。当你凭记忆输入"$42.50"时,实际数字可能是 $42.05、$43.50,或者那只是小计而不是含税总额。收据上有真实的数字,让摄像头来读就好。
如何扫描收据(分步)
以下是 Money Vault 中的操作流程,总共大约需要 10 秒。
- 打开应用并点击相机图标。它在主屏幕上,就在语音按钮旁边。首次使用时,需要授予相机权限。标准的 iOS 对话框。
- 放好收据。把收据放在平坦的深色表面上。手机与收据保持平行,不要倾斜。确保整张收据都在画面内。不需要完美裁剪,应用会自动找到边缘。
- 点击拍摄。点一下就好。OCR 引擎(Apple Vision,在你的手机上本地运行)大约一秒钟就能读取文字。
- 查看解析数据。应用会展示识别结果:总金额、日期、商户名称,以及检测到的逐项明细。每个字段都可以编辑。点击有误的内容直接修改。
- 确认并保存。支出会以自动分配的类别和你的默认账户记录下来。完成。
一切都在你的设备上完成。收据图片、OCR 处理、分类——什么都不会上传到任何地方。如果你扫描的是医疗收据或私人内容,这一点非常重要。
自动分类如何工作
OCR 从收据中提取文字后,分类引擎开始工作。它分两遍处理。
第一遍:商户匹配。应用将商户名称与已知商家数据库进行比对。"Whole Foods"归为食品杂货。"Shell"归为交通。"CVS"归为健康。这种方式能识别约 70% 来自知名连锁店的收据。
第二遍:关键词分析。对于未知商户或"便利店""市场 #7"之类的通用名称,引擎会查看商品明细。如果看到"牛奶""面包""鸡蛋",那就是食品杂货。如果看到"布洛芬"和"绷带",那就是健康。这第二遍能识别大部分商户匹配漏掉的内容。
当两遍都不够确定时,应用会分配最可能的类别并标记待审核。你会在支出上看到一个小标识。点击即可更改类别,智能缓存会记住你的选择,下次自动使用。
在使用的第一周纠正分类错误的收据。智能缓存使用 85% 的相似度匹配,所以修改一次"街角市场",类似的交易("街角市场 #2""街角市场超市")以后也会自动分到正确的类别。
处理多项目收据
一张有 25 个商品的超市收据比一张只有一行的咖啡店收据复杂得多。以下是 Money Vault 的处理方式。
OCR 会逐行读取每个商品。每一项都会提取出单独的金额。你可以做三件事:
- 只记录总额。最常用的方式。收据总额变成一条支出记录。简单快捷。
- 按类别拆分。如果你在同一家店买了食品杂货和清洁用品,可以把不同商品分配到不同类别。点击单个商品即可重新分类。
- 记录单个商品。如果要详细追踪,每个商品都可以成为独立的支出记录。对大多数人来说有点过度,但如果你想精确到单品来追踪食物预算,会很有用。
长收据(Costco 那种 40 个商品的)处理起来会多花几秒。解析器可以处理,但如果扫描没拍到全长,非常长收据底部的商品有时会被截断。遇到这种情况,拍照时站远一点,让整张收据都在一张照片里。
处理模糊收据
热敏纸(大多数商店打印收据用的那种亮面纸)从打印当天就开始褪色。热量会加速这个过程。钱包里的体温、仪表盘上的阳光,甚至口袋里的温度都会让它褪色。我见过的收据在热车里放三周就完全变白了。
遇到褪色的收据,放弃之前试试这些方法:
- 手动打开闪光灯。即使在明亮的房间里,LED 闪光灯也能增加对比度,帮助 OCR 识别模糊文字。效果比你想象的要好。
- 尝试不同角度。热敏纸有时在微微倾斜的角度下反光效果更好。把收据倾斜 10-15 度再试试。
- 深色背景在这里更重要。褪色的白色收据放在白色桌子上,OCR 几乎看不到。放在深色的东西上面,比如黑色笔记本或深色桌面。
说实话:如果收据已经放了 4-5 个月以上并且存放在高温环境中,即使最好的扫描仪也很难识别。文字从物理上已经不存在了。购买后 48 小时内扫描收据——这是你能做的最有效的一件事。
海外收据
Money Vault 支持 50+ 种货币,并从收据本身自动检测货币。关于工作原理,以下几点需要了解:
日期格式。美国收据显示 MM/DD/YYYY。欧洲大部分国家使用 DD/MM/YYYY。日本使用 YYYY/MM/DD。解析器会根据你的设备语言和货币上下文来判断收据使用的是哪种格式。如果收据是欧元的,4 月 3 日不会被误认为 3 月 4 日。
小数分隔符。在美国,"42.50"表示四十二美元五十美分。在德国,"42,50"表示同样的金额。OCR 引擎会根据检测到的货币正确读取两种格式。
非拉丁字符。日语、韩语、中文、阿拉伯语和其他文字的收据也会进行 OCR 处理。非拉丁文字的商户名称提取可靠性较低(Apple Vision 对拉丁字符效果最好),但金额和日期仍然能准确解析。
汇率。当你扫描外币收据时,应用会记录原始金额,并按当前汇率转换为你的基础货币。你可以在交易详情中同时查看两种金额。
提升扫描效果的 7 个技巧
- 把收据压平。皱褶会产生阴影,OCR 会把阴影误读为字符。花两秒把收据按在桌上压平,能省下十秒的修改时间。
- 好的光线比好的相机更重要。光线充足的情况下,5 年前的旧 iPhone 扫描效果也比最新 Pro Max 在昏暗环境下好。自然日光是最理想的。晚上时打开头顶灯,保持文字上没有阴影。
- 底下放深色表面。白色收据放在白色桌子上?应用找不到边缘。用黑色笔记本、深色桌面,甚至平放一个深色手机壳。对比度有助于边缘检测。
- 一张照片,整张收据。不要分两次拍长收据。拼接会在图片重叠处产生错误。退后一步,一次拍完。手机相机有足够的分辨率,后期裁剪不会影响 OCR 质量。
- 48 小时内扫描。热敏纸从打印那一刻就开始退化。越早扫描,文字越清晰。养成习惯:付款、扫描、收好。
- 永远检查总额。即使准确率很高,大约每 20 次扫描中有 1 次会有轻微偏差。确认前瞄一眼总额。两秒的检查能避免一个月的累积误差。
- 对褪色的纸张使用闪光灯。在明亮的房间里手动开闪光灯能增加对比度,捕捉褪色的文字。这是对旧收据最有效的技巧。
常见问题与修复
问题:提取的总额错误。收据显示 $42.50,但应用解析出 $4.25 或 $425.00。这通常发生在小数点褪色或总额行与其他数字没有明确分隔时。修复方法:直接编辑金额。智能缓存会从修改中学习。
问题:类别看起来随机。商户名称未被识别,商品明细也没有提供足够的上下文。修复方法:手动更改类别。对同一商户操作几次后,缓存就会记住。
问题:日期错误。通常是格式混淆(03/04 被读成 3 月 4 日而非 4 月 3 日)。修复方法:点击日期字段进行更正。应用会根据你的更正和语言设置调整格式检测。
问题:长收据被截断。底部的商品缺失,因为扫描没有拍到全长。修复方法:退远一些重新拍照。或者直接手动编辑总额,跳过该收据的逐项追踪。