Как компьютер научился связывать один платеж с несколькими накладными

Максим Наговицын29.04.20262367

Бухгалтерские программы часто ошибаются именно там, где клиент заплатил одной суммой за несколько поставок.

Как компьютер научился связывать один платеж с несколькими накладными
Графовая модель учитывает всю сеть операций и лучше находит сложные сопоставления платежей и счетов. Источник иллюстрации: нейросеть

Сверка банковских выписок — дело необходимое для любой компании, но очень нудное. Бухгалтеру нужно вручную сопоставить каждую строчку из выписки банка с выставленным счетом. В крупных фирмах, где таких записей тысячи, эта работа съедает уйму времени. Поэтому многие используют автоматические программы-помощники. Они сами предлагают, какие записи скорее всего подходят друг другу, а человек их просто подтверждает. С простыми случаями, когда один платеж покрывает один счет, такие программы справляются хорошо. Но как только дело доходит до ситуации «один платеж — несколько счетов» — например, клиент заплатил одной суммой сразу за три поставки, — надежность этих инструментов резко падает.

Австралийские исследователи опубликовали в научном журнале The Journal of Finance and Data Science новую работу. Они попробовали применить особый метод — графовое обучение — чтобы улучшить подсказки при сверке. Суть в том, чтобы не рассматривать каждую транзакцию по отдельности. Вместо этого можно построить огромную схему всей бухгалтерской книги компании. Там каждая историческая запись становится отдельной точкой — узелком на графе, а то, как эта запись сопоставилась с другой, становится связью-ребром между узелками. Получается сетка, похожая на карту метро. Когда поступает новая запись, вы добавляете ее в этот граф, превращаете в набор чисел — специальные «отпечатки» (их называют эмбеддингами), а потом скармливаете обычной обучаемой программе, которая для каждой пары записей оценивает, насколько они подходят друг другу.

Руководитель исследования Джастин Муньос объясняет:

Вместо того чтобы разбираться с каждой операцией отдельно, мы используем всю сеть бухгалтерских записей целиком.

Метод проверили на реальных данных — три года ежедневной бухгалтерии. Новый подход заметно превзошел стандартные промышленные образцы. Самое большое улучшение — именно на сложных случаях «один ко многим». Ученые считают, что успех получился потому, что их „отпечатки“ улавливают и то, как устроена бухгалтерская сеть, и сами смыслы внутри каждой операции.

Для бухгалтерии важна не только точность, но и стабильность предсказаний от запуска к запуску. Источник иллюстрации: нейросеть
Для бухгалтерии важна не только точность, но и стабильность предсказаний от запуска к запуску. Источник иллюстрации: нейросеть

Кроме того, оказалось, что графовые модели дают гораздо более стабильные предсказания, чем другие методы, например популярная языковая модель от Google под названием BERT. Тут важно пояснить, что такое «нестабильность предсказания». Представьте: вы переобучаете одну и ту же модель несколько раз с одними и теми же данными. если каждый раз ее точность скачет туда-сюда — это плохо. В финансах и бухгалтерии на такую „нервную“ систему полагаться опасно.

Муньос добавляет:

В таких ответственных областях, как финансы и учет, стабильность так же важна, как и точность. Наши результаты показывают перспективное направление для бухгалтерских программ. Такие инструменты бухгалтеры смогут использовать каждый день — и доверие к ним будет выше, и надежность.

Анализ стоимости и доступности

С ходу кажется, что графовые методы — штука для богатых корпораций. Но на самом деле библиотеки для работы с графами вроде PyTorch Geometric или DGL бесплатны. Обучать небольшую графовую модель пару часов можно на обычном игровом компьютере с видеокартой тысяч за пятьдесят рублей (или взять облачный сервер с оплатой по часам). Авторы использовали три года реальных данных — но это уже было у компании, ничего специально докупать не пришлось. Дорогая часть — нанять специалиста, который умеет готовить графы и настраивать модели. Такие пока редкость. Для маленькой фирмы с тысячью накладных в месяц это пока избыточно. А вот средний бизнес или бухгалтерский аутсорс вполне могут потихоньку внедрять — через год-два такие модули, скорее всего, появятся в облачных сервисах за умеренную плату.

Чем было до этого

Автоматические сверки спотыкались именно на наборе «один платеж на несколько счетов». Существовали костыли — например, учить модель искать сумму, близкую к платежу, или требовать от клиента ручной группировки. Но никто не додумался смотреть на всю историю взаимосвязей как на сеть. Работа австралийцев — не переворот в науке, но очень полезный и практичный шаг вперед в узкой задаче. Они не изобрели графы (их уже используют в рекомендациях на маркетплейсах), а впервые аккуратно применили к бухгалтерской сверке и получили заметное улучшение именно на слабом месте.

Когда каждый сможет попробовать

Прямо сейчас скачать готовую кнопку «Сверить одним кликом» для Excel не получится. Исследователи не выложили открытое приложение, только научную статью. Но они обещают выложить код на Github. Если вы умеете запускать питоновские скрипты, через 6–8 месяцев сможете поиграть. Для обычного человека — бухгалтера или директора — появятся готовые решения примерно через год-полтора, когда какой-нибудь сервис типа QuickBooks или Контур встроит графовый модуль. Можно отслеживать обновления: как только в анонсах сверки появятся слова „множественные сопоставления“ или „умные связки“ — скорее всего, это оно.

Графовая сверка становится практичным инструментом для поэтапной автоматизации учета в реальном бизнесе. Источник иллюстрации: нейросеть
Графовая сверка становится практичным инструментом для поэтапной автоматизации учета в реальном бизнесе. Источник иллюстрации: нейросеть

Сравнение с аналогами

Главный промышленный аналог сейчас — обычные модели близости, например k-ближайших соседей, или BERT, который ученые тоже проверяли. Вот как они себя ведут:

  • Обычные модели близости: простые, быстрые, работают бесплатно. Но на сопоставлении 1 платежа с 4 счетами — падают, точность около 40–50%.
  • BERT (языковая модель): лучше улавливает смысл назначений платежа, чем соседи. Но очень нестабилен — переобучишь на тех же данных, и точность скачет на 20%. И требует мощных серверов.
  • Новый графовый метод (GNN): точность выше всех на сложных случаях, стабильность высочайшая. Но надо уметь строить граф истории (это не всегда удобно) и учить модель дольше — часы вместо минут.

Критика и главный подвох

Исследователи проверяли свой метод на данных одной компании. Очень хочется верить, что графовая магия сработает везде, но практика показывает: бухгалтерские записи у всех разные. У кого-то счета выставлены вчера, а оплата пришла послезавтра, у кого-то постоянные возвраты и корректировки, у кого-то нулевые счета. если натренировать граф на аккуратной фирме с четкой историей — он будет бесполезен в бардаке. Главный подвох: метод предполагает, что у вас уже есть размеченная история правильных сопоставлений. А если бизнес новый или раньше сверяли вручную и постоянно ошибались? Тогда граф будет учиться на плохих примерах и строить красивые, но неверные связи. На деле перед таким графовым обучением придется полгода чистить историю — а это стоит денег и времени, которые могут перевесить выгоду от автоматизации.

Ранее мы опубликовали 10 инноваций в финтехе.

Подписаться: Телеграм | Дзен | Вконтакте


Экономика

GigaChat Ultra, Vibe Coding, ИИ-часы и оценка тестов: обзор новых подходов к ИИ
GigaChat Ultra, Vibe Coding, ИИ-часы и оценка тестов: обзор новых подходов к ИИ

Крупнейшие игроки российского финансового рынка — Сбер, Альфа-Банк, Совкомбанк и Т-Технологии — почти синхронно объявили о системных изменениях в подходах к использованию искусственного интеллекта.

24.03.20266041

Лента новостей

Пресс-релизы