Пустышка под капотом: как ИИ-сервисы зарабатывают на незнании архитектуры нейросетей и спасает ли модульность
ИИ-юрист за 990 руб/мес. Анализирует договоры, находит статьи закона, составляет документы. Такие предложения есть и в Telegram-ботах, и на отдельных сайтах.
Звучит как будущее. Но если разобраться, как устроены эти сервисы изнутри, становится понятно: либо цена врёт, либо качество.
Дальше - конкретные цифры.
Три понятия, без которых не разобраться
Токен - единица текста, которую обрабатывает ИИ. Для русского языка один токен, примерно, 2-3 символа. Слово «договор» - это 3-4 токена. Всё, что ИИ читает и пишет, измеряется в токенах.
Обмен - одно сообщение пользователя плюс один ответ агента. Задал вопрос, получил ответ - один обмен.
API - программный интерфейс. Когда вы пользуетесь ИИ через браузер - вы общаетесь с моделью напрямую. Когда компания строит свой сервис - она подключается к модели через API. Разница, примерно, как между тем, чтобы самому ездить на такси, и тем, чтобы запустить таксопарк: механика одна, экономика - совершенно другая.
Что происходит, когда юрист задаёт вопрос
Со стороны просто: написал - получил ответ. Но под капотом происходит гораздо больше.
ИИ-модель сама по себе - не юрист. Без специальных правил она будет уверенно называть несуществующие статьи закона, путать подсудность и ссылаться на отменённые нормы. Это не баг - это стандартное поведение любой языковой модели без инструкций.
Чтобы модель работала как юрист, ей нужен агент - набор правил, протоколов и чек-листов, в нем также должна быть учтена механика работы самой LLM: ее границы и пограничные состояния, без этого агент не будет работать правильно. Это важно понимать. Вот из чего состоит реальный юридический агент (конкретный пример – мой агент по российскому праву на базе Claude):
Маршрутизатор (главный файл агента) определяет, какая отрасль права нужна - около 2 700 токенов. Базовые правила (другой файл агента) задают протоколы поиска, проверку актуальности норм, градацию надёжности - около 8 000 токенов. Дальше – чек-лист: обязательная проверка перед каждым ответом (всё ли указано, нет ли ошибок), ещё 2 600 токенов. И отраслевой файл со спецификой конкретной области - 1 800 токенов. Итого: около 15 100 токенов правил. Каждый запрос.
Зачем всё это? Без маршрутизатора модель не поймёт, что вопрос про увольнение - это трудовое право, а не гражданское. Без базовых правил она не станет проверять актуальность статей, а «вспомнит» что-то из обучения - возможно, устаревшее. Без чек-листа пропустит предупреждения о сроках давности или подсудности.
Теперь добавим то, что приходит от самого юриста. Договор на 8 страниц - около 5 800 токенов. Вопрос юриста - около 350 токенов. История предыдущих сообщений - около 800 токенов. Итого от юриста: около 6 900 токенов.
Ещё один скрытый расход - результаты поиска. Агент обязан проверять актуальность каждой нормы. 2-3 поисковых запроса за обмен, каждый возвращает результаты, которые тоже нужно «прочитать» - ещё около 10 000 токенов.
Ответ агента - развёрнутый юридический анализ с нормами и рекомендациями: около 3 500 токенов. Плюс внутренние рассуждения модели (она выстраивает логику ответа перед тем, как его написать): ещё около 5 000 токенов. Они тоже оплачиваются.
Один обмен в сумме: входящие (правила + документ + вопрос + история + поиск) - около 32 000 токенов, исходящие (ответ + рассуждения) - около 8 500 токенов. Всего за один обмен - около 40 500 токенов.
Сколько обменов в рабочий день
Компания Clio ежегодно публикует исследование юридической отрасли - Legal Trends Report. По данным за 2025 год: средний utilization rate (доля рабочего дня на оплачиваемую профессиональную работу) составляет 38% - около 3 ч из восьми.
Не все 3 ч юрист проведёт в диалоге с ИИ. Часть времени - встречи, переговоры, суд. Консервативная оценка: 1,5-2 ч активной работы с агентом в день. Да, исследование Clio - про США. Российских данных нет. Но порядок цифр вряд ли сильно отличается. При среднем времени на один обмен около 4-5 мин - примерно 25 обменов в день.
25 обменов в день, 22 рабочих дня = 550 обменов в месяц.
Считаем деньги
Цены Claude API на март 2026 года (за миллион токенов).
Opus 4.6 - флагман, лучшая точность и сложные рассуждения: $5 за входящие, $25 за исходящие. Sonnet 4.6 - средний класс, хороший баланс цена/качество: $3 за входящие, $15 за исходящие. Haiku 4.5 - бюджетный, быстрый, но менее точный: $1 за входящие, $5 за исходящие.
Курс доллара ЦБ РФ на середину марта 2026 - около 80 рублей.
Считаем на Opus 4.6, без оптимизаций.
550 обменов по 32 000 входящих = 17 600 000 входящих токенов в месяц. 550 обменов по 8 500 исходящих = 4 675 000 исходящих токенов в месяц.
Входящие: 17,6 млн токенов по $5 за миллион = $88, то есть 7 040 рублей. Исходящие: 4,675 млн токенов по $25 за миллион = $117, то есть 9 360 рублей.
Итого API: $205, то есть 16 400 рублей в месяц.
Это чистая себестоимость токенов для одного юриста на лучшей модели. Без разработки, серверов, поддержки и прибыли компании.
Если взять модель подешевле: Sonnet 4.6 - около 9 800 рублей в месяц, примерно 18 рублей за обмен. Haiku 4.5 - около 3 300 рублей в месяц, примерно 6 рублей за обмен.
Haiku в 5 раз дешевле. Но это не та же модель в компактном корпусе - это принципиально другой уровень рассуждений. Разница между Opus и Haiku в юридическом контексте примерно как между опытным юристом и стажёром, который вчера прочитал учебник: стажёр знает термины, но не понимает нюансов. Для простых справок - достаточно. Для анализа сложного договора с пересечением отраслей - опасно. Поэтому для юридической работы - только Opus.
Кэширование: экономия, которая работает не всегда
Правила агента одинаковые в каждом запросе - можно закэшировать и сэкономить 90%? Нет. Вот почему.
Первый запрос - запись в кэш, стоит на 25% дороже обычного. Все следующие, пока кэш живой - чтение, стоит 10% от обычной цены.
Ключевое ограничение: кэш живёт 5 минут. Каждый новый запрос продлевает его ещё на 5 минут. Юрист непрерывно работает - кэш живёт и экономит. Отвлёкся на звонок на 6 минут - кэш умер, следующий запрос снова полная цена плюс 25% за запись. Но можно реализовать через Keep-alive пинг кэша (Бекэнд системы автоматически отправляет в API пустой или минимальный запрос каждые 4.5 минуты, продлевая жизнь) - это даст экономию порядка $20 в месяц.
Также можно снизить себестоимость за счет гибридной маршрутизации, т.е. какие-то простые запросы, например. Определение отрасли права, можно поручить более дешевой модели (API это позволяет, в отличии от Pro). Но оператор (юрист) должен сам в каждом случае уметь определять надо ли переключаться для данной задачи на менее умную модель. Поэтому тут экономия – спорный вопрос.
Есть часовой кэш - живёт 60 минут, но запись стоит в 2 раза дороже. Для юриста, который чередует работу с ИИ и другие задачи, может быть выгоднее.
И ещё: кэшируются только правила агента - те самые 15 100 токенов, которые одинаковы в каждом запросе. Документ, вопрос, результаты поиска, история - всегда по полной цене. Кэш экономит только на 47% входящих токенов. Остальные 53% - некэшируемые.
Реальная экономия при типичной работе (5 сессий в день по 5 обменов): счёт снижается с $205 до $177 в месяц. Это 14%, а не 90%.
Модульность - зачем она нужна
Юридический агент устроен модульно. Есть базовые правила (нужны всегда) и отраслевые файлы: гражданское, трудовое, уголовное, арбитраж и так далее. Если загрузить всё сразу - модель получит около 52 000 токенов правил вместо 15 000. Это в 3,5 раза дороже на входящих токенах. И что важнее - очень сильно размывает внимание модели.
В браузерной подписке Claude (Pro) файлы агента лежат отдельно от диалога. Модель видит только маршрутизатор - около 2 700 токенов. Когда юрист задаёт вопрос, модель сама определяет: «Это трудовой спор - мне нужен файл по трудовому праву». И читает только его. Остальные отрасли лежат рядом, но не загружаются. Экономия токенов плюс точность: модель работает с компактным набором правил, а не пытается удержать в голове все отрасли одновременно.
С октября 2025 года Anthropic добавила в API поддержку Skills - тот же механизм. Разработчик загружает агента как навык, и модель через API получает доступ к файловой системе. Но есть разница: в API на один запрос можно подключить максимум 8 навыков, в Pro такого жёсткого лимита нет. Плюс для работы Skills через API нужна вычислительная среда - дополнительные $0,05 в час.
А если строить без Skills, «по-старому»? Неприятный выбор: либо загружать все файлы в каждый запрос (дорого и неточно), либо самому писать логику маршрутизации. Но чтобы понять, какие отрасли затронуты, нужно сначала прочитать документ. А чтобы прочитать документ правильно, нужны правила агента. Замкнутый круг.
Модульная архитектура - не «красивая упаковка», а инженерная необходимость. Без неё либо дороже, либо хуже.
Длинные диалоги - невидимый враг точности
Есть проблема, которую кэш не решает. И которую вообще не видно в ценах на токены.
По мере роста диалога накапливается история переписки. На первом вопросе правила агента занимают около 47% входящих токенов. На десятом вопросе история выросла, и правила занимают уже меньшую долю контекста.
Модель продолжает видеть правила. Но её внимание распределяется по всему объёму текста. Это хорошо изученный феномен: исследование группы Стэнфордского университета «Lost in the Middle» (2023) показало, что языковые модели хуже работают с информацией в середине длинного контекста. Правила, которые были в начале, постепенно теряют влияние.
В юридических вопросах это конкретно: на пятнадцатом вопросе в одном диалоге модель может «забыть» проверить актуальность нормы или пропустить чек-лист. Не потому что правила исчезли - потому что утонули в объёме.
Правильный подход: каждая задача - отдельный диалог. Анализ договора - один. Составление иска - другой. Консультация по вопросу - третий. Так правила агента всегда занимают значительную часть контекста.
Это увеличивает расходы: в каждом новом диалоге правила загружаются заново. Но альтернатива - экономия на токенах ценой точности - в юридических вопросах неприемлема.
Сколько должна стоить подписка
Себестоимость одного юриста на Opus 4.6: токены API (без кэша) - около 16 400 рублей (с учетом оптимизации можно снизить до 12500 руб), вычислительная среда для работы с файлами - около 180 рублей. Итого себестоимость API: около 12 700 рублей в месяц.
Это чистый API. К нему нужно добавить разработку и поддержку сервиса, обновление агента при нововведениях со стороны разработчиков модели, техническую поддержку, прибыль.
При стандартном для SaaS-продуктов коэффициенте (себестоимость умножить на 2) минимальная подписка на юридического ИИ-агента на Opus - от 25 000 рублей в месяц.
И это я привел стоимость для средних задач. Для больших, серьезных – требуется декомпозиция (распределение ролей и назначение цифровых сотрудников), расходы увеличатся раза в 2 как минимум. Представляете, сколько должна стоить месячная подписка?
Что значит «дешёвый ИИ-юрист»
Когда предлагают ИИ-юриста за 990 или 2 000 рублей в месяц, объяснений ровно четыре.
Первое - слабая модель. Вместо флагмана используется бюджетная. Она дешевле в 5 раз, но и рассуждает проще. Для вопроса «какой срок исковой давности по договору поставки» - справится. Для «проанализируй этот договор, найди все риски для заказчика, проверь соответствие 44-ФЗ» - начнёт пропускать нюансы.
Второе - нет правил агента. Самый распространённый способ экономии. 15 000 токенов правил загружаются в каждый запрос - это около 25% всех входящих. Убери их - себестоимость снижается. Но модель без правил - это модель без чек-листа, без протокола проверки норм, без обязательного поиска актуальных редакций. Она просто «вспоминает» право из данных обучения. А данные обучения - это интернет со всеми его ошибками и устаревшими текстами.
Третье - жёсткие лимиты. 10 вопросов в день. Или 100 в месяц. При нормативных 550 обменах это 18% от полноценного инструмента. Остальные 82% времени юрист работает по-старому.
Четвёртое - убыточная модель. Стартапы иногда осознанно продают ниже себестоимости ради базы пользователей. Это работает ровно до тех пор, пока не закончатся инвестиции. Дальше - либо цены вырастут в разы, либо сервис закроется.
Ни один из этих вариантов не даёт полноценного юридического инструмента за заявленную цену.
Это касается не только юристов
Медицинские консультации - агент должен знать протоколы диагностики, лекарственные взаимодействия, актуальные рекомендации. Объём правил не меньше, требования к точности - выше.
Финансовое консультирование - налоговое право, инвестиционные ограничения, валютное регулирование. Правила меняются ещё чаще, стоимость ошибки - прямые финансовые потери.
Инженерные расчёты - строительные нормы, допуски, требования безопасности. Здесь ошибка - не штраф. Здесь ошибка - риск для жизни.
Принцип один: чем выше стоимость ошибки - тем дороже инструмент, который ошибается редко. Это не маркетинг. Это арифметика.


