Серия «ИИ-агенты для бизнеса и бытовых нужд»

0 просмотренных постов скрыто

tech2025

Бизнес

Пустышка под капотом: как ИИ-сервисы зарабатывают на незнании архитектуры нейросетей и спасает ли модульность⁠⁠

Серия ИИ-агенты для бизнеса и бытовых нужд

15 часов назад

Пустышка под капотом: как ИИ-сервисы зарабатывают на незнании архитектуры нейросетей и спасает ли модульность

ИИ-юрист за 990 руб/мес. Анализирует договоры, находит статьи закона, составляет документы. Такие предложения есть и в Telegram-ботах, и на отдельных сайтах.

Звучит как будущее. Но если разобраться, как устроены эти сервисы изнутри, становится понятно: либо цена врёт, либо качество.

Дальше - конкретные цифры.

Три понятия, без которых не разобраться

Токен - единица текста, которую обрабатывает ИИ. Для русского языка один токен, примерно, 2-3 символа. Слово «договор» - это 3-4 токена. Всё, что ИИ читает и пишет, измеряется в токенах.

Обмен - одно сообщение пользователя плюс один ответ агента. Задал вопрос, получил ответ - один обмен.

API - программный интерфейс. Когда вы пользуетесь ИИ через браузер - вы общаетесь с моделью напрямую. Когда компания строит свой сервис - она подключается к модели через API. Разница, примерно, как между тем, чтобы самому ездить на такси, и тем, чтобы запустить таксопарк: механика одна, экономика - совершенно другая.

Что происходит, когда юрист задаёт вопрос

Со стороны просто: написал - получил ответ. Но под капотом происходит гораздо больше.

ИИ-модель сама по себе - не юрист. Без специальных правил она будет уверенно называть несуществующие статьи закона, путать подсудность и ссылаться на отменённые нормы. Это не баг - это стандартное поведение любой языковой модели без инструкций.

Чтобы модель работала как юрист, ей нужен агент - набор правил, протоколов и чек-листов, в нем также должна быть учтена механика работы самой LLM: ее границы и пограничные состояния, без этого агент не будет работать правильно. Это важно понимать. Вот из чего состоит реальный юридический агент (конкретный пример – мой агент по российскому праву на базе Claude):

Маршрутизатор (главный файл агента) определяет, какая отрасль права нужна - около 2 700 токенов. Базовые правила (другой файл агента) задают протоколы поиска, проверку актуальности норм, градацию надёжности - около 8 000 токенов. Дальше – чек-лист: обязательная проверка перед каждым ответом (всё ли указано, нет ли ошибок), ещё 2 600 токенов. И отраслевой файл со спецификой конкретной области - 1 800 токенов. Итого: около 15 100 токенов правил. Каждый запрос.

Зачем всё это? Без маршрутизатора модель не поймёт, что вопрос про увольнение - это трудовое право, а не гражданское. Без базовых правил она не станет проверять актуальность статей, а «вспомнит» что-то из обучения - возможно, устаревшее. Без чек-листа пропустит предупреждения о сроках давности или подсудности.

Теперь добавим то, что приходит от самого юриста. Договор на 8 страниц - около 5 800 токенов. Вопрос юриста - около 350 токенов. История предыдущих сообщений - около 800 токенов. Итого от юриста: около 6 900 токенов.

Ещё один скрытый расход - результаты поиска. Агент обязан проверять актуальность каждой нормы. 2-3 поисковых запроса за обмен, каждый возвращает результаты, которые тоже нужно «прочитать» - ещё около 10 000 токенов.

Ответ агента - развёрнутый юридический анализ с нормами и рекомендациями: около 3 500 токенов. Плюс внутренние рассуждения модели (она выстраивает логику ответа перед тем, как его написать): ещё около 5 000 токенов. Они тоже оплачиваются.

Один обмен в сумме: входящие (правила + документ + вопрос + история + поиск) - около 32 000 токенов, исходящие (ответ + рассуждения) - около 8 500 токенов. Всего за один обмен - около 40 500 токенов.

Сколько обменов в рабочий день

Компания Clio ежегодно публикует исследование юридической отрасли - Legal Trends Report. По данным за 2025 год: средний utilization rate (доля рабочего дня на оплачиваемую профессиональную работу) составляет 38% - около 3 ч из восьми.

Не все 3 ч юрист проведёт в диалоге с ИИ. Часть времени - встречи, переговоры, суд. Консервативная оценка: 1,5-2 ч активной работы с агентом в день. Да, исследование Clio - про США. Российских данных нет. Но порядок цифр вряд ли сильно отличается. При среднем времени на один обмен около 4-5 мин - примерно 25 обменов в день.

25 обменов в день, 22 рабочих дня = 550 обменов в месяц.

Считаем деньги

Цены Claude API на март 2026 года (за миллион токенов).

Opus 4.6 - флагман, лучшая точность и сложные рассуждения: $5 за входящие, $25 за исходящие. Sonnet 4.6 - средний класс, хороший баланс цена/качество: $3 за входящие, $15 за исходящие. Haiku 4.5 - бюджетный, быстрый, но менее точный: $1 за входящие, $5 за исходящие.

Курс доллара ЦБ РФ на середину марта 2026 - около 80 рублей.

Считаем на Opus 4.6, без оптимизаций.

550 обменов по 32 000 входящих = 17 600 000 входящих токенов в месяц. 550 обменов по 8 500 исходящих = 4 675 000 исходящих токенов в месяц.

Входящие: 17,6 млн токенов по $5 за миллион = $88, то есть 7 040 рублей. Исходящие: 4,675 млн токенов по $25 за миллион = $117, то есть 9 360 рублей.

Итого API: $205, то есть 16 400 рублей в месяц.

Это чистая себестоимость токенов для одного юриста на лучшей модели. Без разработки, серверов, поддержки и прибыли компании.

Если взять модель подешевле: Sonnet 4.6 - около 9 800 рублей в месяц, примерно 18 рублей за обмен. Haiku 4.5 - около 3 300 рублей в месяц, примерно 6 рублей за обмен.

Haiku в 5 раз дешевле. Но это не та же модель в компактном корпусе - это принципиально другой уровень рассуждений. Разница между Opus и Haiku в юридическом контексте примерно как между опытным юристом и стажёром, который вчера прочитал учебник: стажёр знает термины, но не понимает нюансов. Для простых справок - достаточно. Для анализа сложного договора с пересечением отраслей - опасно. Поэтому для юридической работы - только Opus.

Кэширование: экономия, которая работает не всегда

Правила агента одинаковые в каждом запросе - можно закэшировать и сэкономить 90%? Нет. Вот почему.

Первый запрос - запись в кэш, стоит на 25% дороже обычного. Все следующие, пока кэш живой - чтение, стоит 10% от обычной цены.

Ключевое ограничение: кэш живёт 5 минут. Каждый новый запрос продлевает его ещё на 5 минут. Юрист непрерывно работает - кэш живёт и экономит. Отвлёкся на звонок на 6 минут - кэш умер, следующий запрос снова полная цена плюс 25% за запись. Но можно реализовать через Keep-alive пинг кэша (Бекэнд системы автоматически отправляет в API пустой или минимальный запрос каждые 4.5 минуты, продлевая жизнь) - это даст экономию порядка $20 в месяц.

Также можно снизить себестоимость за счет гибридной маршрутизации, т.е. какие-то простые запросы, например. Определение отрасли права, можно поручить более дешевой модели (API это позволяет, в отличии от Pro). Но оператор (юрист) должен сам в каждом случае уметь определять надо ли переключаться для данной задачи на менее умную модель. Поэтому тут экономия – спорный вопрос.

Есть часовой кэш - живёт 60 минут, но запись стоит в 2 раза дороже. Для юриста, который чередует работу с ИИ и другие задачи, может быть выгоднее.

И ещё: кэшируются только правила агента - те самые 15 100 токенов, которые одинаковы в каждом запросе. Документ, вопрос, результаты поиска, история - всегда по полной цене. Кэш экономит только на 47% входящих токенов. Остальные 53% - некэшируемые.

Реальная экономия при типичной работе (5 сессий в день по 5 обменов): счёт снижается с $205 до $177 в месяц. Это 14%, а не 90%.

Модульность - зачем она нужна

Юридический агент устроен модульно. Есть базовые правила (нужны всегда) и отраслевые файлы: гражданское, трудовое, уголовное, арбитраж и так далее. Если загрузить всё сразу - модель получит около 52 000 токенов правил вместо 15 000. Это в 3,5 раза дороже на входящих токенах. И что важнее - очень сильно размывает внимание модели.

В браузерной подписке Claude (Pro) файлы агента лежат отдельно от диалога. Модель видит только маршрутизатор - около 2 700 токенов. Когда юрист задаёт вопрос, модель сама определяет: «Это трудовой спор - мне нужен файл по трудовому праву». И читает только его. Остальные отрасли лежат рядом, но не загружаются. Экономия токенов плюс точность: модель работает с компактным набором правил, а не пытается удержать в голове все отрасли одновременно.

С октября 2025 года Anthropic добавила в API поддержку Skills - тот же механизм. Разработчик загружает агента как навык, и модель через API получает доступ к файловой системе. Но есть разница: в API на один запрос можно подключить максимум 8 навыков, в Pro такого жёсткого лимита нет. Плюс для работы Skills через API нужна вычислительная среда - дополнительные $0,05 в час.

А если строить без Skills, «по-старому»? Неприятный выбор: либо загружать все файлы в каждый запрос (дорого и неточно), либо самому писать логику маршрутизации. Но чтобы понять, какие отрасли затронуты, нужно сначала прочитать документ. А чтобы прочитать документ правильно, нужны правила агента. Замкнутый круг.

Модульная архитектура - не «красивая упаковка», а инженерная необходимость. Без неё либо дороже, либо хуже.

Длинные диалоги - невидимый враг точности

Есть проблема, которую кэш не решает. И которую вообще не видно в ценах на токены.

По мере роста диалога накапливается история переписки. На первом вопросе правила агента занимают около 47% входящих токенов. На десятом вопросе история выросла, и правила занимают уже меньшую долю контекста.

Модель продолжает видеть правила. Но её внимание распределяется по всему объёму текста. Это хорошо изученный феномен: исследование группы Стэнфордского университета «Lost in the Middle» (2023) показало, что языковые модели хуже работают с информацией в середине длинного контекста. Правила, которые были в начале, постепенно теряют влияние.

В юридических вопросах это конкретно: на пятнадцатом вопросе в одном диалоге модель может «забыть» проверить актуальность нормы или пропустить чек-лист. Не потому что правила исчезли - потому что утонули в объёме.

Правильный подход: каждая задача - отдельный диалог. Анализ договора - один. Составление иска - другой. Консультация по вопросу - третий. Так правила агента всегда занимают значительную часть контекста.

Это увеличивает расходы: в каждом новом диалоге правила загружаются заново. Но альтернатива - экономия на токенах ценой точности - в юридических вопросах неприемлема.

Сколько должна стоить подписка

Себестоимость одного юриста на Opus 4.6: токены API (без кэша) - около 16 400 рублей (с учетом оптимизации можно снизить до 12500 руб), вычислительная среда для работы с файлами - около 180 рублей. Итого себестоимость API: около 12 700 рублей в месяц.

Это чистый API. К нему нужно добавить разработку и поддержку сервиса, обновление агента при нововведениях со стороны разработчиков модели, техническую поддержку, прибыль.

При стандартном для SaaS-продуктов коэффициенте (себестоимость умножить на 2) минимальная подписка на юридического ИИ-агента на Opus - от 25 000 рублей в месяц.

И это я привел стоимость для средних задач. Для больших, серьезных – требуется декомпозиция (распределение ролей и назначение цифровых сотрудников), расходы увеличатся раза в 2 как минимум. Представляете, сколько должна стоить месячная подписка?

Что значит «дешёвый ИИ-юрист»

Когда предлагают ИИ-юриста за 990 или 2 000 рублей в месяц, объяснений ровно четыре.

Первое - слабая модель. Вместо флагмана используется бюджетная. Она дешевле в 5 раз, но и рассуждает проще. Для вопроса «какой срок исковой давности по договору поставки» - справится. Для «проанализируй этот договор, найди все риски для заказчика, проверь соответствие 44-ФЗ» - начнёт пропускать нюансы.

Второе - нет правил агента. Самый распространённый способ экономии. 15 000 токенов правил загружаются в каждый запрос - это около 25% всех входящих. Убери их - себестоимость снижается. Но модель без правил - это модель без чек-листа, без протокола проверки норм, без обязательного поиска актуальных редакций. Она просто «вспоминает» право из данных обучения. А данные обучения - это интернет со всеми его ошибками и устаревшими текстами.

Третье - жёсткие лимиты. 10 вопросов в день. Или 100 в месяц. При нормативных 550 обменах это 18% от полноценного инструмента. Остальные 82% времени юрист работает по-старому.

Четвёртое - убыточная модель. Стартапы иногда осознанно продают ниже себестоимости ради базы пользователей. Это работает ровно до тех пор, пока не закончатся инвестиции. Дальше - либо цены вырастут в разы, либо сервис закроется.

Ни один из этих вариантов не даёт полноценного юридического инструмента за заявленную цену.

Это касается не только юристов

Медицинские консультации - агент должен знать протоколы диагностики, лекарственные взаимодействия, актуальные рекомендации. Объём правил не меньше, требования к точности - выше.

Финансовое консультирование - налоговое право, инвестиционные ограничения, валютное регулирование. Правила меняются ещё чаще, стоимость ошибки - прямые финансовые потери.

Инженерные расчёты - строительные нормы, допуски, требования безопасности. Здесь ошибка - не штраф. Здесь ошибка - риск для жизни.

Принцип один: чем выше стоимость ошибки - тем дороже инструмент, который ошибается редко. Это не маркетинг. Это арифметика.

Каналы в Telegram, MAX

Показать полностью

tech2025

Что будет, если настроить ИИ для медицины по-настоящему: 90 специализаций, жёсткие протоколы и запрет на выдумки⁠⁠

Серия ИИ-агенты для бизнеса и бытовых нужд

5 дней назад

Что будет, если настроить ИИ для медицины по-настоящему: 90 специализаций, жёсткие протоколы и запрет на выдумки

Три месяца у меня болела шея. Не «немного ноет к вечеру», а болела - так, что голова раскалывалась, а головокружение не отпускало неделями.

Сделал МРТ. Сходил к костоправу - думал, защемление. Диагноз: шейный остеохондроз. Районный врач выписал три таблетки и сказал фразу, которую, наверное, слышал каждый второй: «Если не поможет - привыкайте с этим жить».

Не помогло.

Ехать в большой город - это дорога (которая при больной шее превращается в пытку), гостиница, платный приём. И главное - никакой гарантии, что скажут что-то новое. Онлайн-консультации тоже платные, и за один сеанс всё обсудить не получится.

Тогда и появилась идея - сделать то, что умею: настроить нейросеть. Не для текстов на этот раз и не для бизнеса, а для медицины. Сперва - чтобы разобраться с собственной шеей.

Стоп. Почему нельзя просто спросить нейросеть

Прежде чем рассказывать, что получилось, - важная оговорка. Потому что первая мысль у многих будет: «Зачем что-то создавать? Открой любую нейросеть, опиши симптомы, получи ответ».

Вот в чём проблема. Обычный ИИ (не специализированный, без настроек) в медицинском вопросе может:

· Выдумать диагноз. Не «ошибиться» - именно выдумать. Назвать болезнь, которой не существует, или сослаться на исследование, которое никогда не проводилось. Это называется галлюцинации, и вы их не заметите - текст будет выглядеть убедительно.

· Опереться на форум или блог. Нейросеть без чётких инструкций, границ и правил поведения не фильтрует источники. Она с одинаковой уверенностью процитирует клинические рекомендации ВОЗ и совет с форума «мне помогло, попробуйте».

· Пропустить взаимодействие лекарств. Назначит два препарата, которые вместе дают опасный эффект, - и не предупредит.

· Не сказать, что данных мало. Обычный ИИ не умеет останавливаться. Ему задали вопрос - он ответит. Даже если входных данных недостаточно для хоть сколько-нибудь точного вывода.

В медицине каждый из этих пунктов - не «неудобство». Это риск для здоровья.

Поэтому я пошёл другим путём. Не «задал вопрос нейросети», а построил систему - с жёсткими правилами, иерархией источников и запретами.

Что такое «МЕДЦЕНТР» и как он устроен

Система состоит из 19 ИИ-агентов, в каждом из которых собраны врачебные специализации, сгруппированные по смежности (например, кардиолог и пульмонолог - в одном агенте, хирург и травматолог - в другом). Всего - 90 специализаций. Каждый агент - это не короткая инструкция в одну строку вроде «ты врач-хирург, отвечай на вопросы». Это конструкция из нескольких файлов, где прописаны роль, методология, критические правила, примеры и обязательные проверки.

Покажу на примере одной группы - хирургической. Вот что внутри.

Иерархия источников. Система обязана опираться только на доказательную медицину. Приоритет: клинические руководства (ВОЗ, NICE, ASCO, NCCN), систематические обзоры (Cochrane), рандомизированные исследования с DOI. Форумы, блоги, анонимные публикации, материалы без первоисточников - запрещены. Не «нежелательны». Запрещены.

Грейды доказательности. Каждый вывод маркируется: Grade A (мета-анализы, систематические обзоры), Grade B (отдельные рандомизированные исследования), Grade C (клинический опыт, серии случаев). Читатель видит, на чём основана рекомендация.

Блокирующие протоколы. Если загружены файлы пациента - анализы, снимки, выписки - система не начнёт анализ, пока не прочитает каждый файл целиком. Не «пробежит глазами», а создаст инвентарный список, прочитает построчно, извлечёт данные и только потом выдаст ответ. Пока хотя бы один файл не прочитан - ответа не будет.

Проверка лекарственных взаимодействий. При назначении антибиотиков, анальгетиков, антикоагулянтов система обязана проверить совместимость с текущей терапией пациента. Варфарин с НПВС - повышенный риск кровотечения. Фторхинолоны с НПВС - риск судорог. Метронидазол с варфарином - рост МНО. Это не «было бы хорошо проверить» - это обязательный шаг.

Отдельная история - красные флаги. Острая боль в животе с перитонеальными симптомами, массивное кровотечение, прогрессирующий неврологический дефицит, признаки ишемии конечности - при обнаружении любого из них система немедленно рекомендует экстренную помощь. Не «возможно, стоит обратиться к врачу». Экстренно.

И наконец - запрет на выдумки. Звучит очевидно, но нейросеть по умолчанию так не работает. Если данных недостаточно, система обязана сказать об этом прямо. «Недостаточно информации для точного ответа» - не слабость. Это честность, которая в медицине ценнее любого красивого диагноза.

И это только одна группа из девятнадцати.

Принцип работы: загружаешь анамнез, анализы, снимки - система сама определяет, каких специалистов подключить, анализирует всё вместе, создавая связи между специализациями. Кардиолог «видит» данные, которые важны для невролога. Эндокринолог учитывает то, что нашёл хирург. Этот перекрёстный анализ в обычной поликлинике - роскошь. Здесь - стандарт.

Три случая. От простого к сложному.

Случай первый: на себе

Тот самый шейный остеохондроз, с которого всё началось. Загрузил в систему свои данные. Она проанализировала - и среди прочего рекомендовала многоканальный миостимулятор. Не абстрактно «попробуйте физиотерапию», а конкретную категорию прибора. Пояснила, почему именно многоканальный. Расписала схемы постановки электродов - какие программы использовать, в каком порядке (в инструкции к прибору, кстати, ничего этого не было). Плюс составила комплекс упражнений.

Результат: боли снизились на 60-70%. Головокружение ушло.

Я сэкономил деньги на поездки к врачам, время на дорогу и ожидание - и получил результат, которого за три месяца хождений по кабинетам не было.

Случай второй: родственница

Тут уже не про меня. Родственнице годами не могли поставить диагноз. Одни врачи говорили одно, другие - другое. Анализы сдавались, деньги тратились, ясности не прибавлялось. Загрузили её данные в систему (различные анализы, кардио, узи - всего около 30 документов). Десять минут работы - диагноз, рекомендации, схема действий.

С этими документами она пошла в поликлинику. Врач полностью согласилась с диагнозом и рекомендациями. И (цитирую) - «поразилась, как грамотно всё расписано».

Десять минут нейросети с правильными настройками. Против нескольких лет походов по клиникам.

Случай третий: два инсульта, шаблонные эпикризы и ошибка рентгенолога

Этот кейс родственника. Происходил не в России. Но именно он показал, на что способна настроенная система - и чего стоит халатность.

Пациент, 1956 года рождения. С 2022 года обследовался по поводу болей в сердце. Врачи назначали препараты - он их не принимал. В октябре 2025-го все его выписки, анализы и анамнез загрузили в систему.

Система выдала прогноз: если пациент не начнёт принимать лекарства, в ближайшие месяцы с высокой вероятностью - инсульт.

Он не послушался. Инсульт случился через полтора месяца. В относительно лёгкой форме - повезло.

После инсульта начал принимать лекарства, прошёл реабилитацию (с нарушениями - ел всё подряд, набрал 4 кг). Все документы снова загрузили в систему. И тут она нашла серьёзные проблемы.

Некоторые назначенные врачами лекарства - сомнительны по дозировкам. Часть не входит в стандартный протокол. В выписных эпикризах - копирование целых абзацев из одного документа в другой, одинаковые ошибки (шаблонное заполнение). УЗДГ сосудов шеи выполнено халатно: нет числовых значений степени стеноза, отсутствует описание позвоночных артерий.

Но критичнее всего: в отделении не назначены статины, не сделаны ЭхоКГ, Холтер-мониторирование, полная липидограмма и гликированный гемоглобин. Без этих данных невозможно определить подтип инсульта и выбрать правильную стратегию профилактики.

Система рекомендовала самостоятельно пройти обследования, составила приоритетный список. Пациент снова не послушался. Пил только лекарства, назначенные врачами.

Второй инсульт. В том же месте. Очаг поражения увеличился почти в четыре раза.

После повторного анализа документов система обнаружила: эпикризы двух госпитализаций практически идентичны, содержат одни и те же ошибки. Контрольных исследований не провели.

Когда наконец сделали МРТ головного мозга, рентгенолог описал картину как «хроническая микроангиопатия». Система просканировала снимки, провела количественный анализ четырёх модальностей - и пришла к другому выводу: территориальный инфаркт в бассейне правой средней мозговой артерии. Не рассеянная микроангиопатия - последствия двух инсультов в одной сосудистой территории.

Разница - не академическая. Если кардиолог видит «микроангиопатию» - это стандартная профилактика. Если видит «два территориальных инфаркта за 45 дней в одном бассейне при проходимой артерии» - это красный флаг рецидивирующей эмболии. Нужен агрессивный поиск источника тромбов.

Одна ошибка в описании снимка может стоить пациенту жизни.

90 специализаций. Что внутри.

Вот полный список групп:

1. Кардио-пульмонологическая группа

2. Хирургическая группа

3. Женское здоровье

4. Педиатрическая группа

5. Сенсорная группа (органы чувств)

6. Дерматологическая группа

7. Инфекционно-иммунологическая группа

8. Психоневрологическая группа

9. Онко-гематологическая группа

10. Анестезиология и реаниматология

11. Челюстно-лицевая группа

12. Гериатрическая группа

13. Спортивная медицина и функциональная диагностика

14. Токсикология и клиническая фармакология

15. Лабораторная и лучевая диагностика

16. Мужское здоровье (андрологическая группа)

17. Нервно-мышечная и опорно-двигательная система + реабилитация

18. Внутренние болезни и метаболизм

19. Флебология-лимфология

При включении всех агентов система сама определяет, каких специалистов подключить для конкретного случая. Не нужно выбирать вручную - чем больше данных загружено, тем точнее она работает.

Система умеет читать сканы анализов, рентгеновские снимки, документы - и анализировать их в связке.

Также можно попросить систему объяснить все простым языком для не посвященного человека - отлично "переводит" на понятный и простой даже школьнику язык, с примерами и аналогиями.

Что система НЕ умеет. И почему это важно.

Она не заменяет врача. Не может осмотреть, прощупать, провести операцию.

Диагнозы - предположительные, с указанием вероятности в процентах. Почему в процентах? Потому что точность зависит от полноты данных. Если загружена только жалоба - процент будет низким, и система об этом скажет. Если есть анализы, снимки, история - точность растёт. Человек видит, насколько надёжен вывод, и может решить, что делать дальше.

Если данных недостаточно - система скажет об этом прямо. Не додумает, не сочинит красивый диагноз.

Все рекомендации можно (и нужно) проверить у реального врача. Но прийти к врачу с грамотно сформулированным анамнезом, предположительным диагнозом и списком вопросов - это совсем другой разговор, чем прийти с «что-то болит, не знаю что».

Для кого

Я создавал систему для себя. Но по факту - это готовое решение для двух аудиторий.

Для врачей - как инструмент, повышающий точность диагностики. Перекрёстный анализ между специализациями, проверка взаимодействий лекарств, опора на актуальные международные протоколы. Практикующий врач может использовать это как аналитический фильтр - второе мнение, основанное не на субъективном опыте коллеги, а на доказательной базе.

Для обычных людей - как способ разобраться в своём состоянии до визита к врачу. Особенно для тех, кто живёт далеко от крупных клиник, не может быстро попасть к специалисту или хочет понять, насколько срочна ситуация.

Отдельно стоит сказать про то, чего не может дать обычный приём в поликлинике. Система работает круглосуточно и без ограничения по времени - можно задавать вопросы столько, сколько нужно, возвращаться к теме через день, уточнять детали. После визита к врачу появились новые вопросы - не нужна повторная запись. Можно загрузить все данные разом и получить что-то вроде виртуального консилиума, когда специалисты разного профиля анализируют ситуацию в связке. А ещё система объясняет медицинские нюансы простым языком - чтобы человек понимал, что с ним происходит, а не просто читал названия диагнозов.

Все рекомендации, которые система выдавала по реальным случаям, проверялись у врачей в клиниках. Пациенты приходили с распечатками - и врачи соглашались с диагнозами и назначениями.

Канал в Telegram

Показать полностью 1

[моё] Нейронные сети Промты для нейросетей Другой мир Видео Без звука Длиннопост

tech2025

Генерить - не писать. Как из нейросети сделать автора⁠⁠

Серия ИИ-агенты для бизнеса и бытовых нужд

8 дней назад

Генерить - не писать. Как из нейросети сделать автора

«Эффективное решение для оптимизации процессов.»

Я смотрел на этот текст и пытался понять, почему у меня от него физически сводит зубы. Грамматически - безупречно. Фактически - верно. А читать невозможно. Мозгу не за что зацепиться: ни образа, ни ритма, ни одной детали, которая бы за что-то потянула. Мёртвый текст. Красивый, гладкий, правильный - и мёртвый.

Тогда у меня появилась мысль: можно ли сделать так, чтобы нейросеть писала иначе? Не «контент», а тексты. Живые - с приёмами, техниками, ритмом, подобранными под конкретную задачу. И чтобы это не определялось как написанное машиной.

Я полез разбираться. Любопытство превратилось в исследование. Исследование - в проект на 300 с лишним страниц. В этой статье расскажу, как это было.

Забега вперед поясню для кого это нужно и зачем

Любой, кто пишет тексты с помощью нейросети и хочет, чтобы результат не выглядел как нейросеть. Посты в Telegram-канал, статьи на vc.ru или Дзен, рассылки, анонсы, обзоры - всё, где читатель за три секунды решает, дочитать или пролистать.

Блогеры, которые ведут каналы и устали от одинаково-гладкого ИИ-вывода. Предприниматели, которым нужен контент, но нет времени (или таланта) писать самим. Копирайтеры, которые используют ИИ как инструмент и хотят, чтобы инструмент работал тоньше. По сути - все, кому важно, чтобы текст звучал как человек, а не как «осуществление информирования целевой аудитории».

Почему мозг отличает живой текст от мёртвого

Начну с науки - потому что без неё вся затея не имела бы основания.

Человек тратит на экранный контент в среднем 47 секунд. Глаза бегут по F-образной траектории - верхние строки ещё читают, нижние уже пролистывают. Ключевая мысль должна быть в начале не потому, что «так принято», а потому что мозг физически не доберётся до середины, если начало не зацепило.

Ещё один момент. Оказалось, что ощущение лёгкости чтения напрямую влияет на доверие. Мозг автоматически считает легко читаемый текст более правдивым. Это не гипотеза - экспериментально подтверждённый эффект.

Мозг при чтении буквально «проживает» описанное. Читаешь «схватил горячую кружку» - и моторная кора активируется, будто ты сам схватил. Текст с конкретными деталями - запахами, звуками, действиями - ощущается телом. Абстрактный - пролетает мимо. Это называется двойное кодирование: конкретные слова обрабатываются сразу по двум каналам, и запоминаются в разы лучше абстрактных.

ИИ-тексты «мертвы» именно поэтому. Они оперируют обобщениями. А «три ночи переписывал, пока жена не отобрала ноутбук» - это уже сцена, которую ты видишь.

Системная ровность

Дело не только в словах-паразитах нейросетей. Главный маркер - системная ровность. Одинаковая длина предложений. Предсказуемые переходы. Однородная структура. Каждый абзац по шаблону: тезис, аргумент, пример, связка к следующему.

Живой текст - неровный. Короткая фраза. Потом длинная, с отступлением и возвратом к мысли. Снова короткая. Как дыхание. Нейросеть выравнивает всё до однородной гладкости, и именно эта гладкость выдаёт её вернее любого отдельного слова.

Русскоязычная специфика

В России одно из самых низких в мире доверий к рекламе - 53% по данным Nielsen. Зато рекомендации друга доверяют 86%. Менторский тон вызывает отторжение. Фальшивая восторженность - тем более.

В русской традиции есть целая школа живого слова. Зощенко - сказовая манера, будто рассказчик стоит рядом. Довлатов - минимализм и самоирония. Жванецкий - наблюдение за абсурдом повседневности. Нора Галь - война с канцеляритом, которую мы до сих пор проигрываем.

Нейросети на русском скатываются в канцелярит с пугающей регулярностью. «Осуществление деятельности» вместо «работа». «В настоящее время» вместо «сейчас». Для русскоязычного текста это смерть - читатель закрывает на втором абзаце.

Как строился проект

Началось с моего универсального агента - у него жёсткие правила работы с информацией, через него прогоняю любые начальные идеи. Там родились первые наброски архитектуры будущего «Писателя».

Быстро стало понятно: нужны серьёзные академические исследования. Не статьи с первой страницы поисковика, а рецензируемые работы по когнитивной психологии, стилистике, нарратологии, нейрокопирайтингу. Шесть направлений, от Аристотеля до сканирования мозга в 2025 году.

Объём работы оказался таким, что одному агенту не потянуть. У меня есть своя система для сложных задач - «Основа». Внутри неё - «Распределитель» с множество зашитых правил и границ поведения нейросети (короче, очень сложная штука, которая разбирает практически любую задачу из множества сфер: юридических, финансовых, аналитических, логических и т.п..). Так вот, он разбивает большой проект на части и назначает каждую отдельному суб-агенту, прописывает что и как искать, исследовать. Где брать, что именно дс этим делать и т.п.. Суб-агент (цифровой сотрудник) - это по сути специализированный ИИ-исследователь с узкой задачей. Распределитель разобрал проект и решил: нужно семеро. Один копает когнитивную психологию, другой - стилистику, третий - нарратологию, и так далее. Каждый приносит свои находки, а восьмой всё это собирает воедино.

Техническая проблема, которая чуть не похоронила всё: когда агент ищет и анализирует большой объём информации, контекстное окно переполняется. Часть данных просто исчезает. Пришлось разработать свой приём сохранения найденного - без него результаты часов работы терялись по дороге.

Суб-агенты отработали. Итог систематизации: 105 приёмов и фреймворков, 32 антипаттерна, 7 мета-принципов и 13 специфик русскоязычного текста.

Сырьё

Когнитивная психология дала принцип двойного кодирования - тот самый, из-за которого сенсорные детали работают лучше абстракций. Нарратология - 10 типов «зацепок» для начала текста: вопрос, провокационное утверждение, личная история, шокирующий факт, метафора. Каждый тип под свою ситуацию, а не наугад.

Отдельная история - нейрокопирайтинг. Формулы построения текста (PAS, AIDA, StoryBrand), адаптированные под короткий формат. Почему «потому что» после просьбы увеличивает согласие на 94%. Как работает социальное доказательство. Как строить доверие через конкретику.

22 риторические фигуры и 12 тропов из стилистики я рассортировал по задачам: что привлекает внимание, что удерживает, что вызывает эмоцию, что побуждает к действию. Плюс отдельный блок - борьба с маркерами нейросетевого текста.

Из этого сырья собрал Карту приёмов - 25 страниц. Потом из карты выросли 16 стилей (типов задач) - «рассказать историю», «продать», «объяснить сложное», «разобрать миф» и так далее. Описание каждого стиля с примерами и антипримерами заняло 143 страницы. Следом - 14 манер общения: от дружеского разговора до сухого юмора. Ещё 120 страниц.

Стена

Стили есть. Манеры есть. 263 страницы готовы.

А дальше - тупик.

Как их комбинировать? Не всё со всем сочетается. Исповедальный тон убивает продающий текст. Чёрный юмор несовместим с обучением. Провокация ломает мотивацию. Таких конфликтных пар - десятки. И для каждой нужно не просто сказать «нельзя», а объяснить почему и что использовать вместо.

Нужна была матрица сочетаемости: 16 задач на 14 манер - 224 пары. Для каждой - «работает», «с оговорками» или «конфликтует». Плюс комментарий к каждой оговорке и каждому конфликту.

Плюс механизмы, чтобы агент при таком объёме данных ничего не терял и не путал.

Этот этап занял несколько отдельных сессий.

30 сессий спустя

От первого наброска до рабочей версии - 22 диалоговых окна. Не 22 сообщения - 22 полноценных сессии, каждая со своей задачей. Потом тестирование, поиск багов, корректировки. А затем опять тестирование и еще 8 диалоговых окон. Это много.

Получился конструктор на 300+ страницах исследований. 16 типов задач, 14 манер письма, матрица сочетаемости с проверкой на конфликты. Защита от канцелярита и ИИ-штампов. Адаптация под пять площадок.

Это не промпт на полстраницы, который говорит нейросети «пиши живо». Это система, где каждая комбинация задача-манера тянет за собой свой набор приёмов, свои антипаттерны, свои границы. И где «три ночи переписывал» - не случайная удачная фраза, а результат того, что агент знает: моторная кора активируется на конкретных глаголах действия, а не на «осуществлении оптимизации».

Это не чат-бот, это цифровой сотрудник для LLM Claude. Посмотреть его работу можно на видео.

Показать полностью 3

[моё] Claude Агент Искусственный интеллект Нейронные сети Видео Без звука Длиннопост

Отличная работа, все прочитано!

Серия «ИИ-агенты для бизнеса и бытовых нужд»

Стоп. Почему нельзя просто спросить нейросеть

Что такое «МЕДЦЕНТР» и как он устроен

Три случая. От простого к сложному.

Случай первый: на себе

Случай второй: родственница

Случай третий: два инсульта, шаблонные эпикризы и ошибка рентгенолога

90 специализаций. Что внутри.

Что система НЕ умеет. И почему это важно.

Для кого

Забега вперед поясню для кого это нужно и зачем

Почему мозг отличает живой текст от мёртвого

Системная ровность

Русскоязычная специфика

Как строился проект

Сырьё

Стена

30 сессий спустя

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы