Post by Илья Рябыкин

Lead Solutions Architect | Sales, eCom, AI

Половина рынка сжигает годовые ИИ-бюджеты за квартал. Вторая половина кормит команду дешевыми LLM и всем рассказывает, что ИИ не решает задачи. При внедрении ИИ компании впадают в одну из двух крайностей. Крайность первая: Убить внедрение дешевизной. Из-за ограничений бюджета или требований ИБ сотрудникам сразу выдают дырявые модели. Я сам совершил эту ошибку в 2024 году. Прикрутил к своему боту 4o-mini по дефолту. Коллеги зашли, задали сложные рабочие вопросы, получили в ответ воду и ушли. Вернуть доверие пользователя после тупого ответа ИИ практически невозможно. Энтерпрайз наступает на те же грабли: люди мучаются с тупыми моделями и саботируют инструмент. Крайность вторая: Сжечь бюджет на топовых LLM. В поисках волшебной таблетки компания дает всем безлимитный доступ к Claude или GPT. Если масштабировать такой подход на всю компанию, годовой бюджет на ИИ улетает за квартал - это уже сейчас демонстрирует рынок. Обе крайности - следствие отсутствия стратегии. Мое правило как руководителя внедрения ИИ: тяжелые модели это R&D, дешевые модели - продакшн. Как это выглядит на практике: когда я собираю субагентов для команды, я сначала пишу harness на Claude. Он умный, сам додумывает контекст и выдает идеальный результат. Затем я беру этого же агента, переношу в Cursor и проверяю то же самое на Composer. И тут всё ломается. Младшая модель тупит, галлюцинирует и не может сделать шаг без прямой указки. И это нормальный процесс, моя стратегия: -> Валидация: тестируем гипотезу на тяжелой модели. Убеждаемся, что задача решаема. -> Даунгрейд: переводим агента на дешевую модель или опенсорс. -> Декомпозиция: анализируем историю работы агента, выявляем места, где она тупит. Вместе с этой же моделью дорабатываем инструкции и скрипты, разбиваем задачу на микро-шаги, задаем строгий формат вывода. Мы делаем это до тех пор, пока дешевая модель не начнет выдавать результат на уровне дорогой. Компании, которые с первого дня пихают дешевые модели из-за страхов за бюджет или безопасность, просто убивают продукт на старте. Забейте на паранойю. Берете самую тяжелую модель. Тестируете гипотезу. Если взлетело - прекрасно, садимся и переводим на дешевую. Это единственный рабочий подход, который не заставляет команду ломать голову, пытаясь обучить тупую модель с нуля, и не выжигает месяцы разработки впустую.