Недоверие к ИИ остается главным ограничением для малого и среднего бизнеса при внедрении умного помощника в работу. Предприниматели видят, как большие модели формулируют ответы, но не всегда могут отличить достоверные данные от придумок нейронки. В бытовых сценариях это воспринимается как особенность инструмента, но в рабочих становится риском.
Ошибка в расчетах, некорректный анализ документа или неверная трактовка графика – все это приводит к отсутствию реального понимания, что происходит с бизнесом и, как следствие, к материальным потерям.
Поэтому сегодня растет интерес к системам, которые умеют работать не с обобщенными знаниями интернета, а с конкретными материалами. Один из подходов, который обеспечивает такую точность, – RAG (Retrieval-Augmented Generation). В материале разбираемся, как работает система и как ее применяют на деле.
Обычные ИИ vs. RAG
Исследования показали, что в последнее время нейросети стали ошибаться чаще из-за стремления ответить на все вопросы пользователя – раньше они избегали ответов в 31% случаев, поскольку не были уверены в их достоверности. Сегодня же ИИ дают информацию, даже если не могут проверить ее правдивость, а в результате многочисленных «дообучений» на данных, сгенерированных чат-ботами, ошибок становится больше. Возникают так называемые галлюцинации – уверенные, но неверные ответы.
Эксперты затрудняются объяснить, в чем главная причина возникновения таких искажений, но известно, что большие языковые модели (LLM) обучаются на огромных массивах информации, обобщая наиболее вероятные связи между словами и фактами. Благодаря этому они легко генерируют текст, но не всегда различают, где предположение, а где фактическая информация. Кроме того, ошибка может заключаться и в самом запросе к нейросети, что тоже зачастую приводит к сбою.
RAG же работает по-другому. Система объединяет два ключевых компонента – поисковые алгоритмы и генеративную модель.
Процесс ее работы делится на несколько шагов: данные, поиск и генерация.
Так, RAG не вспоминает ответ из общих данных, на которых она обучалась, а обращается к связанной с ней базе знаний, в качестве которой может выступать любое хранилище: ответы службы поддержки, документы, данные из энциклопедий и многое другое. Далее включается поиск: он может быть простым (по совпадению слов) или основанным на эмбеддингах – числовых представлениях смысла текста, которые позволяют точнее сопоставлять фразы по содержанию и смыслу. После поиска начинается генерация: модель получает вопрос и вместе с найденными фрагментами формирует ответ в контексте.
Такой принцип работы особенно важен в бизнес-сценариях, где ответы должны основываться на внутренних данных компании. Если обновить документы, обновится и контекст, в рамках которого RAG-модель отвечает на вопросы – за счет этого система подходит для задач, требующих высокой точности: от анализа договоров и финансовых отчетов до консультаций по ассортименту и карточкам товаров.
Как это реализовано в корпоративных сервисах
Сегодня RAG все чаще становится базой для работы нейросети. Например, на модели и поисковых технологиях Яндекса функционирует Алиса Про – инструмент, встроенный в сервисы Яндекс 360, который как раз и анализирует информацию и отвечает на вопросы по базе знаний. Любой проект в данном случае – самостоятельный источник информации для нейросети, в котором собраны документы, ссылки на сайты и файлы разных форматов. Поисковые технологии помогут найти ответ в базе знаний, затем языковая модель Alice AI сформулирует ответ на основе источников, даст из них точные цитаты и ничего не добавит от себя, поэтому предприниматель может быть уверен в достоверности ответа.
Сервис обрабатывает документы комплексно. Алгоритмы OCR (Optical Character Recognition, оптическое распознавание символов) распознают текст на изображениях и сканах. Речевые технологии превращают аудио- и видеофайлы в текст. Визуально-языковая модель интерпретирует графики, диаграммы и формулы. Все фрагменты объединяются в единую структуру, на основе которой пользователь ведет диалог с ИИ.
В России технология RAG находит широкое применение, особенно в финансовом секторе и разработке корпоративного ПО. «Сбербанк», «Т-Банк», «Альфа-Банк» используют или тестируют RAG-системы для работы виртуальных помощников, быстрого сбора и анализа рыночных данных и других задач, связанных с обработкой больших объемов документации. Московская биржа запустила интеллектуальный поисковик, который позволяет задавать системе вопросы простыми словами и получать релевантную информацию быстрее и с меньшей вероятностью ошибки. Компания BSS, российский разработчик интеллектуальных диалоговых платформ, использует эту технологию для улучшения работы чат-ботов, голосовых помощников и баз знаний.
Примеры решения задач
Предпринимателям приходится работать с информацией, которая редко бывает собрана в одном месте: часть данных находится в бухгалтерских документах, часть – в презентациях, часть – в переписке, в голосовых сообщениях или в скриншотах. RAG-технология будет анализировать их совместно, без необходимости собирать информацию вручную.
Так, при разборе договора Алиса Про определяет его ключевые условия, может дать анализ по каждому из пунктов или найти конкретную информацию, например, ответственность за одностороннее расторжение. При выполнении финансовых задач она собирает показатели из отчетов, счетов и актов, помогает анализировать прибыль или выявить конкретные убыточные моменты. Один из показательных сценариев – бухгалтерия для ИП и фрилансеров. Пользователь загружает необходимые документы, а сервис дает подробный анализ: например, определяет доход за квартал, указывает долю расходов, помогает проверить, какие счета оплачены, а какие требуют внимания.
В кадровых процессах RAG значительно ускоряет скрининг резюме. Сервис сопоставляет опыт кандидатов с требованиями вакансии, анализирует достижения, находит релевантные навыки и фиксирует расхождения. Чтобы найти идеального кандидата на позицию бренд-менеджера в магазин бытовой техники, нейросеть изучила два резюме, соотнесла опыт специалистов с задачами премиум-бренда и сформировала аргументированное заключение о наиболее подходящем кандидате, опираясь на конкретные фрагменты документов.
RAG снимает главный барьер для внедрения ИИ в малых и средних компаниях – сомнение в точности и безопасности. Модель работает с данными компании, а не строит догадки на открытых источниках. В результате ИИ становится инструментом, который помогает в работе с документами, финансовыми отчетами, аналитикой, планированием и многими другими задачами. Так нейросеть становится надежным помощником для предпринимателей.