Войти как пользователь
Вы можете войти на сайт, если вы зарегистрированы на одном из этих сервисов:
Россия +7 (909) 261-97-71
15 Декабря в 15:33

CatBoost от Яндекса вошел в топ самых используемых ML-инструментов в науке

Россия +7 (909) 261-97-71
0 354
Подпишитесь на нас в Telegram

Алгоритм машинного обучения CatBoost, разработанный Яндексом, вошел в число наиболее широко используемых ML-инструментов в научных исследованиях по версии американского издания Marktechpost. Об этом говорится в отчете ML Global Impact Report 2025, с которым ознакомился Forbes.

Доклад охватывает исследования ученых из более чем 125 стран и фиксирует ведущую роль США и Китая в мировой ML-экосистеме. При этом CatBoost вошел в узкую группу из пяти неамериканских инструментов машинного обучения, наиболее часто упоминаемых в научных публикациях. Помимо разработки Яндекса, в этот список вошли Scikit-learn (Франция), AlphaFold (Великобритания), U-Net (Германия), а также GAN и RNN (Канада).

Согласно отчету, CatBoost используется в каждой 30-й научной статье, где применяются методы машинного обучения. Алгоритм задействуют исследователи из 51 страны, включая США, Китай и Саудовскую Аравию. Среди авторов таких публикаций – представители ведущих университетов мира, в том числе Harvard University, MIT, Stanford University и National University of Singapore. На долю США приходится около 13% статей с использованием CatBoost – сопоставимо с показателями американских ML-решений: XGBoost (15%), классического Gradient Boosting Model (12%) и LightGBM (10%).

В отчете также отмечается, что, несмотря на активное обсуждение генеративного ИИ, большинство научных исследований по-прежнему опираются на зрелые методы машинного обучения, включая градиентный бустинг и работу с табличными данными.

CatBoost применяется в широком спектре отраслей – от медицины до прикладных наук. В научных работах алгоритм использовался для прогнозирования рецидивов рака печени, обнаружения рака молочной железы, ранней диагностики болезни Альцгеймера, прогнозирования преждевременных родов, анализа качества воды, прогнозирования спроса на зарядку электромобилей и выявления фальшивых аккаунтов в соцсетях.

Алгоритм был изначально создан для задач поиска Яндекса, а с 2017 года доступен в открытом исходном коде. Сегодня CatBoost применяется в сервисах компании, включая «Поиск», «Директ», «Маркет», «Погоду» и «Музыку». В Яндексе отмечают, что его популярность связана с эффективной работой с табличными данными и автоматической обработкой категориальных признаков.

Представители бизнеса и научного сообщества отмечают высокую точность алгоритма и возможность использования «из коробки» без сложной настройки.

Источник: Forbes
0 комментариев
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.

Отправьте отзыв!
X | Закрыть