Яндекс открыл доступ к библиотеке машинного обучения CatBoost

Яндекс представил свой метод машинного обучения. Его назвали CatBoost. Он позволяет эффективно обучать модели на разнородных данных. К примеру, таких как местонахождение пользователя, история операций и тип устройства. Библиотека машинного обучения CatBoost есть в открытом доступе, её могут использовать все желающие. Об этом сообщается в пресс-релизе компании.



CatBoost является наследником метода Матрикcнет, который применяется почти во всех сервисах Яндекса. CatBoost задействует механизм градиентного бустинга: он хорошо подходит для работы с разнородными данными. Однако, в отличие от Матрикснет, обучающего модели на числовых данных, CatBoost учитывает и нечисловые, например, виды облаков или типы зданий. Раньше эти данные приходилось переводить на язык цифр, что могло изменить их суть и повлиять на точность работы модели. Теперь они могут использоваться в первоначальном виде.

Новый метод уже был протестирован в сервисах Яндекса. В рамках эксперимента он применялся:

  • для улучшения результатов поиска,
  • ранжирования ленты рекомендаций Яндекс.Дзен
  • и для расчёта прогноза погоды в технологии Метеум.

Для начала работы с CatBoostдостаточно установить его на компьютер. Библиотека поддерживает системы Linux, Windows и macOS и доступна на языках программирования Python и R.


Источник: Блог Яндекса

(Голосов: 5, Рейтинг: 5)