Следите за нами в социальных сетях:

Единая отраслевая платформа по электронике, микроэлектронике и новым технологиям
我们在俄罗斯为中国公司做广告
Новости электроники и микроэлектроники
Приглашаем подписаться на наш telegram-канал https://t.me/IndustryHunter, где мы публикуем новости, перепосты важных сообщений от ассоциаций и наших информационных партнеров, анонсы ближайших событий и многое другое

Яндекс открыл доступ к одному из крупнейших в мире набору данных для развития рекомендательных систем

| 180

Команда Яндекса выложила в открытый доступ Yambda (YAndex Music Billion-interactions DAtaset) — один из крупнейших в мире наборов данных (датасетов) для развития рекомендательных систем. Как отметили в пресс-службе, с помощью Yambda учёные, исследователи и вузы со всего мира смогут тестировать и улучшать рекомендательные алгоритмы.

Датасет представлен в трёх вариантах: полная версия содержит 5 миллиардов данных, уменьшенные — 500 миллионов и 50 миллионов. Разработчики и исследователи смогут выбрать тот вариант, который отвечает их задаче и имеющимся вычислительным ресурсам. Данные датасета и код для замеров доступны на HuggingFace.

Yambda создан на основе обезличенных данных «Яндекс Музыки» — крупнейшего подписного музыкального сервиса в России. Как пояснили в Яндексе, использовать его можно для оценки качества любых рекомендательных систем, так как в их основе лежат общие алгоритмы.

Yambda включает агрегированные прослушивания, «лайки», «дизлайки», а также некоторые характеристики треков. Все данные о пользователях и треках анонимизированы: датасет содержит исключительно числовые идентификаторы, что обеспечивает конфиденциальность.

 

 

Источник: https://www.ixbt.com/news/2025/05/28/jandeks-otkryl-dostup-k-odnomu-iz-krupnejshih-v-mire-naboru-dannyh-dlja-razvitija-rekomendatelnyh-sistem.html

Изображение: сгенерировано нейросетью Dall-E

 

Подписаться на рассылку

Вернуться к ленте новостей