Ведомости: «Билайн» займется доработкой серверов под работу ИИ-моделей»

06-05-2025
Количество запросов на аренду стоек с более мощными GPU-серверами растет, но мало кто готов за это платить.


Телекомоператор «Билайн» вместе с одним из российских производителей серверного оборудования обсуждает доработку решений для инференса ИИ-моделей (исполнения работы ранее обученных алгоритмов). Сам оператор занимается разработкой инфраструктурного софта, который станет частью программно-аппаратного комплекса, на котором компании смогут развернуть ИИ-модели. Об этом «Ведомостям» рассказал заместитель гендиректора по IT «Вымпелкома» (бренд «Билайн») Антон Рубенчик. В будущем оператор сможет устанавливать эти серверы в собственные ЦОДы и продавать доступ к этим мощностям как услугу для b2b-клиентов.


По словам источника «Ведомостей», знакомого с ходом переговоров, «Билайн» ведет обсуждения с производителем серверного оборудования OpenYard. Представитель OpenYard подтвердил, что компания ведет переговоры с рядом телекомоператоров, включая «Билайн», но раскрывать детали не стал. Представитель T2 говорит, что компания не сотрудничает с OpenYard. «Ведомости» направили запросы в «Мегафон» и МТС.


Системы искусственного интеллекта требуют разных вычислительных ресурсов на этапах обучения и эксплуатации. Обучение ИИ-моделей – самый ресурсоемкий этап, который требует использования тысяч графических ускорителей (GPU), а оборудование для этого этапа пока в России не делает ни один вендор.


Когда модель обучена, ее используют для ответов на запросы, этот процесс называется инференсом. Для инференса действительно требуется менее мощное и более простое оборудование по сравнению с обучением моделей. В России разработкой такого оборудования занимаются «Сбер», «Яндекс», OpenYard и ряд стартапов, перечисляет независимый аналитик, автор Telegram-каналов @abloud62 и @RUSmicro Алексей Бойко.


Впрочем, чипы в этом оборудовании используются иностранные. Прежде всего это американские карты, попавшие в страну до 2022 г., производства Nvidia, AMD (Instinct MI) и в меньшей степени Intel, уточнил Бойко.

«Ведомости» направили запросы в «Яндекс» и «Сбер».


Стандартные серверы плохо справляются с запуском больших ИИ-моделей, поясняет руководитель ИБ-направления «Телеком биржи» Александр Блезнеков. Для этого требуется специализированное оборудование с GPU, оптимизированные каналы связи и высокая пропускная способность памяти, отмечает собеседник: «Без этого развертывать аналоги ChatGPT неэффективно».


Мы ощущаем рост запроса на аренду стоек с GPU-серверами, – заявил Рубенчик. – Все этого очень хотят, но не все готовы за это платить. Есть большая проблема управления вычислительными мощностями в части GPU». По его словам, инференс можно делать на обычных серверах, есть много наработок на эту тему, но ни одна из них не позволяет получить сопоставимые результаты с серверами с GPU.


Для «Билайна» это возможность запустить новую услугу в виде аренды серверных мощностей и поддержку развертывания ИИ, а для OpenYard – получить крупного заказчика на оборудование, говорит Блезнеков. «Билайн» совместно с OpenYard пытается сделать готовый сервис, объясняет гендиректор Dbrain Алексей Хахунов. Для крупных компаний с тысячами сотрудников стоимость такой услуги может составить 100–200 млн руб. в год, считает он.


В таком решении в первую очередь будут заинтересованы банки для создания чат-ботов и оценки скоринга и телекомоператоры для создания виртуальных операторов, говорит Блезнеков. Также такое решение актуально для IT-компаний и просто крупных компаний для использования ИИ-аналитики, потому что аналогов в России нет, добавил он. Также могут проявить интерес промышленные компании, которые используют ИИ в качестве цифрового ассистента, который отслеживает состояние оборудования и контролирует качество готовой продукции, уточняет представитель Fplus.


К 2030 г. мощность российских ЦОДов для решения задач ИИ должна составить более 70 000 в эквиваленте карт Nvidia А100, писали «Ведомости» 10 марта. Вилку на 70 000 Nvidia A100 или аналогов при инвестициях как в текущие ЦОДы, так и с долей строительства новых можно оценить в $1,5–2 млрд, говорил главный инженер IT-проектов компании «Уралэнерготел» Владимир Маторин.


https://www.vedomosti.ru/technology/articles/2025/05/06/1108470-bilain-zaimetsya-dorabotkoi-serverov-pod-rabotu-ii-modelei