Главное:
- Первые покупатели новых графических процессоров Blackwell B200 от NVIDIA сообщают о проблемах с перегревом серверов.
- Проблема возникла при использовании серверных стоек, содержащих 72 чипа, которые перегреваются из-за недостаточной работы систем охлаждения.
- NVIDIA уже ведет работу над изменением конструкции стоек, что может привести к задержкам в поставках.
Проблема с перегревом и ее последствия
Первоначальные тесты новых графических процессоров Blackwell B200 вскрыли проблему с перегревом, с которой столкнулись их пользователи. При эксплуатации серверных стоек на 72 чипа системы охлаждения не справляются с задачами, что вызывает значительный перегрев. Рассматривая спецификации новых чипов, стоит отметить, что они произведены по 4-нанометровому техпроцессу и содержат 208 миллионов транзисторов. Эта мощность направлена на эффективное выполнение задач в области искусственного интеллекта, но без надлежащего охлаждения вся эта производительность оказывается под угрозой.
Исследования показывают, что перегрев компонентов может не только снизить производительность, но и существенно сократить срок службы оборудования. В данном случае, когда речь идет о серьезных инвестициях в оборудование, такие проблемы могут вылиться в большие финансовые потери для компаний, которые полагались на прогнозируемую производительность новых чипов.
Реакция NVIDIA на возникшие проблемы
Согласно источникам, NVIDIA уже запросила у партнеров изменить конструкцию стоек, чтобы обеспечить лучшую эффективность охлаждения. Подобные инженерные изменения, по заявлению компании, являются нормой и ожидаемы при внедрении новых технологий. Это не только открывает новые перспективы для улучшения производительности систем, но и подчеркивает, насколько важно проводить первичное тестирование в условиях, близких к реальным.
Кроме того, стоят упоминания связанные с изменением сроков поставок. В условиях постоянно возрастающего спроса на технологии ИИ, продолжительные задержки с поставками могут серьезно сказаться на компаниях, работающих в этой области, приводя к сбоям в запуске дата-центров.
Будущее чипов Blackwell B200
Несмотря на текущие проблемы с перегревом, чипы Blackwell B200 имеют потенциал значительно изменить рынок обработчиков ИИ. При стоимости в диапазоне от 30 до 40 тысяч долларов, они могут стать альтернативой более дорогим моделям, предлагая в 30 раз большую производительность в выполнении задач, связанных с машинным обучением и искусственным интеллектом.
По оценкам NVIDIA, пара таких чипов в видеокарте GB200 может обеспечить производительность в 20 петафлопс, что является значительным шагом вперед для дата-центров и централизованных систем облачных вычислений. Важно помнить, что на стадии развития новых технологий необходимо учитывать и дополнительные аспекты, такие как надежность и устойчивость оборудования к перегреву.
Таким образом, передовой потенциал Blackwell B200 несет в себе огромные возможности для повышения производительности в сфере ИИ, но успешное их использование будет зависеть от скорейшего разрешения проблем с перегревом.
Добавить комментарий