Процесор Habana Gaudi2 показав удвічі більшу пропускну здатність порівняно з відеопроцесором Nvidia A100

Команда Habana Labs від Intel випустила процесори 2-го покоління для навчання ШІ (штучного інтелекту) та формування логічних висновків

На заході Intel Vision компанія Intel оголосила про те, що її команда Habana Labs, яка займається розробкою процесорів для глибокого навчання ШІ, випустила свої процесори другого покоління для навчання та формування логічних висновків: Habana® Gaudi®2 та Habana® Greco™. Ці нові процесори заповнюють галузеву прогалину, надаючи клієнтам високопродуктивні та високоефективні обчислювальні рішення для глибокого навчання, як для учбових робочих навантажень, так і для формування логічних висновків у ЦОД, що повинно зменшити вхідний бар’єр у галузь ШІ (штучного інтелекту) для компаній будь-якого розміру.  

«Випуск нових процесорів для глибокого навчання від Habana є яскравим прикладом того, як Intel реалізує свою стратегію щодо ШІ, надаючи клієнтам широкий вибір рішень — від хмарних до периферійних — у відповідь на зростання кількості та складність природи робочих навантажень ШІ. Процесори Gaudi2 здатні допомогти клієнтам Intel обробляти все більші та складніші робочі навантаження з навчання з іще більшою швидкістю та ефективністю. Також ми очікуємо підвищення ефективності формування логічних висновків від Greco», — Сандра Рівера (Sandra Rivera), виконавчий віце-президент Intel і головний керівник Групи ЦОД та ШІ 

Чому це важливо

Нові процесори Gaudi2 та Greco розроблені спеціально для застосунків глибокого навчання ШІ і виготовлено за 7-нанометровим техпроцесом на базі високопродуктивної архітектури Habana. На заході Intel Vision команда Habana Labs показала, що продуктивність навчання на процесорі Gaudi2 для моделі комп’ютерного зору ResNet-50 та моделі обробки природної мови BERT удвічі перевищує продуктивність навчання на відеопроцесорі Nvidia A100-80GB..

“Порівняно з відеопроцесором A100, виготовленого за таким самим техпроцесом із приблизно таким самим розміром кристалу, Gaudi2 демонструє безсумнівно кращу продуктивність, про що свідчать результати тестового виконання типових задач, — заявив Ейтан Медіна (Eitan Medina), головний виконавчий менеджер Habana Labs. — Ця архітектура прискорення глибокого навчання є фундаментально більш ефективною.”

Про процесори Gaudi2

Процесори для глибокого навчання Gaudi2 — це:

  • Ефективність процесу навчання ШІ. Процесор Habana Gaudi2 значно підвищує продуктивність навчання, посилаючись на ту ж саму високопродуктивну архітектуру, що й процесори Gaudi першого покоління, що забезпечує на 40% краще співвідношення ціна/продуктивність у хмарних сервісах AWS із інстансами Amazon EC2 DL1 та у локальному варіанті зі Supermicro Gaudi Training Server. Стрибок техпроцесу з 16-нм (у Gaudi) до 7-нм дозволив надати Gaudi2 значно більші можливості обчислення, пам’яті та мережевого обміну даними. Gaudi2 також отримав інтегрований механізм обробки медіа зі стисненням для розвантаження головної підсистеми. Обсяг вбудованої пам’яті HBM2E в Gaudi2 збільшився втричі — з 32 до 96 ГБ із пропускною здатністю 2,45 ТБ/с. Мікросхему оснащено 24 мережевими адаптерами 100GbE RoCE RDMA для горизонтального та вертикального масштабування за допомогою стандартного протоколу Ethernet. 

 

  • Переваги для клієнтів. Gaudi2 надає високопродуктивну альтернативу наявним відеоприскорювачам для машинного навчання, завдяки якій наші клієнти зможуть робити більше, витрачаючи менше коштів, що допоможе зменшити TCO у хмарних сервісах та ЦОДах. Цей процесор розроблено з прицілом на багато типів моделей та додатків для кінцевих споживачів, що забезпечить клієнтам менший термін навчання, а отже, більш швидке отримання інформації та пришвидшить вивід продукту на ринок. Gaudi2 призначений для значного покращення моделювання зображень у застосунках , що використовуються у автономних транспортних засобах, розпізнавання медичних зображень і виявлення дефектів у виробництві, а також додатків для обробки природної мови. 

 

  • Гнучкість та ефективність мережевого зв’язку. Habana робить економічним та простим горизонтальне масштабування потужностей навчання шляхом збільшення пропускної здатності навчання на процесорах Gaudi другого покоління. Завдяки інтеграції у мікросхеми стандартних мережевих адаптерів RoCE клієнти зможуть легко масштабувати та конфігурувати системи з процесорів Gaudi2 для виконання вимог їхніх кластерів глибокого навчання. Реалізація мережевого зв’язку на стандартному для галузі протоколі Ethernet дозволяє користувачам Gaudi2 обирати з широкого асортименту комутаторів та іншого мережевого обладнання, що заощаджує кошти. Використання стандартних технологій мережевого зв’язку в центрі обробки даних (на відміну від фірмових технологій, які пропонують деякі конкуренти) дозволяє уникнути залежності від продукції одного постачальника. Крім того, інтеграція мережевих портів (NIC) у мікросхему зменшує вартість компонентів. 

 

  • Спрощення створення моделей та міграції. Програмний пакет Habana® SynapseAI® оптимізовано для розробки моделей глибокого навчання та спрощення міграції існуючих моделей для відеопроцесорів на апаратну платформу Gaudi. Пакет SynapseAI підтримує навчання моделей Gaudi2 та формування логічних висновків на будь-якій цілі, включно з процесорами Intel® Xeon®, Habana Greco чи власне Gaudi2.  На допомогу розробникам надається документація, інструменти, практичні інструкції та форум підтримки з боку спільноти на сайті розробників Habana, базові моделі та «дорожня карта» розробки моделей на GitHub компанії Habana. Міграція моделей для початківців зводиться до додавання пари рядків коду, а для експертів, які бажають запрограмувати власні ядра, Habana пропонує повний набір інструментів. 

 

  • Про доступність рішень Gaudi2 Training: Процесори Gaudi2 вже доступні для клієнтів Habana. Habana співпрацює з компанією Supermicro над тим, щоб вивести Supermicro Gaudi2 Training Server на ринок до кінця цього року. Також Habana працює з компанією DDN® над створенням готових до використання рішень на рівні стійки, до складу яких входитимуть сервер Supermicro зі збільшеним обсягом пам’яті та рішення для зберігання даних DDN AI400X2.