DeepSeek відкриває вихідний код своїх AI-моделей, посилюючи прихильність до відкритого програмного забезпечення

DeepSeek

Китайський стартап DeepSeek оголосив про публічний доступ до частини своїх кодових репозиторіїв, демонструючи прозорість та підтримку спільноти розробників.

Цей крок спрямований на підвищення прозорості та залучення спільноти розробників до вдосконалення їхніх AI-моделей. У повідомленні на платформі X компанія зазначила, що наступного тижня відкриє п’ять репозиторіїв, назвавши це “невеликим, але щирим прогресом”, який вони готові поділитися “з повною прозорістю”.

Раніше DeepSeek здивував AI-спільноту, випустивши відкриту модель R1, яка за продуктивністю конкурує із західними аналогами, при цьому розроблена з меншими витратами. Цей крок підкреслює відмінність DeepSeek від багатьох AI-компаній у Китаї та США, які зазвичай обирають закриті моделі. Засновник компанії, Лян Веньфен, вважає, що відкритий код має більше культурне значення, ніж комерційне, оскільки сприяє повазі та інноваціям у спільноті.

Окрім цього, DeepSeek нещодавно представив новий алгоритм під назвою Native Sparse Attention, розроблений для підвищення ефективності навчання та обробки довгих контекстів. Завдяки таким ініціативам компанія зміцнила свої позиції, залучивши 22,2 мільйона активних користувачів щодня, що робить її провідним чат-ботом у Китаї.

Цей крок DeepSeek може мати значний вплив на спільноту розробників, надаючи їм можливість детально ознайомитися з внутрішньою роботою їхніх AI-моделей та сприяти подальшим інноваціям у галузі штучного інтелекту.

Схожі Новини
Головний директор NVIDIA Дженсен Хуанг

Nvidia: ринок неправильно оцінив вплив DeepSeek

У нещодавньому інтерв'ю генеральний директор Nvidia Дженсен Хуанг прокоментував реакцію ринку на появу відкритої AI-моделі DeepSeek R1. Він наголосив, що ця технологія не знижує попит на обчислювальні ресурси, а навпаки, сприяє їх активнішому використанню.
Детальніше