DeepSeek відкриває вихідний код своїх AI-моделей, посилюючи прихильність до відкритого програмного забезпечення

DeepSeek

Китайський стартап DeepSeek оголосив про публічний доступ до частини своїх кодових репозиторіїв, демонструючи прозорість та підтримку спільноти розробників.

Цей крок спрямований на підвищення прозорості та залучення спільноти розробників до вдосконалення їхніх AI-моделей. У повідомленні на платформі X компанія зазначила, що наступного тижня відкриє п’ять репозиторіїв, назвавши це “невеликим, але щирим прогресом”, який вони готові поділитися “з повною прозорістю”.

Раніше DeepSeek здивував AI-спільноту, випустивши відкриту модель R1, яка за продуктивністю конкурує із західними аналогами, при цьому розроблена з меншими витратами. Цей крок підкреслює відмінність DeepSeek від багатьох AI-компаній у Китаї та США, які зазвичай обирають закриті моделі. Засновник компанії, Лян Веньфен, вважає, що відкритий код має більше культурне значення, ніж комерційне, оскільки сприяє повазі та інноваціям у спільноті.

Окрім цього, DeepSeek нещодавно представив новий алгоритм під назвою Native Sparse Attention, розроблений для підвищення ефективності навчання та обробки довгих контекстів. Завдяки таким ініціативам компанія зміцнила свої позиції, залучивши 22,2 мільйона активних користувачів щодня, що робить її провідним чат-ботом у Китаї.

Цей крок DeepSeek може мати значний вплив на спільноту розробників, надаючи їм можливість детально ознайомитися з внутрішньою роботою їхніх AI-моделей та сприяти подальшим інноваціям у галузі штучного інтелекту.


Телеграм double.newsТелеграм double.news

Схожі Новини
OpenAI

OpenAI розробляє розумну колонку з камерою

OpenAI працює над своїм першим апаратним продуктом - «розумною» колонкою з камерою та функціями розпізнавання обличчя. За даними видання The Information, пристрій може коштувати від 200 до 300 доларів і надійти у продаж не раніше березня 2027 року.
Детальніше
ChatGPT

Журналіст вдалось «зламав» ChatGPT і Google AI за 20 хвилин

Журналіст BBC Томас Жермен продемонстрував, що змусити ChatGPT та Gemini від Google поширювати неправдиву інформацію можна буквально за кілька десятків хвилин. Для цього він використав простий SEO-прийом - створив вигадану статтю на власному сайті й дочекався, поки алгоритми її підхоплять.
Детальніше