DeepSeek оновила свою AI-модель R1 та виклала її на Hugging Face

DeepSeek

DeepSeek, китайська компанія, що спеціалізується на розробці великих мовних моделей, випустила оновлення своєї моделі R1 — DeepSeek-R1-0528. Це оновлення спрямоване на покращення здатності моделі до логічного мислення та інференції, завдяки використанню додаткових обчислювальних ресурсів та оптимізації алгоритмів на етапі посттренування. Про це пише TechCrunch.

Модель DeepSeek-R1-0528 демонструє високу продуктивність у задачах, пов’язаних з математикою, програмуванням та загальною логікою. Зокрема, вона перевершує моделі xAI’s Grok 3 mini та Alibaba’s Qwen 3 у генерації коду, поступаючись лише OpenAI’s o4 mini та o3.

DeepSeek-R1-0528 доступна на платформі Hugging Face під ліцензією MIT, що дозволяє її комерційне використання. Це сприяє ширшому впровадженню моделі в дослідницьких та комерційних проєктах. Однак варто зазначити, що модель має значний розмір — 685 мільярдів параметрів, що ускладнює її використання на звичайному споживчому обладнанні.

Початкова версія моделі R1 була представлена DeepSeek у січні 2025 року та відзначилася високою продуктивністю при значно нижчих витратах на тренування порівняно з конкурентами. Це викликало значний інтерес у галузі штучного інтелекту та сприяло зростанню популярності компанії.

Очікується, що в майбутньому DeepSeek представить ще більш потужну модель R2, яка була анонсована раніше, але її реліз поки що не відбувся.

Оновлення моделі DeepSeek-R1 до версії 0528 підкреслює прагнення компанії до постійного вдосконалення своїх технологій та підтримки відкритості в галузі штучного інтелекту. Це створює нові можливості для дослідників та розробників, заохочуючи подальший розвиток інновацій у сфері AI.

Схожі Новини
Toyota office

Інновації в автосервісі: Toyota спрощує ремонт за допомогою ШІ

У рамках конференції TechCrunch Sessions: AI 2025 компанії Toyota та NLX представили спільний проєкт, спрямований на трансформацію процесів ремонту автомобілів за допомогою штучного інтелекту. Ця ініціатива дозволяє технікам отримувати миттєвий доступ до обширної бази технічної документації, що значно підвищує ефективність обслуговування.
Детальніше
Ілон Маск Twitter

Конфлікт між Ілоном Маском і Дональдом Трампом спричинив сплеск активності в соцмережі X

Публічне протистояння між Ілоном Маском та президентом США Дональдом Трампом не лише сколихнуло політичний ландшафт, а й суттєво вплинуло на цифровий простір. Зокрема, соціальна мережа X (колишній Twitter), що належить Маску, зазнала значного зростання активності користувачів та піднялася в рейтингах App Store.
Детальніше
iOS 26 Beta

iOS 26 Beta: Коли можна буде встановити оновлення на iPhone

Очікуване оновлення iOS 26 офіційно представлять під час конференції Apple WWDC 2025, яка стартує 9 червня. Традицією компанії, вже цього ж дня перша бета-версія стане доступною для зареєстрованих розробників.
Детальніше