DeepSeek оновила свою AI-модель R1 та виклала її на Hugging Face

DeepSeek

DeepSeek, китайська компанія, що спеціалізується на розробці великих мовних моделей, випустила оновлення своєї моделі R1 — DeepSeek-R1-0528. Це оновлення спрямоване на покращення здатності моделі до логічного мислення та інференції, завдяки використанню додаткових обчислювальних ресурсів та оптимізації алгоритмів на етапі посттренування. Про це пише TechCrunch.

Модель DeepSeek-R1-0528 демонструє високу продуктивність у задачах, пов’язаних з математикою, програмуванням та загальною логікою. Зокрема, вона перевершує моделі xAI’s Grok 3 mini та Alibaba’s Qwen 3 у генерації коду, поступаючись лише OpenAI’s o4 mini та o3.

DeepSeek-R1-0528 доступна на платформі Hugging Face під ліцензією MIT, що дозволяє її комерційне використання. Це сприяє ширшому впровадженню моделі в дослідницьких та комерційних проєктах. Однак варто зазначити, що модель має значний розмір — 685 мільярдів параметрів, що ускладнює її використання на звичайному споживчому обладнанні.

Початкова версія моделі R1 була представлена DeepSeek у січні 2025 року та відзначилася високою продуктивністю при значно нижчих витратах на тренування порівняно з конкурентами. Це викликало значний інтерес у галузі штучного інтелекту та сприяло зростанню популярності компанії.

Очікується, що в майбутньому DeepSeek представить ще більш потужну модель R2, яка була анонсована раніше, але її реліз поки що не відбувся.

Оновлення моделі DeepSeek-R1 до версії 0528 підкреслює прагнення компанії до постійного вдосконалення своїх технологій та підтримки відкритості в галузі штучного інтелекту. Це створює нові можливості для дослідників та розробників, заохочуючи подальший розвиток інновацій у сфері AI.


Телеграм double.newsТелеграм double.news

Схожі Новини
iPhone Lockdown Mode

Apple заявила про відсутність зламів iPhone з увімкненим Режимом блокування

Apple заявила, що з моменту запуску функції Lockdown Mode у 2022 році не зафіксовано жодного успішного зламу пристроїв із увімкненим цим режимом. Йдеться про спеціальний рівень захисту, створений для протидії складним кібератакам, зокрема з використанням державного шпигунського програмного забезпечення.
Детальніше
Discrod

Масштабний збій інтернету: проблеми з Discord, X і ChatGPT

У п’ятницю, 27 березня 2026 року, користувачі по всьому світу зіткнулися з перебоями в роботі популярних онлайн-сервісів. Серед постраждалих — Discord, X (Twitter) і ChatGPT, а також низка інших платформ, які частково або повністю втратили доступність.
Детальніше
Windows 11 екран вимкнення

Windows виявився менш стабільним за macOS

У 2025 році корпоративні пристрої на базі Windows значно частіше стикалися з критичними збоями, ніж системи macOS. Про це йдеться у новому звіті компанії Omnissa, яка проаналізувала телеметрію мільйонів пристроїв у корпоративному середовищі.
Детальніше