DeepSeek оновила свою AI-модель R1 та виклала її на Hugging Face

DeepSeek

DeepSeek, китайська компанія, що спеціалізується на розробці великих мовних моделей, випустила оновлення своєї моделі R1 — DeepSeek-R1-0528. Це оновлення спрямоване на покращення здатності моделі до логічного мислення та інференції, завдяки використанню додаткових обчислювальних ресурсів та оптимізації алгоритмів на етапі посттренування. Про це пише TechCrunch.

Модель DeepSeek-R1-0528 демонструє високу продуктивність у задачах, пов’язаних з математикою, програмуванням та загальною логікою. Зокрема, вона перевершує моделі xAI’s Grok 3 mini та Alibaba’s Qwen 3 у генерації коду, поступаючись лише OpenAI’s o4 mini та o3.

DeepSeek-R1-0528 доступна на платформі Hugging Face під ліцензією MIT, що дозволяє її комерційне використання. Це сприяє ширшому впровадженню моделі в дослідницьких та комерційних проєктах. Однак варто зазначити, що модель має значний розмір — 685 мільярдів параметрів, що ускладнює її використання на звичайному споживчому обладнанні.

Початкова версія моделі R1 була представлена DeepSeek у січні 2025 року та відзначилася високою продуктивністю при значно нижчих витратах на тренування порівняно з конкурентами. Це викликало значний інтерес у галузі штучного інтелекту та сприяло зростанню популярності компанії.

Очікується, що в майбутньому DeepSeek представить ще більш потужну модель R2, яка була анонсована раніше, але її реліз поки що не відбувся.

Оновлення моделі DeepSeek-R1 до версії 0528 підкреслює прагнення компанії до постійного вдосконалення своїх технологій та підтримки відкритості в галузі штучного інтелекту. Це створює нові можливості для дослідників та розробників, заохочуючи подальший розвиток інновацій у сфері AI.


Телеграм double.newsТелеграм double.news

Схожі Новини
Oracle

Ставка Oracle на ШІ призвела до найгіршого кварталу з 2001 року

Oracle на розвиток інфраструктури для штучного інтелекту починає викликати дедалі більше запитань на Волл-стріт. У четвертому кварталі 2025 року акції компанії впали приблизно на 30%, що робить цей період найгіршим для Oracle з 2001 року - часу вибуху дотком-бульбашки.
Детальніше
Windows

Провідник Windows 11 зменшить споживання оперативної пам’яті під час пошуку файлів

Microsoft тестує важливе покращення для Провідника у Windows 11, яке має знизити використання оперативної пам’яті під час пошуку файлів. Оновлення спрямоване на оптимізацію механізму пошуку, який у деяких сценаріях створював надмірне навантаження на систему.
Детальніше
Тім Кук

CEO Apple інвестував $3 млн у Nike на тлі проблем компанії

Генеральний директор Apple Тім Кук здійснив помітну інвестицію у компанію Nike, придбавши акції виробника спортивного одягу на суму близько 3 мільйонів доларів. Угода відбулася на відкритому ринку на тлі падіння вартості цінних паперів Nike та посиленого тиску з боку інвесторів.
Детальніше