
Apple звернулася до Google з проханням вивчити можливість розміщення серверів у своїх дата-центрах для роботи нової версії Siri, побудованої на моделі Gemini. Про це повідомляють The Information.
Йдеться про підготовку до запуску оновленої Siri в межах платформи Apple Intelligence. Компанія прагне забезпечити достатні обчислювальні ресурси, аби впоратися з потенційним зростанням навантаження після релізу розширених AI-функцій.
Siri на Gemini: що вже відомо
У січні Apple офіційно підтвердила, що наступне покоління Apple Foundation Models базуватиметься на технологіях Gemini та хмарній інфраструктурі Google. Моделі мають стати основою для майбутніх функцій Apple Intelligence, включно з більш персоналізованою версією Siri.
Водночас у попередніх заявах зазначалося, що Apple Intelligence продовжить працювати на пристроях користувачів і через систему Private Cloud Compute. Чи буде нова Siri повністю або частково розгорнута в хмарі Google – офіційно не уточнювалося.
Нові повідомлення свідчать, що Apple може ширше інтегрувати інфраструктуру Google, ніж передбачалося раніше.
Обмеження власної хмарної інфраструктури

Наразі складні AI-запити Siri обробляються через Private Cloud Compute – власну хмарну систему Apple на базі серверів із чипами Apple Silicon. За даними джерел, у середньому використовується лише близько 10% потужностей цієї інфраструктури.
Частина серверів для AI-напряму навіть не введена в експлуатацію та зберігається на складах. Проте запуск нової версії Siri може різко збільшити попит на обчислювальні ресурси.
Додатковою проблемою є те, що серверні чипи Apple спочатку розроблялися для споживчих пристроїв і не оптимізовані для масштабних AI-навантажень. Це ускладнює ефективну роботу великих мовних моделей на кшталт Gemini.

