Apple rozważa uruchomienie Siri opartej na Gemini na serwerach Google

Apple zwrócił się do Google z prośbą o sprawdzenie możliwości uruchomienia serwerów w centrach danych Google, które miałyby obsługiwać przyszłą wersję Siri opartą na modelu Gemini. Informację tę podał serwis The Information, powołując się na osoby zaznajomione ze sprawą.

Obecnie Apple kieruje bardziej złożone zapytania związane ze sztuczną inteligencją do systemu Private Cloud Compute, który działa na serwerach Apple wyposażonych w autorskie układy Apple Silicon. Według doniesień średnie wykorzystanie tej infrastruktury wynosi zaledwie około 10 procent. Skala użycia jest na tyle niska, że część serwerów przeznaczonych do obsługi chmury AI nadal znajduje się w magazynach i nie została jeszcze uruchomiona. Sytuacja ta może jednak szybko ulec zmianie wraz z premierą nowej generacji Siri, która może znacząco zwiększyć zapotrzebowanie na moc obliczeniową.

Źródła wskazują, że Apple od lat zmaga się z wewnętrzną niechęcią do rozbudowy własnej infrastruktury chmurowej. Doprowadziło to do odejścia części kluczowych specjalistów, w tym Patricka Gatesa, który był jednym z pomysłodawców wykorzystania układów Apple w centrach danych. Mimo dynamicznego rozwoju usług firma nadal koncentruje się głównie na sprzęcie i funkcjach konsumenckich, zaniedbując zaplecze chmurowe.

Gdy Apple uświadomił sobie skalę potrzeb związanych z rozwojem sztucznej inteligencji, jego wewnętrzna infrastruktura AI była już w fazie stopniowej degradacji. Firma jednocześnie wycofywała starsze serwery oparte na układach NVIDIA, a presja finansowa skłoniła ją do coraz częstszego korzystania z zewnętrznych dostawców, takich jak Amazon.

Przez wiele lat Apple zabraniał swoim zespołom AI korzystania z rozwiązań chmurowych Google ze względu na obawy dotyczące prywatności. Szef działu oprogramowania Apple, Craig Federighi, wielokrotnie blokował wykorzystanie Google Cloud. Dopiero zmiany w systemach bezpieczeństwa wprowadzone przez Google w 2023 roku przekonały Apple do stopniowego korzystania z tej infrastruktury w projektach związanych ze sztuczną inteligencją.

Problemy potęguje fakt, że Private Cloud Compute jest trudniejszy i wolniejszy w aktualizacji niż nowoczesne platformy serwerowe. Co więcej, stosowane tam układy były projektowane głównie z myślą o urządzeniach konsumenckich, a nie o zaawansowanych obciążeniach AI, przez co nie są idealnie przystosowane do uruchamiania dużych modeli językowych, takich jak Gemini.

W obliczu planowanej premiery bardziej zaawansowanej wersji Siri jeszcze w tym roku Apple chce zabezpieczyć się na wypadek gwałtownego wzrostu wykorzystania funkcji AI na swoich urządzeniach. To właśnie dlatego firma rozważa scenariusz, w którym Siri oparta na Gemini działałaby bezpośrednio na serwerach Google, zapewniając odpowiednią wydajność i skalowalność.