Japon teknoloji ve yatırım devi SoftBank, yapay zekâ veri merkezleri için özel olarak geliştirdiği yeni yazılım yığını Infrinia AI Cloud OS’u duyurdu. Şirketin Infrinia ekibi tarafından tasarlanan platform, GPU tabanlı bulut hizmetlerini daha hızlı, verimli ve ölçeklenebilir hale getirmeyi hedefliyor.

Yeni sistem, veri merkezi operatörlerinin çok kiracılı (multi-tenant) ortamlarda Kubernetes-as-a-Service (KaaS) ve Inference-as-a-Service (Inf-aaS) sunmasına olanak tanıyor. Böylece müşteriler, büyük dil modellerine (LLM) basit API’ler aracılığıyla erişebiliyor ve bu hizmetler mevcut GPU bulut altyapılarına kolayca entegre edilebiliyor.

Küresel GPU Talebine Yanıt
Bilimden robotik uygulamalara, üretken yapay zekâdan kurumsal çözümlere kadar birçok alanda GPU destekli yapay zekâya olan talep hızla artıyor. Bu durum, GPU bulut sağlayıcıları üzerinde hem performans hem de maliyet baskısı oluşturuyor.

SoftBank’a göre Infrinia AI Cloud OS, kurum içinde geliştirilen özel çözümlere kıyasla toplam sahip olma maliyetini (TCO) düşürmeyi ve operasyonel karmaşıklığı azaltmayı hedefliyor. Platform; model eğitimi, dağıtımı ve gerçek zamanlı çıkarım dahil olmak üzere yapay zekâ yaşam döngüsünün tüm aşamalarını destekliyor.

Şirket, çözümü ilk etapta kendi GPU bulut hizmetlerinde kullanacak, ardından yurt dışındaki veri merkezlerine ve bulut platformlarına sunmayı planlıyor.

Otomasyon ve Performans Odaklı Tasarım
Infrinia AI Cloud OS, altyapının tüm katmanlarını – sunucu ayarlarından depolama, ağ ve Kubernetes yapılandırmasına kadar – otomatikleştirebiliyor. GPU kümeleri, farklı iş yüklerine göre hızlı şekilde oluşturulup yeniden yapılandırılabiliyor.

Sistem ayrıca NVIDIA NVLink alanlarına göre otomatik düğüm tahsisi yaparak GPU’lar arası bant genişliğini optimize ediyor ve gecikmeleri azaltıyor. Inf-aaS bileşeni ise kullanıcıların çıkarım (inference) iş yüklerini yönetilen servisler üzerinden kolayca devreye almasını sağlıyor.

SoftBank, Infrinia AI Cloud OS ile GPU tabanlı yapay zekâ altyapısının küresel ölçekte daha hızlı benimsenmesini hedefliyor. Platform, hem yüksek performanslı eğitim ortamları hem de uygun maliyetli çıkarım çözümleri arayan kurumlara hitap edecek şekilde konumlandırılıyor.