Google Cloud Platform (GCP) secara resmi memperkenalkan unit pemrosesan tensor atau tensor processing units (TPU) generasi kedelapan terbaru untuk memperkuat infrastruktur kecerdasan artifisial (AI).
Dilansir dari Teknologi, raksasa teknologi ini membagi lini cip kustom tersebut menjadi dua spesifikasi fungsional yang berbeda, yaitu varian TPU 8t dan TPU 8i.
Varian TPU 8t dirancang khusus untuk memenuhi kebutuhan pelatihan model, sementara TPU 8i difokuskan untuk menangani kebutuhan inferensi atau penggunaan model secara langsung.
Langkah peluncuran perangkat keras terbaru ini bertujuan menyediakan kapasitas komputasi yang jauh lebih besar bagi para pelanggan korporasi di seluruh dunia.
Inovasi ini dipandang krusial bagi pelaku usaha yang saat ini membutuhkan infrastruktur AI dengan efisiensi operasional tinggi namun memiliki konsumsi energi yang rendah.
Google mengklaim bahwa TPU generasi kedelapan miliknya mampu memberikan kecepatan pelatihan model AI hingga tiga kali lipat lebih cepat dibandingkan dengan generasi terdahulu.
Selain faktor kecepatan, aspek ekonomis juga menjadi keunggulan utama karena efisiensi kinerja per dolar yang ditawarkan meningkat sebesar 80% dibandingkan versi sebelumnya.
Pihak Google Cloud turut menyebutkan bahwa satu klaster tunggal saat ini memiliki kemampuan untuk menjalankan lebih dari satu juta unit TPU secara bersamaan.
Skalabilitas yang masif ini memungkinkan para pengembang untuk membangun model AI tingkat lanjut atau frontier model secara lebih terintegrasi dan berskala besar.
Spesifikasi Teknis TPU 8i dan TPU 8t
Secara teknis, TPU 8i dioptimalkan untuk menangani beban kerja inferensi, yaitu proses pengolahan data yang terjadi sesaat setelah pengguna memasukkan instruksi atau prompt.
Varian ini menargetkan efisiensi daya atau performance-per-watt yang signifikan guna mendukung distribusi model AI pada tahap produksi skala industri.
Arsitektur pada TPU 8i menyertakan penyempurnaan pada dukungan sparsity serta unit perkalian matriks yang disesuaikan untuk pola inferensi umum pada model berbasis transformator.
Cip ini juga sudah mendukung berbagai format presisi teknis, termasuk operasi INT8 dan FP8 yang menjadi standar dalam penerapan AI komersial saat ini.
Sementara itu, TPU 8t difokuskan pada fase pengembangan model melalui penggunaan konfigurasi pod dalam skala besar untuk mempercepat proses training.
Fokus utama dari varian 8t adalah memangkas waktu proses pelatihan yang selama ini dikenal memakan durasi lama serta membutuhkan sumber daya komputasi yang sangat masif.
Strategi Kolaborasi dengan Nvidia
Meski merilis cip kustom sendiri, Google Cloud menegaskan bahwa langkah ini bukan dimaksudkan untuk menggantikan posisi Nvidia di pasar infrastruktur global.
Google tetap memposisikan unit TPU mereka sebagai solusi pelengkap bagi sistem berbasis Nvidia yang telah tersedia dalam ekosistem infrastruktur cloud mereka.
Bahkan, Google Cloud menjanjikan ketersediaan cip terbaru dari Nvidia yang bernama "Vera Rubin" untuk para pelanggannya pada akhir tahun ini.
Analis pasar cip, Patrick Moorhead, mencatat bahwa dominasi Nvidia masih sangat kuat dengan nilai kapitalisasi pasar yang saat ini mendekati angka Rp86.500 triliun.
Meskipun perusahaan besar seperti Amazon dan Microsoft turut membangun cip AI sendiri, tingkat ketergantungan pasar terhadap ekosistem Nvidia dinilai tetap tinggi.
Selain perangkat keras, Google dan Nvidia juga menyepakati kerja sama strategis dalam pengembangan rekayasa jaringan komputer untuk meningkatkan efisiensi operasional.
Kedua perusahaan tengah memperkuat Falcon, sebuah teknologi jaringan berbasis perangkat lunak yang sebelumnya telah dirilis secara open source oleh Google pada 2023.
Melalui kehadiran TPU generasi kedelapan, Google Cloud berupaya memberikan fleksibilitas biaya yang lebih baik bagi pelaku usaha dalam persaingan infrastruktur AI global.