Dell Technologies mengubah standar evaluasi infrastruktur teknologi perusahaan dengan mengalihkan fokus utama pada efisiensi operasional nyata melalui metrik baru. Langkah tersebut diumumkan dalam gelaran Dell Technologies World 2026 di Las Vegas, sebagaimana dilansir dari Media Indonesia.
Pergeseran ini tidak lagi sekadar menghitung jumlah GPU atau membandingkan penggunaan cloud versus on-premise. Pengenalan dua metrik krusial, yaitu Time to Token dan Cost per Token, bertujuan memastikan investasi kecerdasan buatan memberikan hasil terukur bagi organisasi.
Time to Token mengukur kecepatan sistem memproses permintaan, sedangkan Cost per Token menghitung biaya produksi output AI dalam skala besar. Berdasarkan data internal, sebanyak 88 persen organisasi saat ini menjalankan minimal satu beban kerja AI secara lokal atau on-premise.
Untuk mendukung kebutuhan pasar tersebut, perusahaan meluncurkan Deskside Agentic AI yang memanfaatkan workstation Precision. Konfigurasi ini diklaim mampu mencapai titik impas dibandingkan biaya API cloud publik dalam waktu tiga bulan.
Peningkatan efisiensi juga didukung oleh peluncuran mesin orkestrasi data baru pada Platform Data AI Dell. Inovasi ini dirancang khusus untuk mengatasi kendala silo data yang kerap menghambat jalannya produksi AI perusahaan.
| Kategori Performa | Peningkatan (vs Generasi Sebelumnya) |
|---|---|
| Pengindeksan Vektor | 12x Lebih Cepat |
| Kueri Data | 6x Lebih Cepat |
| Time to First Token | 19x Lebih Cepat |
Tercatat sebanyak 5.000 pelanggan korporasi kini telah menjalankan beban kerja produksi di Pabrik AI Dell yang ditenagai oleh platform NVIDIA. Jumlah tersebut menunjukkan lonjakan masif yang terjadi dalam kurun waktu dua tahun terakhir.
Ekosistem terbuka terus diperluas melalui kolaborasi strategis bersama raksasa industri seperti Google, OpenAI, dan Hugging Face. Google menjalankan Gemini 3 Flash pada server Dell PowerEdge XE9780 via Google Distributed Cloud.
Sementara itu, OpenAI mengintegrasikan Codex dengan Platform Data AI Dell untuk kebutuhan pengkodean agen internal. Hugging Face juga menyediakan akses lokal ke model open-weight seperti DeepSeek-V4 dan GLM 5.1 pada infrastruktur ini.
Kerja sama dengan NVIDIA mencakup dukungan untuk GPU Blackwell dan arsitektur pendingin cair C7000 guna menopang platform Vera Rubin NVL72. Kini tantangan bagi CIO bergeser pada pengelolaan lapisan keamanan tempat agen AI beroperasi demi menjaga otonomi mesin tetap terkendali.