Jalapeño, chip kustom pertama OpenAI, menargetkan penerapan pusat data berskala gigawatt
OpenAI telah meluncurkan akselerator AI khusus pertamanya, yang disebut Jalapeño, menandai langkah perusahaan dalam desain chip untuk mengurangi biaya dan meningkatkan efisiensi dalam menjalankan model bahasa besar (LLM). Dikembangkan melalui kemitraan dengan Broadcom dan Celestica, chip ini dirancang khusus untuk inferensi AI — proses menghasilkan respons dari model AI terlatih. OpenAI mengatakan pengujian awal menunjukkan Jalapeño memberikan kinerja per watt yang jauh lebih baik dibandingkan akselerator AI tercanggih saat ini, meskipun tolok ukur terperinci akan dirilis kemudian. Pengumuman ini memperluas upaya OpenAI untuk mengontrol lebih banyak infrastruktur di balik produknya. Selain membangun model dan aplikasi seperti ChatGPT dan Codex, perusahaan kini merancang perangkat keras yang mendukungnya. Sampel teknik Jalapeño sudah menjalankan beban kerja pembelajaran mesin di laboratorium, termasuk GPT-5.3-Codex-Spark, pada frekuensi target produksi dan tingkat daya, menurut perusahaan. Chip khusus, AI lebih cepat Tidak seperti akselerator AI tujuan umum yang disesuaikan untuk berbagai beban kerja, Jalapeño dibuat khusus untuk inferensi LLM. OpenAI mengatakan arsitekturnya dirancang berdasarkan kebutuhan komputasi, memori, jaringan, dan penyajian model AI modern. Perusahaan mengklaim chip tersebut mengurangi pergerakan data sekaligus menyeimbangkan sumber daya komputasi, memori, dan jaringan untuk meningkatkan pemanfaatan perangkat keras. Broadcom menyumbangkan implementasi silikon dan teknologi jaringan, termasuk platform jaringan Tomahawk-nya. “Jalapeño adalah bagian dari strategi infrastruktur full-stack jangka panjang kami untuk menjadikan komputasi lebih melimpah, sehingga menghasilkan AI yang lebih cepat, lebih andal, lebih terjangkau bagi masyarakat dan bisnis, serta dapat digunakan untuk memecahkan masalah yang lebih penting,” kata Greg Brockman, Presiden dan Salah Satu Pendiri OpenAI. Richard Ho, yang memimpin program perangkat keras OpenAI, mengatakan akselerator dioptimalkan pada beban kerja yang paling penting untuk sistem AI terdepan. “Berdasarkan pengujian awal, Jalapeño akan secara efisien menjalankan beban kerja terpenting kami mendekati batas teoritis perangkat keras,” kata Ho. Chip ini juga dimaksudkan untuk mendukung LLM masa depan di industri AI yang lebih luas, bukan hanya model OpenAI sendiri. Sprint desain sembilan bulan Menurut perusahaan, Jalapeño dikembangkan dari desain awal hingga pembuatan tape-out hanya dalam waktu sembilan bulan. OpenAI menggambarkan upaya ini sebagai siklus pengembangan ASIC tercepat yang dicapai untuk semikonduktor canggih berkinerja tinggi. Proses pengembangan melibatkan desain bersama perangkat lunak-perangkat keras yang ekstensif antara insinyur OpenAI dan Broadcom. OpenAI juga mengatakan model AI miliknya digunakan untuk mempercepat sebagian desain chip dan alur kerja pengoptimalan. “Kolaborasi kami dengan OpenAI mewakili komitmen mendasar untuk meningkatkan infrastruktur fisik yang diperlukan untuk AI dekade berikutnya,” kata Hock Tan, Presiden dan CEO Broadcom. Perusahaan berencana untuk menerapkan akselerator di pusat data berskala gigawatt mulai tahun 2026. Jalapeño adalah produk pertama yang digambarkan OpenAI sebagai platform komputasi multi-generasi yang akan menggabungkan akselerator rancangan OpenAI dengan teknologi jaringan dan konektivitas Broadcom serta keahlian integrasi sistem Celestica. OpenAI mengatakan peningkatan efisiensi inferensi dapat menghasilkan respons ChatGPT yang lebih cepat, biaya pengoperasian AI yang lebih rendah, dan akses yang lebih andal ke layanan AI tingkat lanjut seiring dengan meningkatnya permintaan.
Diterbitkan : 2026-06-24 17:40:00
sumber : interestingengineering.com



