Model Fondasi baru Apple menjelaskan: AI pada perangkat, AI cloud, dan segala sesuatu di antaranya
Selama keynote WWDC26, Apple mengumumkan Apple Foundation Models (AFM) generasi ketiga, yang terdiri dari lima model, beberapa di antaranya lokal, beberapa di antaranya berbasis cloud, dan salah satunya ada di server Google yang menggunakan chip Nvidia. Berikut rincian cara kerjanya. Sedikit latar belakang Ketika Apple pertama kali mengumumkan model dasarnya pada tahun 2024, jajarannya mencakup model bahasa pada perangkat dengan sekitar 3 miliar parameter, dan “model bahasa berbasis server yang lebih besar yang tersedia dengan Private Cloud Compute dan berjalan di server silikon Apple,” seperti yang diungkapkan perusahaan pada saat itu. Private Cloud Compute merupakan upaya yang ambisius, karena bertujuan untuk menghadirkan kemampuan AI berbasis cloud sekaligus menjaga jaminan privasi yang diharapkan pengguna dari pemrosesan di perangkat. Oleh karena itu, menyimpan segala sesuatunya di rumah sangatlah penting. Private Cloud Compute dijalankan di pusat data Apple, di server yang didukung oleh silikon Apple. Meski begitu, jaminan privasinya dapat diverifikasi secara independen oleh peneliti keamanan pihak ketiga. Namun, ketika Apple berjuang untuk mewujudkan aspirasi AI-nya, perusahaan tersebut bermitra dengan Google untuk menggunakan Gemini sebagai tulang punggung upaya AI barunya, yang hasilnya diumumkan awal pekan ini selama keynote WWDC26. Model dasar baru Apple AFM generasi ketiga mencakup lima model: AFM 3 Core dan AFM 3 Code Advanced, yang merupakan model pada perangkat, dan AFM Cloud, ADM 3 Cloud (Image), dan AFM 3 Cloud Pro, yang berbasis server. D di ADM 3 Cloud (Image) adalah singkatan dari difusi, sebuah teknologi yang telah kita bahas sebelumnya di sini. Kecuali AFM 3 Cloud Pro, semua model lainnya dibuat untuk berjalan di perangkat silikon Apple. Sementara itu, AFM 3 Cloud Pro berjalan pada GPU NVIDIA yang dihosting di Google Cloud. Hal ini dimungkinkan setelah Apple memperluas arsitektur Private Cloud Compute ke infrastruktur pihak ketiga untuk pertama kalinya, “sambil mempertahankan keamanan dan perlindungan privasi Apple yang kuat,” menurut perusahaan tersebut. Mengenai modelnya sendiri, berikut rincian masing-masing model, seperti yang dijelaskan oleh Apple: AFM 3 Core, generasi berikutnya dari model padat 3 miliar parameter kami yang memberikan peningkatan kualitas. AFM 3 Core Advanced, model pada perangkat kami yang paling kuat. Ini awalnya multimodal, memungkinkan fitur bermanfaat seperti suara ekspresif dan dikte dengan akurasi lebih tinggi. Dibangun berdasarkan penelitian Apple yang mutakhir, model dengan 20 miliar parameter ini menggunakan arsitektur sparse, hanya mengaktifkan 1 hingga 4 miliar parameter dalam satu waktu, bergantung pada permintaan. AFM 3 Core Advanced dibuka dan dioptimalkan untuk sistem silikon Apple kami yang paling mumpuni. AFM 3 Cloud, pekerja keras sisi server kami, dioptimalkan untuk kecepatan, efisiensi, dan kinerja. ADM 3 Cloud (Image), untuk pembuatan dan pengeditan gambar, yang membuka alat pengeditan foto tingkat lanjut, Image Playground yang sepenuhnya baru, dan banyak lagi. AFM 3 Cloud Pro, model berbasis server kami yang paling mumpuni, yang mendukung kasus penggunaan kami yang paling menuntut, seperti penggunaan alat agen dan penalaran yang kompleks. Yang menarik di sini adalah AFM 3 Core Advanced dan AFM 3 Cloud Pro. Dimulai dengan AFM 3 Core Advanced, ia mengemas 20 miliar parameter ke dalam model pada perangkat, dan ini merupakan prestasi yang luar biasa. Sebagian besar model pada perangkat yang ditujukan untuk masyarakat umum cenderung berada pada parameter miliaran digit yang rendah. Agar AFM 3 Core Advanced berjalan dengan baik, Apple menggunakan arsitektur sparse yang mengaktifkan hingga 4 miliar parameter sekaligus, bergantung pada permintaan, dibandingkan arsitektur padat yang harus menjaga 20 miliar parameter tetap aktif untuk setiap permintaan. Meskipun secara konseptual mirip dengan pendekatan Campuran Pakar, aktivasi selektif ini bergantung pada teknik yang ditemukan dan dirinci Apple dalam studi menarik Pemangkasan Mengikuti Instruksi untuk Model Bahasa Besar yang dirilis setahun yang lalu. Sedangkan untuk AFM 3 Cloud Pro ini yang berjalan pada infrastruktur eksternal. Anda dapat membaca beberapa detail teknis dari perluasan ini dalam artikel yang dipublikasikan di blog Keamanan Apple awal pekan ini, namun inilah bagian terpentingnya: Atas dasar ini, Apple dan Google berkolaborasi untuk membangun kemampuan yang jauh melampaui penerapan komputasi rahasia tradisional: Kami tidak hanya mengandalkan teknologi komputasi rahasia untuk memitigasi serangan yang memanfaatkan akses istimewa di luar VM rahasia, termasuk serangan saluran samping. Kami menganggap setiap komponen — mulai dari firmware hingga host dan tumpukan OS tamu hingga kode aplikasi — menjadi bagian dari basis komputasi tepercaya kami, tunduk pada transparansi kami yang dapat diverifikasi dan jaminan tanpa hak istimewa. Untuk memitigasi risiko serangan rantai pasokan, kami mengelola buku besar khusus tambahan yang dapat diverifikasi secara kriptografis untuk semua perangkat keras Google Cloud yang merupakan bagian dari armada PCC. Untuk komponen yang dapat disalahgunakan untuk mengambil data pengguna jika disusupi, pengesahan perangkat lunak kami berakar pada setidaknya dua akar kepercayaan terpisah dari vendor independen. Bahkan ketika diterapkan dengan komputasi rahasia, kami yakin tumpukan inferensi harus dirancang dengan privasi dan keamanan sejak awal. PCC di Google Cloud memanfaatkan banyak pola keamanan arsitektur yang sama seperti PCC pada silikon Apple untuk menerapkan perlindungan berlapis ini: penguraian data jaringan awal untuk setiap permintaan terjadi dalam proses khusus dalam namespace-nya sendiri, perangkat lunak inferensi bersama didaur ulang dengan durasi time-to-live yang singkat, dan kunci yang dibuktikan disimpan dalam VM rahasia terpisah dan khusus yang diisolasi dari input eksternal. Dalam blog Machine Learning Research-nya, Apple mengatakan bahwa kelima model tersebut “memiliki fondasi awal yang sama sebelum mengkhususkan diri pada arsitektur dan kasus penggunaannya masing-masing, menambahkan kemampuan multimodal seperti audio, pemahaman gambar, penalaran konteks panjang, dan pembuatan visual berkualitas tinggi.” Perusahaan menambahkan bahwa, untuk melatih model ini, mereka menggunakan “campuran data yang mencakup informasi yang tersedia untuk umum, data yang dilisensikan atau dibeli dari pihak ketiga, data sumber terbuka, data yang diperoleh melalui studi khusus, dan data sintetis.” Apple juga menekankan bahwa proses pelatihan tidak menyertakan data atau interaksi pengguna dan penerbit web dapat memilih untuk tidak mengikuti pelatihan model dasar. Hasilnya, menurut Apple, telah melakukan evaluasi manusia secara ekstensif terhadap model dasar generasi ketiga, dengan peninjau internal yang menilai tanggapan berdasarkan kategori seperti mengikuti instruksi, kebenaran, presentasi, dan pemahaman gambar. Model dievaluasi dibandingkan model pendahulunya (bila berlaku), dan Anda dapat melihat beberapa hasilnya di bawah: Sebagian dari respons pilihan dalam evaluasi manusia secara berdampingan terhadap kemampuan teks umum, membandingkan AFM 3 Core dan AFM 3 Cloud dengan model generasi sebelumnya. Hasilnya disajikan di empat kelompok lokal yang berbeda untuk menunjukkan kinerja yang konsisten di seluruh varian internasional. “Bahasa Inggris” mewakili kumpulan evaluasi bahasa Inggris global kami, sementara “PFIGSCJK”, “DNNSTV” dan “AFIHHMPRTU” mewakili bahasa lokal global kami yang masih didukung. Sebagian dari tanggapan pilihan dalam evaluasi manusia secara berdampingan terhadap kemampuan pemahaman gambar dalam bahasa Inggris. Hasilnya membandingkan AFM 3 Core dan AFM 3 Cloud dengan pendahulunya pada tahun 2025. Sebagian kecil respons pilihan dalam evaluasi manusia secara berdampingan untuk tugas dikte. Hasilnya membandingkan AFM 3 Core Advanced dengan sistem dikte produksi Apple yang sudah ada dalam tujuh dimensi kualitas. AFM 3 Core Advanced menunjukkan tingkat kemenangan positif dalam kualitas keseluruhan, dengan preferensi diperluas secara konsisten di semua dimensi pemformatan dan pemahaman individu. Untuk mengetahui lebih dalam tentang Apple Foundation Model generasi ketiga, ikuti tautan ini. Layak untuk dicoba di Amazon FTC: Kami menggunakan tautan afiliasi otomatis yang menghasilkan pendapatan. Lagi.
Diterbitkan : 2026-06-12 02:27:00
sumber : 9to5mac.com



