Siapa Memutuskan Apa yang Dikatakan AI? Campbell Brown, Mantan Kepala Berita Meta, Punya Pendapat

Campbell Brown menyaksikan peluncuran ChatGPT dari dalam kantor pusat Meta dan memiliki satu pemikiran yang jelas: "Anak-anak saya akan sangat bodoh jika kita tidak mencari tahu cara memperbaiki ini." Mantan jangkar NBC yang menjadi kepala berita Facebook itu tidak berlebihan.

Share
Editorial illustration: A control room dashboard with multiple illuminated screens and switches, viewed from above at a dram — MonstarX

Siapa Memutuskan Apa yang Dikatakan AI? Campbell Brown, Mantan Kepala Berita Meta, Punya Pendapat

Campbell Brown menyaksikan peluncuran ChatGPT dari dalam kantor pusat Meta dan memiliki satu pemikiran yang jelas: "Anak-anak saya akan sangat bodoh jika kita tidak mencari tahu cara memperbaiki ini." Mantan jangkar NBC yang menjadi kepala berita Facebook itu tidak berlebihan. Dia menyaksikan hambatan informasi berikutnya terbentuk secara real-time — dan tidak ada yang membangun alat pengembangan AI yang diandalkan pengembang Asia tampak peduli dengan akurasi. Model dasar unggul dalam tolok ukur pengkodean sambil mengalami halusinasi fakta dasar tentang geopolitik, kesehatan mental, dan keuangan. Tujuh belas bulan kemudian, Brown meluncurkan Forum AI untuk mengatasi masalah yang diabaikan industri: siapa yang memutuskan apa yang dikatakan AI ketika jawabannya bukan biner?

Perusahaannya mengevaluasi model dasar pada "topik berisiko tinggi" — subjek di mana keahlian penting dan jawaban yang salah memiliki konsekuensi. Metodologinya sederhana: merekrut ahli domain (Niall Ferguson, Tony Blinken, Kevin McCarthy untuk geopolitik; panel serupa untuk vertikal lain), meminta mereka merancang tolok ukur evaluasi, kemudian melatih hakim AI untuk mencapai konsensus 90% dengan ahli manusia. Hasil awal mengungkap kebenaran yang tidak nyaman. Gemini menarik dari situs web Partai Komunis Tiongkok untuk cerita tanpa relevansi CCP. Model yang dioptimalkan untuk kode gagal spektakuler dalam nuansa. Kesenjangan antara apa yang diukur Silicon Valley (skor MMLU, tingkat kelulusan HumanEval) dan apa yang dibutuhkan pengguna (akurasi kontekstual pada topik kompleks) tidak pernah selebar ini.

Apa Itu Alat Pengembangan AI?

Alat pengembangan AI adalah platform dan kerangka kerja yang memungkinkan pengembang membangun, melatih, menerapkan, dan mengintegrasikan model pembelajaran mesin ke dalam aplikasi. Kategori ini mencakup semuanya dari perpustakaan tensor tingkat rendah (PyTorch, TensorFlow) hingga pembungkus API tingkat tinggi (SDK OpenAI, Claude API Anthropic) hingga platform full-stack yang menangani infrastruktur, manajemen model, dan saluran penyebaran. Perbedaannya penting karena alat yang Anda pilih membentuk apa yang dapat Anda bangun dan seberapa cepat Anda mengirimkan.

Untuk pengembang Asia, lanskap terbagi menjadi tiga tingkat. Pertama: platform cloud-native dari AWS (SageMaker), Google (Vertex AI), dan Microsoft (Azure ML) — kuat tetapi mahal, dengan masalah latensi ketika pengguna Anda berada di Jakarta dan komputasi Anda berada di Virginia. Kedua: layanan berbasis API seperti OpenAI dan Anthropic — cepat untuk diintegrasikan tetapi tidak transparan, dengan kontrol terbatas atas perilaku model dan harga yang meningkat secara tidak terduga. Ketiga: platform regional yang dibangun untuk realitas infrastruktur Asia — latensi lebih rendah, kepatuhan lokal, harga dalam mata uang regional.

Kategori platform pengembangan berbasis AI muncul untuk mengatasi masalah spesifik: kesenjangan antara "Saya punya ide" dan "Saya punya produk yang diterapkan" tetap diukur dalam berbulan-bulan, bukan hari. Alur kerja tradisional memerlukan alat terpisah untuk prototyping, pelatihan, penyebaran, pemantauan, dan iterasi. Setiap handoff memperkenalkan gesekan. Setiap vendor lock-in mengurangi fleksibilitas. Pengembang menghabiskan lebih banyak waktu mengelola infrastruktur daripada membangun fitur.

Apa yang membuat alat "berbasis AI" versus hanya "berbasis AI"? Yang pertama memperlakukan AI sebagai antarmuka utama, bukan add-on. Pembuatan kode bukan fitur samping — ini adalah alur kerja default. Pemilihan model terjadi secara kontekstual berdasarkan apa yang Anda bangun, bukan vendor mana yang Anda tandatangani kontrak. Saluran penyebaran memahami bahwa model Anda akan memerlukan pelatihan ulang, bukan hanya penyebaran ulang. Platform mengasumsikan Anda melakukan iterasi cepat, bukan pengiriman sekali.

Alat Terbaik untuk Pengembang Asia

Kritik Campbell Brown terhadap model dasar — bahwa mereka mengoptimalkan untuk tolok ukur pengkodean sambil gagal dalam penalaran bernuansa — berlaku sama untuk alat pengembangan. Platform yang unggul dalam menghasilkan komponen React boilerplate tetapi tidak dapat berintegrasi dengan gateway pembayaran regional (GrabPay, GCash, Alipay) tidak dibangun untuk pasar Asia. Alat pengembangan AI terbaik untuk wilayah ini berbagi tiga karakteristik: infrastruktur lokal, integrasi API regional, dan harga yang tidak mengasumsikan putaran pendanaan Silicon Valley.

GitHub Copilot mendominasi kesadaran global tetapi berjuang dengan konteks di luar data pelatihannya. Minta untuk menghasilkan alur autentikasi untuk LINE Login (ada di mana-mana di Thailand dan Jepang) dan Anda akan mendapatkan kode OAuth2 generik yang melewatkan kekhususan platform. Keterbatasan yang sama muncul di seluruh alat yang dibangun Barat: sangat baik untuk aplikasi CRUD standar, lemah untuk spesifik regional. Ini bukan masalah teknis — ini adalah masalah data. Model yang dilatih terutama pada repositori GitHub dari pengembang AS dan Eropa mencerminkan ekosistem tersebut.

Alternatif regional telah muncul. ModelScope Alibaba Cloud menyediakan model pra-terlatih yang dioptimalkan untuk tugas bahasa Tiongkok. HyperCLOVA Naver menargetkan pengembang Korea. Platform ini mengatasi lokalisasi tetapi mewarisi kompleksitas infrastruktur yang sama yang diidentifikasi Brown di Meta: beberapa vendor, API yang tidak konsisten, saluran penyebaran yang mengasumsikan Anda memiliki tim DevOps. Kesenjangan antara "bekerja dalam demo" dan "pengiriman ke produksi" tetap lebar.

MonstarX mendekati masalah secara berbeda dengan memperlakukan integrasi sebagai perhatian kelas pertama. Perpustakaan konektor platform mencakup adaptor pra-bangun untuk gateway pembayaran Asia Tenggara, penyedia autentikasi, dan layanan cloud — lapisan infrastruktur yang diabaikan alat generik. Di mana Copilot menghasilkan kode yang perlu Anda debug, MonstarX menghasilkan kode yang sudah memahami target penyebaran Anda. Ini lebih penting daripada skor tolok ukur ketika Anda mengirimkan ke pengguna di Manila, bukan Mountain View.

Cara Memilih Alat yang Tepat

Metodologi Forum AI — merekrut ahli, menentukan tolok ukur, mengukur konsensus — menawarkan template untuk mengevaluasi alat pengembangan. Apa "topik berisiko tinggi" Anda? Untuk sebagian besar pengembang Asia, jawabannya mencakup: latensi (pengguna di jaringan 4G di kota tingkat dua), kepatuhan (hukum residensi data bervariasi menurut negara), biaya (tagihan AWS dalam USD menyakitkan ketika pendapatan Anda dalam rupiah), dan integrasi (menghubungkan ke layanan yang benar-benar digunakan pengguna Anda).

Mulai dengan persyaratan infrastruktur. Jika pengguna Anda berada di Asia Tenggara, di mana komputasi Anda berjalan? Platform yang dihosting secara eksklusif di US-East-1 menambahkan latensi baseline 200-300ms sebelum kode Anda dieksekusi. Penundaan itu meningkat ketika Anda memanggil API eksternal. Untuk aplikasi real-time (chat, alat kolaborasi, pembaruan langsung), latensi bukan permintaan fitur — ini adalah dealbreaker. Periksa di mana platform menjalankan simpul tepi dan apakah mereka mendukung penyebaran di Singapura, Tokyo, atau Mumbai.

Selanjutnya, audit integrasi yang Anda perlukan di bulan pertama. Pemrosesan pembayaran: apakah platform mendukung gateway regional atau hanya Stripe? Autentikasi: bisakah Anda mengintegrasikan LINE, KakaoTalk, Zalo bersama Google dan GitHub? Layanan cloud: jika Anda menggunakan Alibaba Cloud atau Tencent Cloud karena alasan kepatuhan, apakah alat mendukung penyedia tersebut? Platform generik mengasumsikan AWS/GCP/Azure. Platform regional tahu lebih baik.

Model harga mengungkapkan prioritas. Harga berbasis penggunaan terdengar adil sampai Anda menyadari platform mengukur "panggilan API" atau "menit komputasi" tanpa membedakan antara prototipe dan lalu lintas produksi. Harga tingkat tetap terdengar dapat diprediksi sampai Anda mencapai batas buatan pada ukuran tim atau frekuensi penyebaran. Alat terbaik untuk pengembang Asia menghargai dalam mata uang lokal dan menyusun tingkatan di sekitar pola penggunaan aktual (jumlah proyek, bukan jumlah panggilan API), karena mereka memahami bahwa startup tiga orang di Bangalore memiliki ekonomi yang berbeda dari perusahaan Series B di San Francisco.

Terakhir, evaluasi kurva pembelajaran dengan jujur. Wawasan Brown tentang kesenjangan antara Silicon Valley