David Silver: Mengapa AI Superintelligence Harus Berkembang Lewat Reinforcement Learning
David Silver dikenal sebagai sosok di balik terobosan besar dalam dunia kecerdasan buatan (AI) ketika pada 2016 ia meluncurkan AlphaGo, program AI yang mengalahkan manusia dalam permainan Go yang sangat kompleks. Kini, Silver memimpin perusahaan barunya, Ineffable Intelligence, yang berambisi mengembangkan superlearners atau AI superpintar yang mampu belajar dan berkembang tanpa batas menggunakan pendekatan reinforcement learning.
Perbedaan Pendekatan Ineffable Intelligence dengan AI Umum
Berbeda dengan kebanyakan perusahaan AI yang mengandalkan model bahasa besar (large language models/LLM) yang belajar dari data manusia, Silver yakin pendekatan tersebut memiliki batasan. Menurutnya, LLM hanya mengolah kecerdasan manusia yang sudah ada, ibarat menggunakan "bahan bakar fosil" yang akan habis.
“Data manusia itu ibarat bahan bakar fosil yang memberikan jalan pintas luar biasa. Sistem yang bisa belajar sendiri adalah bahan bakar terbarukan yang bisa terus belajar tanpa batas,” ujar Silver saat berbicara dengan WIRED dari kantornya di London.
Visi Ineffable Intelligence adalah menciptakan AI yang mampu menemukan ilmu pengetahuan, teknologi, bahkan sistem pemerintahan atau ekonomi baru secara mandiri, bukan hanya meniru atau mengulang apa yang sudah ada.
Sejarah dan Pendanaan Perusahaan
Silver berteman lama dengan Demis Hassabis, CEO Google DeepMind, yang juga merupakan sosok penting dalam pengembangan AlphaGo. Namun, Silver memutuskan keluar dari Google DeepMind untuk mengejar pendekatan yang lebih fokus pada reinforcement learning tanpa terikat proyek lain yang berorientasi pada LLM.
Perusahaannya, Ineffable Intelligence, telah berhasil mengumpulkan dana sebesar US$1,1 miliar dengan valuasi mencapai US$5,1 miliar, sebuah angka besar untuk standar startup AI di Eropa. Silver juga merekrut para peneliti top dari Google DeepMind dan laboratorium AI terkemuka lainnya.
Uniknya, Silver berkomitmen untuk mendonasikan seluruh keuntungan yang diperolehnya dari perusahaan ini kepada amal yang berdampak besar menyelamatkan nyawa manusia.
Fokus pada Reinforcement Learning dan Simulasi
Reinforcement learning adalah sebuah metode di mana AI belajar melalui trial and error, mirip cara manusia belajar dari pengalaman. Silver meyakini bahwa metode ini merupakan kunci sejati untuk menciptakan kecerdasan super dan telah lama menjadi fokus utama dalam kariernya. Pendekatan ini berbeda dengan LLM yang mengandalkan data teks manusia tanpa interaksi langsung dengan dunia nyata.
Silver menggambarkan keterbatasan LLM lewat eksperimen pikiran: bayangkan sebuah LLM yang dilepas di masa lalu ketika dunia masih percaya bumi datar. Tanpa kemampuan belajar mandiri dan berinteraksi langsung dengan lingkungan, model tersebut akan terus mempertahankan pandangan keliru tersebut.
Sebaliknya, AI yang belajar sendiri via simulasi dapat melakukan penemuan ilmiah mandiri. Ineffable Intelligence tengah mengembangkan simulasi kompleks yang memungkinkan agen AI belajar mencapai tujuan dan berkolaborasi satu sama lain dalam dunia virtual yang dikendalikan.
Keamanan dan Etika Pengembangan AI
Pengembangan AI superintelligence tentu menghadirkan risiko jika sistem tersebut mengadopsi solusi yang tidak sejalan dengan nilai atau kepentingan manusia. Silver percaya simulasi yang mereka gunakan bisa memantau bagaimana AI berinteraksi dengan agen lain, termasuk yang lebih sederhana, sehingga perilaku AI dapat dianalisis dan dikendalikan.
“Kita bisa melihat perilaku yang muncul dari sistem ini, memastikan ia bersikap ramah dan sesuai dengan tujuan yang kami inginkan,” kata Silver.
Menurut Ravi Mhatre, salah satu investor dari Lightspeed Ventures, pendekatan Silver berpotensi menghasilkan AI yang lebih aman karena tidak bergantung sepenuhnya pada data perilaku manusia yang mungkin bias. Fokus Silver adalah membangun sistem dengan tingkat kecerdasan tinggi yang tetap benign dan selaras dengan nilai manusia.
Analisis Redaksi
Menurut pandangan redaksi, langkah David Silver mendirikan Ineffable Intelligence menandai gelombang baru dalam pengembangan AI yang lebih ambisius namun juga lebih bertanggung jawab. Dengan menitikberatkan pada reinforcement learning dan simulasi, perusahaan ini berusaha membangun AI yang benar-benar otonom dan mampu berinovasi sendiri, jauh dari pendekatan LLM yang kini dominan.
Hal ini penting karena saat ini banyak startup dan perusahaan besar berlomba mengembangkan AI superintelligence tanpa mempertimbangkan secara mendalam implikasi sosial dan etisnya. Pendekatan Silver yang juga mengutamakan transparansi dan donasi keuntungan untuk amal memberikan contoh bagaimana inovasi teknologi dapat bersinergi dengan tujuan kemanusiaan.
Ke depan, publik dan industri harus mengawasi perkembangan Ineffable Intelligence dan dampaknya terhadap ekosistem AI global. Jika sukses, metode ini bisa menjadi standar baru dalam menciptakan AI yang bukan hanya pintar, tapi juga bertanggung jawab dan berkelanjutan.
Untuk informasi lebih lengkap dan detail mengenai perjalanan dan visi David Silver, Anda dapat membaca artikel asli di WIRED.
What's Your Reaction?
Like
0
Dislike
0
Love
0
Funny
0
Angry
0
Sad
0
Wow
0