AlphaGo dan Permainan Go: Awal Ledakan Kecerdasan Buatan Modern
Pada tahun 2015, Thore Graepel mungkin menjadi manusia pertama yang dikalahkan oleh kecerdasan super buatan. Di hari pertamanya sebagai peneliti di Google DeepMind, ia ditantang bermain melawan versi awal AlphaGo—program komputer yang dikembangkan oleh DeepMind untuk bermain permainan kuno Cina bernama weiqi atau Go. Program ini terbukti sangat efektif sehingga tidak hanya mengubah cara manusia bermain Go, tetapi juga mengguncang dunia kecerdasan buatan (AI) secara keseluruhan.
Ketika Graepel menghadapi AlphaGo, proyek ini masih dalam tahap "bayi", menurut pengakuannya. Meski dirinya adalah pemain amatir yang cukup mahir, ia tetap kalah. Setahun kemudian, AlphaGo yang sudah matang menaklukkan sejumlah juara dunia, termasuk Lee Sedol—pemain terbaik dunia saat itu—dengan skor 4-1. Bulan ini menandai ulang tahun ke-10 kemenangan legendaris AlphaGo tersebut.
Kenapa Go Jadi Tantangan Besar untuk AI?
Selama puluhan tahun, membuat program yang bisa bermain Go di level elit dianggap tantangan sulit dalam ilmu komputer. Banyak yang menganggapnya hampir mustahil, bahkan jauh lebih sulit dibandingkan membuat program catur yang sudah dikalahkan oleh DeepBlue pada 1997. Alasannya terletak pada kompleksitas Go yang luar biasa: papan Go berukuran 19x19 dengan batu yang bisa ditempatkan di mana saja, menghasilkan jumlah kemungkinan posisi yang lebih banyak dari jumlah atom di alam semesta yang bisa diamati.
Sementara catur memiliki aturan gerakan yang ketat dan jumlah kemungkinan lebih kecil, Go menawarkan kebebasan yang sangat besar, sehingga algoritma tradisional kesulitan menghadapi kompleksitas ini. Namun, teknik dan kerangka kerja yang dikembangkan untuk AlphaGo kini menjadi dasar bagi model AI canggih yang mampu menulis kode, memecahkan masalah matematika terbuka, bahkan meniru penemuan ilmiah dari awal.
Warisan AlphaGo dalam Ledakan AI Generatif
AI generatif saat ini masih hidup di bawah bayang-bayang AlphaGo. Pushmeet Kohli, Wakil Presiden Ilmu Pengetahuan dan Inisiatif Strategis Google DeepMind, mengungkapkan bahwa konsep-konsep yang muncul dari pengalaman AlphaGo telah menjadi bagian dari kosakata AI modern. Permainan Go dan catur menjadi model ideal untuk memahami bagaimana ledakan AI berkembang dan apa yang mungkin terjadi selanjutnya.
Inovasi DeepMind utama adalah menggabungkan dua algoritma: satu model untuk mengusulkan langkah, dan model kedua untuk mengevaluasi apakah langkah tersebut baik. Strategi ini memungkinkan sistem mengalokasikan sumber daya komputasi secara efisien untuk merencanakan rangkaian langkah yang paling mungkin membawa kemenangan. AlphaGo kemudian bermain melawan dirinya sendiri ribuan kali, meningkatkan kemampuannya melalui pembelajaran penguatan.
Konsep serupa juga diterapkan pada model bahasa besar seperti ChatGPT, yang awalnya bisa membuat kalimat yang lancar namun kesulitan pada tugas kompleks. Pada akhir 2024, muncul model penalaran yang berfungsi seperti AlphaGo, yakni menyelesaikan masalah secara bertahap dan mengevaluasi jawaban sambil belajar dari kesalahan menggunakan pembelajaran penguatan. Menurut peneliti OpenAI, Noam Brown, pendekatan ini mengejutkan mirip dengan metode AlphaGo.
Langkah-Langkah Penting dalam Evolusi AI dari AlphaGo
- Penggabungan dua model AI untuk mengusulkan dan menilai langkah secara bersamaan.
- Pelatihan melalui self-play alias bermain melawan diri sendiri untuk memperbaiki kesalahan secara bertahap.
- Skalabilitas waktu komputasi untuk menyelesaikan masalah lebih kompleks dengan lebih banyak perhitungan, mirip manusia yang butuh waktu lebih lama untuk soal sulit.
- Pengembangan AlphaZero yang dapat belajar tanpa data awal dari manusia, mengalahkan manusia di beberapa permainan hanya dengan self-play.
Meski AlphaZero menunjukkan AI bisa belajar mandiri dengan cepat, tantangan berikutnya lebih besar: bagaimana mengembangkan kecerdasan umum yang mampu bekerja di lingkungan yang tidak terstruktur dan beragam, berbeda dengan aturan ketat permainan papan. Kohli menjelaskan, sistem AI saat ini masih beroperasi dalam domain yang terbatas dan terukur, seperti memverifikasi program komputer atau bukti matematika.
Analisis Redaksi
Menurut pandangan redaksi, keberhasilan AlphaGo bukan hanya tonggak sejarah dalam permainan Go, tapi juga fondasi revolusi AI yang tengah berlangsung. Namun, kita perlu menyadari bahwa AI tidak otomatis bisa mengatasi segala tantangan kompleks di dunia nyata karena keterbatasan dalam mengukur keberhasilan dan umpan balik yang jelas seperti dalam permainan papan.
Lebih jauh, AlphaGo dan penerusnya mengajarkan bahwa AI terbaik adalah yang dapat berkolaborasi dengan manusia, bukan menggantikan sepenuhnya. Seperti strategi baru dalam Go yang menginspirasi kreativitas manusia, AI modern justru membuka jalan bagi inovasi baru dalam sains dan teknologi yang sebelumnya sulit dibayangkan.
Namun, ada risiko jika AI dipandang sebagai alat otomatisasi tanpa mempertimbangkan proses belajar manusia yang esensial. Seperti pemain Go yang menjadi juara melalui kegagalan dan latihan, manusia juga harus terus belajar dan berkembang, bukan hanya bergantung pada AI. Masa depan AI harus memadukan kecanggihan teknologi dengan nilai-nilai kemanusiaan agar manfaatnya maksimal dan berkelanjutan.
Pembaca disarankan untuk terus mengikuti perkembangan AI dan bagaimana teknologi ini berdampak pada berbagai bidang, dari ekonomi hingga kehidupan sehari-hari. Sebagaimana permainan Go mengajarkan strategi dan kesabaran, AI juga menuntut kita untuk bijak dan adaptif menghadapi perubahan yang cepat.
Untuk informasi lebih lengkap, Anda dapat membaca artikel asli di The Atlantic dan mengikuti berita terkini dari sumber terpercaya seperti CNN Indonesia.
What's Your Reaction?
Like
0
Dislike
0
Love
0
Funny
0
Angry
0
Sad
0
Wow
0