Dalam algoritma reinforcement learning, ada sistem yang ditata supaya bisa belajar sendiri dengan cara interaksi aktif dengan lingkungannya. Semua feedback yang ada, dijadikan bahan untuk peningkatan performa. Algoritma inilah yang menjadi dasar kerja AI
Diantara produk AI yang sudah sangat dikenal adalah AlphaGo.
Program komputer buatan Google untuk memainkan Go. Go sendiri adalah Catur Cina yang dianggap permainan paling rumit di dunia. Dalam konteks ChatGPT sendiri, mungkin AlphaGo inilah yang bisa kita jadikan bahan perbandingan.
Setelah melanjutkan projek AlphaGo, Google beberapa kali menghadapkan produk AI ini melawan Master Go. Awalnya, AlphaGo kerap dikalahkan. Namun seiring waktu, AlphaGo bisa mengalahkan manusia.
Diantaranya mengalahkan Lee Se-Dol dari Korea Selatan. AlphaGo menang di tiga ronde pertama dari lima ronde yang direncanakan. Puncaknya adalah ketika mengalahkan Juara Dunia Go dari Cina, Ke-Jie.
Meski menang tipis, AlphaGo menang di ronde pertama dari tiga ronde yang dijadwalkan. Menurut Jie, sebelumnya cara berpikir AlphaGo masih seperti manusia. Namun sekarang, AlphaGo sudah seperti Dewa.