
Pada hari Selasa siang, Anthropic meluncurkan Claude Plays Pokémon di Twitch, siaran langsung model AI terbaru Anthropic, Claude 3.7 Sonnet, memainkan permainan Pokémon Red. Ini menjadi sebuah eksperimen yang menarik, memperlihatkan kemampuan teknologi AI saat ini dan reaksi orang terhadapnya.
Peneliti AI telah menggunakan berbagai macam permainan video, mulai dari Street Fighter hingga Pictionary, untuk menguji model-model baru - seringkali lebih untuk hiburan daripada kegunaan. Tetapi Anthropic mengatakan bahwa Pokémon terbukti menjadi patokan yang berguna untuk Claude 3.7 Sonnet, yang dapat efektif "berpikir" melalui teka-teki yang dihadapi dalam permainan.
Seperti o3-mini OpenAI dan R1 DeepSeek, Claude 3.7 Sonnet dapat "menganalisis" jalannya melalui tantangan-tantangan sulit, seperti memainkan permainan video yang dirancang untuk anak-anak. Sementara pendahulu model non-analisisnya, Claude 3.5 Sonnet, gagal di awal permainan Pokémon Red - keluar dari rumah pemain di Pallet Town - Claude 3.7 Sonnet berhasil memenangkan tiga lencana pemimpin gym.

Claude yang terbaru masih mengalami kesulitan, namun. Beberapa jam setelah dimulainya siaran Twitch, model ini dipatahkan oleh sebuah tembok batu, yang tidak bisa dilewati olehnya meskipun berusaha sekuat tenaga.
Satu pengguna Twitch merangkum situasinya dengan cara ini: "siapa yang akan menang, AI komputer dengan ribuan jam yang dihabiskan untuk memprogramnya, atau 1 tembok batu?"
Akhirnya, Claude menyadari bahwa ia dapat mengelilingi tembok tersebut.
Pada satu sisi, menyebalkan untuk menonton Claude menjelajahi Pokémon Red dengan kecepatan Slowpoke, menganalisis setiap langkah dengan pertimbangan yang sangat teliti. Namun, ini juga agak menarik. Di bagian kiri siaran menunjukkan "proses berpikir" Claude, sementara di bagian kanan menunjukkan permainan secara real-time.
Pada satu titik, Claude mencoba mencari Professor Oak di dalam laboratoriumnya, namun bingung karena ada NPC lain dalam adegan tersebut.
"Saya perhatikan ada karakter baru yang muncul di bawah saya - seorang karakter dengan rambut hitam dan apa yang tampaknya menjadi mantel putih di koordinat (2, 10)," tulis Claude. "Ini mungkin Professor Oak! Ayo turun dan bicara dengannya."
Claude kemudian melanjutkan untuk dengan salah berbicara dengan NPC selain Professor - seorang NPC yang sudah beberapa kali diajak bicara oleh model ini sebelumnya. Beberapa dari ribuan orang di obrolan Twitch mulai gelisah. Orang lain, terutama yang sudah menonton siaran untuk lebih dari beberapa menit, kurang khawatir.
"Kalian tenang," tulis seseorang di obrolan. "Sebelum kita keluar dan masuk ke lab Oak seperti 10 kali sebelum memahami cara melanjutkannya."

Bagi pengguna Twitch yang sudah lama, format siaran Anthropic mungkin terasa nostalgis. Lebih dari satu dekade yang lalu, jutaan orang mencoba memainkan Pokémon Red sekaligus dalam sebuah eksperimen sosial online pertama kalinya yang disebut Twitch Plays Pokémon. Setiap pengguna bisa mengendalikan karakter pemain melalui obrolan Twitch, menghasilkan gameplay yang kacau seperti yang bisa ditebak.
Beberapa peneliti AI telah menyebut Twitch Plays Pokémon sebagai inspirasi untuk pekerjaan mereka. Pada Oktober 2023, insinyur perangkat lunak berbasis Seattle Peter Whidden mempublikasikan video YouTube yang memperinci bagaimana ia melatih algoritma pembelajaran penguatan untuk memainkan Pokémon. AI-nya menghabiskan lebih dari 50.000 jam untuk bermain game sebelum akhirnya dapat sukses menavigasinya. Salah satu tantangannya adalah bahwa AI lebih suka mengagumi pemandangan pixel daripada benar-benar memainkan game.
"Ggadangan" AI yang didukung "pementasan" Twitch Plays Pokémon seperti milik Whidden dan Anthropic bersifat menghibur, namun juga sedikit pahit pada saat yang bersamaan. Siaran asli tersebut menjadi momen penting dalam sejarah Twitch karena mengumpulkan orang dalam cara yang tidak terduga. Semua orang berada dalam satu tim, berjuang menuju tujuan agar karakter pemain berhenti berputar-putar dan benar-benar melanjutkan permainan.
Pada tahun 2025, tampaknya kita bukan lagi rekan setim, melainkan penonton, menonton sebuah model AI mencoba memainkan permainan yang banyak dari kita sudah menguasainya ketika kami berusia lima tahun. Ini adalah mikrokosmos AI yang didorong dari tren yang lebih besar: Pengalaman online kita bergerak dari kegiatan bersama, komunal menjadi lebih individual.