İsmini X olarak değiştiren ancak bizim ona hala Twitter olarak hitap etmeyi tercih ettiğimiz sosyal medya platformu, yeni yapay zeka modelini yayınladı. Grok 3 adını verdikleri model, şu anda Twitter Premium+ üyeleri tarafından kullanılabiliyor. Ya da lmarena gibi sitelerden ücretsiz bir şekilde test edebilirsiniz. Biz de öyle yaptık, popüler üç yapay zeka modelinden websitemiz için Chrome’un dinozor oyunu gibi bir endless runner yapmasını istedik.
İşte sonuçlar:
GPT-4o
Aralarında şaşırtıcı derecede kötü olan GPT’den geldi. Şahsen bu kadar kötü bir şey yapmasını beklemiyordum. Bu adresten kendiniz test edebilirsiniz. Boşluk tuşuna bastığınızda çalışıyor.
Claude 3.5 Sonnet
Şahsen benim favorim Claude’tu. En iyi sonucun Claude’tan geleceğini bekliyordum. Şu an yazıyı yazdığım siteyi geliştirirken de kendisinden sık sık yardım alıyorum. En oynanılabilir şeyi ortaya koydu kendisi. Görünüş olarak en iyisini yapmadı ancak en oynanılabilir olanı yaptı. Ayrıca oyunda yandığınızda “Restart” butonu çıkıyor ama çalışmıyor. Oyunu başlatmak için boşluk tuşuna basmanız gerekiyor. Bu adresten kendiniz test edebilirsiniz.
Grok 3
Bariz bir şekilde, Grok 3’ün yazdığı diğer ikisinden çok daha iyi görünüyor. Ancak biraz fazla zor ve imkansız bir oyun olmuş. Çok çabuk yanıyorsunuz, düşmanlar dengeli gelmiyor. Ayrıca “Boşluk tuşu veya dokunarak zıpla” yazıyor ancak sadece boşluk tuşu çalışıyor. Bu adresten kendiniz test edebilirsiniz.
Sonuç
En doğru kodu Grok 3 yazdı ancak bu çok da doğru bir karşılaştırma sayılmaz. Başka girdilerle, daha farklı sonuçlar alınabilir. Şu an LMArena gibi karşılaştırma sitelerine baktığımızda Grok’un en yüksek puanları aldığını görüyoruz.
Ek olarak, Grok’un bir önceki sürümü olan Grok 2’nin açık kaynak olacağı açıklandı. Güzel bir gelişme.