Elon Musk, Yeni Yapay Zekası Grok 3'ü Yayınladı! Test Ettik | Goygoy Engine
https://cdn.goygoyengine.com/images/1739869742297-c39e12ecf165fa65.png

Elon Musk, Yeni Yapay Zekası Grok 3'ü Yayınladı! Test Ettik

İsmini X olarak değiştiren ancak bizim ona hala Twitter olarak hitap etmeyi tercih ettiğimiz sosyal medya platformu, yeni yapay zeka modelini yayınladı. Grok 3 adını verdikleri model, şu anda Twitter Premium+ üyeleri tarafından kullanılabiliyor. Ya da lmarena gibi sitelerden ücretsiz bir şekilde test edebilirsiniz. Biz de öyle yaptık, popüler üç yapay zeka modelinden websitemiz için Chrome’un dinozor oyunu gibi bir endless runner yapmasını istedik.

İşte sonuçlar:

GPT-4o

Alt text Aralarında şaşırtıcı derecede kötü olan GPT’den geldi. Şahsen bu kadar kötü bir şey yapmasını beklemiyordum. Bu adresten kendiniz test edebilirsiniz. Boşluk tuşuna bastığınızda çalışıyor.

Claude 3.5 Sonnet

Alt text Şahsen benim favorim Claude’tu. En iyi sonucun Claude’tan geleceğini bekliyordum. Şu an yazıyı yazdığım siteyi geliştirirken de kendisinden sık sık yardım alıyorum. En oynanılabilir şeyi ortaya koydu kendisi. Görünüş olarak en iyisini yapmadı ancak en oynanılabilir olanı yaptı. Ayrıca oyunda yandığınızda “Restart” butonu çıkıyor ama çalışmıyor. Oyunu başlatmak için boşluk tuşuna basmanız gerekiyor. Bu adresten kendiniz test edebilirsiniz.

Grok 3

Alt text Bariz bir şekilde, Grok 3’ün yazdığı diğer ikisinden çok daha iyi görünüyor. Ancak biraz fazla zor ve imkansız bir oyun olmuş. Çok çabuk yanıyorsunuz, düşmanlar dengeli gelmiyor. Ayrıca “Boşluk tuşu veya dokunarak zıpla” yazıyor ancak sadece boşluk tuşu çalışıyor. Bu adresten kendiniz test edebilirsiniz.

Sonuç

En doğru kodu Grok 3 yazdı ancak bu çok da doğru bir karşılaştırma sayılmaz. Başka girdilerle, daha farklı sonuçlar alınabilir. Şu an LMArena gibi karşılaştırma sitelerine baktığımızda Grok’un en yüksek puanları aldığını görüyoruz. Alt text Ek olarak, Grok’un bir önceki sürümü olan Grok 2’nin açık kaynak olacağı açıklandı. Güzel bir gelişme.