Yapay zeka modelleri kod yazma, metin oluşturma ve karmaşık analizler yapma konusunda devasa adımlar atsa da, işin içine gerçek dünyanın belirsizlikleri girdiğinde hesaplar şaşıyor. Londra merkezli yapay zeka girişimi General Reasoning tarafından gerçekleştirilen "KellyBench" adlı deney, yapay zekanın spor bahislerindeki zayıf karnını gözler önüne serdi.
HER MODELE 100 BİN STERLİN SANAL KASA VERİLDİ
Araştırmada, piyasadaki en güçlü 8 büyük dil modeline (LLM) detaylı takım verileri ve geçmiş istatistikler yüklenerek, 2023-2024 İngiltere Premier Lig sezonu için bahis stratejileri oluşturmaları istendi. Modellerin her birine, idare etmeleri ve bahis yapmaları için 100.000 Sterlin sanal bütçe tanımlandı.
Yapay zekalardan beklenen, maç sonuçlarını tahmin etmek, karı maksimize edecek oranları bulmak ve en önemlisi parayı sıfırlamamak için risk yönetimi yapmaktı. Ancak sonuçlar beklenenden çok daha kötü oldu.

EN BAŞARILI MODEL BİLE YÜZDE 11 ZARAR ETTİ
Testin sonucunda, 8 modelin hiçbiri sezonu karla kapatmayı başaramadı. İnsan bahisçilerin dahi gerisinde kalan modellerin en "başarılı" olanı Anthropic şirketine ait Claude Opus 4.6 oldu. Claude Opus, %11'lik bir kayıp yaşayarak kasasını sıfırlamaktan son anda kurtuldu. Onu, %13,6'lık zararla OpenAI'ın GPT-5.4 modeli izledi. Bu iki yapay zeka, stratejilerini kısmen de olsa güncelleyerek iflastan kaçınabilen (Avoided Ruin) yegane sistemler oldu.
GROK VE DİĞERLERİ İFLAS BAYRAĞINI ÇEKTİ
Tablonun geri kalanı ise tam bir hüsranla sonuçlandı. Elon Musk'ın xAI şirketine ait Grok 4.20, Google'ın Gemini 3.1 Pro ve GLM-5 gibi diğer 6 güçlü yapay zeka modeli, risk yönetimini sağlayamayarak 100 bin sterlinlik sanal kasalarının tamamını kaybetti ve "iflas" etti.
NEDEN BAŞARISIZ OLDULAR?
Araştırmacılar, bu çarpıcı başarısızlığın temelinde yapay zekanın "Bilgi-Eylem Boşluğu" (Knowledge-Action Gap) yatığını belirtiyor. Modeller, çok karmaşık istatistiksel analizleri kusursuz şekilde yapabilseler de, maçların gidişatı, sakatlıklar, hava durumu veya futbolun doğasındaki sürprizler gibi uzun vadeli değişkenlere adapte olamıyorlar. İşler ters gittiğinde strateji değiştirme konusunda yavaş kalan yapay zeka sistemleri, mantıklı finansal kararlar almak yerine ısrarcı davranarak kasalarını tüketiyor.




