Sosyal Medya

Reel Sektör

Gelişmiş yapay zeka modelleri ‘doğrucu’ değil

Yapay zeka dil modelleri (LLM) ne kadar gelişkinse bir soruya yanıt bulamadığını kabullenme olasılığı o kadar azalıyor.   Araştırmacılar her…

Gelişmiş yapay zeka modelleri ‘doğrucu’ değil

Yapay zeka dil modelleri (LLM) ne kadar gelişkinse bir soruya yanıt bulamadığını kabullenme olasılığı o kadar azalıyor.

 

Araştırmacılar her bir modelin verdiği yanıtları karşılaştırdı ve bunları doğru, yanlış ya da kaçamak yanıtlar olarak sınıflandırdı.

Yapay zeka modellerinin yeni sürümlerinde zorlu sorulara verilen doğru yanıt oranının yükseldiği görüldü.

KANITLANMIŞ SONUÇLAR%78.3 başarı · ort. %14.8
CCOLA4 Oca – 16 Şub+%38,16
GUBRF25 Oca – 11 Şub+%21,55
OYAKC4 Oca – 16 Şub+%20,56
TKFEN2 Mar – 11 Mar+%20,49
AFYON8 Mar – 16 Mar+%14,03
RAPORU İNCELE →

Ancak gelişmiş modeller önceki modellere kadar ‘doğrucu’ değil.

Önceki sürümler yanıtı bulamadığını veya daha fazla bilgiye ihtiyaç duyduğunu belirtirken yeni sürümlerin tahminde bulunma ya da kolay sorulara bile yanlış yanıt üretme eğiliminde.

Bu hafta potansiyeli en yüksek · 5 HİSSE
GARAN ▲ Long
GirişNONEEE
T/P HedefNONEEE
S/L StopNONEEE
+ THYAO, ISCTR, SISE, META ve toplam 5 hisse bu hafta analiz edildi
🔒 Tüm seviyeleri görmek için raporu edinin
ÖRNEK RAPORU GÖR →
Yatırım tavsiyesi değildir. Detaylar için raporu inceleyiniz.

Temel problemleri çözmede ‘belirgin bir gelişme yok’

Araştırmaya göre yeni sürümlerde çok düşük zorluktaki sorularda bile tam güvenilirlik elde edilemiyor.

Modeller son derece zorlu örnekleri çözebilse de çok basit örneklerde başarısız.

OpenAI’nin yeni yapay zeka dil modeli ChatGPT-4’da da durum böyle. Araştırmaya göre bir önceki model GPT-3.5’e göre ‘kaçamak’ yanıtların sayısı yeni modelde önemli ölçüde düştü.

Araştırmanın yazarları “Bu durum, daha yeni LLM’lerin yanıt vermekten daha başarılı biçimde kaçınacağı beklentisiyle uyuşmuyor” diyor.

Araştırma, Nature dergisinde yayınlandı.

 

 

 

 

 

 

diken.com.tr

HAFTALIK RAPOR
Haftalık quant yatırım raporuna erişin
AI model tahminleri
Hisse giriş seviyeleri
Hedef fiyatlar
Makro piyasa analizi
Detaylı analizi gör
KANITLANMIŞ SONUÇLAR %78.3 başarı
CCOLA 4 Oca – 16 Şub +%38,16
GUBRF 25 Oca – 11 Şub +%21,55
OYAKC 4 Oca – 16 Şub +%20,56
TKFEN 2 Mar – 11 Mar +%20,49
AFYON 8 Mar – 16 Mar +%14,03
16 işlemde ort. %14.8 getiri
RAPORU İNCELE →

BAKMADAN GEÇME

Benzer Haberler