Büyük dil modellerinin matematiksel araştırma kapasitesi, 11 seçkin matematikçi tarafından başlatılan “First Proof” meydan okumasının ilk sonuçlarına dayanarak ölçüldü. Bu test, 5 Şubat’ta başladı ve Sevgililer Günü sabahı sonuçları açıklandı. 10 matematik problemiyle yapılan yarışmada, hiçbir büyük dil modelinin tüm soruları çözemediği görüldü. First Proof ekibi, matematikte daha büyük sonuçlar sağlayabilecek 10 “lemma” sundu. Bu lemmalar, standart tekniklerle çözülemeyen ve özgünlük gerektiren problemleri içeriyordu. Yapay zekânın sınırlarını test etmeyi amaçlayan bu meydan okuma, yapay zekâ meraklısı alt kültüre de ışık tuttu. First Proof ekibi, Cumartesi sabahı 10 problemin çözümünü açıkladı ve büyük dil modellerinin deneyimlerini paylaştı. Genel olarak, gönderilen çözümlerin çoğu hatalı olsa da, bazıları orijinal ve doğru çözümler içeriyordu. Matematikseverler arasında, yapay zekânın matematiği nasıl değiştirdiğine dair farklı düşünceler bulunmaktadır.
Related Posts
İstanbul Erkek Lisesi’nde dehşet gecesi: LGS birincilerine muştalı bıçaklı işkence!
- doğu kılıçaslan
- 6 Aralık 2025
- 2 min read
Türkiye'nin en iyi birkaç lisesi arasında yer alan İstanbul Erkek Lisesi’nde 24 Kasım’da yaşanan olayda,…
Tim Cook: “Yeni Siri’nin geliştirilmesinde önemli ilerleme kaydettik”
- doğu kılıçaslan
- 4 Mayıs 2025
- 2 min read
Apple'ın CEO'su Tim Cook, 2025'in ikinci mali çeyrek sonuçlarının görüşüldüğü toplantıda, Apple Intelligence çatısı altında…
Barrack’tan Suriye paylaşımı ‘Türkiye’nin rolü özel takdiri hak ediyor’
- doğu kılıçaslan
- 14 Kasım 2025
- 2 min read
ABD’nin Ankara Büyükelçisi ve Suriye Özel Temsilcisi Tom Barrack, Suriye Devlet Başkanı Ahmed Şara’nın Washington…