Yapay zekâ en zor matematik sınavından nasıl sonuç aldı? “First Proof” sonuçları tartışma yarattı

Büyük dil modellerinin matematiksel araştırma kapasitesi, 11 seçkin matematikçi tarafından başlatılan “First Proof” meydan okumasının ilk sonuçlarına dayanarak ölçüldü. Bu test, 5 Şubat’ta başladı ve Sevgililer Günü sabahı sonuçları açıklandı. 10 matematik problemiyle yapılan yarışmada, hiçbir büyük dil modelinin tüm soruları çözemediği görüldü. First Proof ekibi, matematikte daha büyük sonuçlar sağlayabilecek 10 “lemma” sundu. Bu lemmalar, standart tekniklerle çözülemeyen ve özgünlük gerektiren problemleri içeriyordu. Yapay zekânın sınırlarını test etmeyi amaçlayan bu meydan okuma, yapay zekâ meraklısı alt kültüre de ışık tuttu. First Proof ekibi, Cumartesi sabahı 10 problemin çözümünü açıkladı ve büyük dil modellerinin deneyimlerini paylaştı. Genel olarak, gönderilen çözümlerin çoğu hatalı olsa da, bazıları orijinal ve doğru çözümler içeriyordu. Matematikseverler arasında, yapay zekânın matematiği nasıl değiştirdiğine dair farklı düşünceler bulunmaktadır.