Model eğitimini iyileştirmek için takviyeli öğrenmede kullanılan bir optimizasyon algoritması.

İlgili Terimler