Llama pral mal ajiste total final la lè kèk detay ki pa gen rapò ak kantite kiwi yo prezante, menm si enfòmasyon adisyonèl sa a pa gen rapò ak rezilta a nan pwo. Blèm nan: Egzanp sa a soti nan seri done GSMNoOp la: nou te ajoute kèk deklarasyon nan kesyon an ki te san. Ble ki enpòtan men ki aktyèlman pa enpòtan pou rezònman an ak konklizyon an. Sepandan, pifò modèl pa inyore deklarasyon sa yo ak je fèmen konvèti yo nan operasyon aktyèl,
finalman mennen nan erè. Frajilite nan rezònman sa a te mennen chèchè yo konkli ke modèl sa yo pa t ‘sèvi ak lojik reyèl pou rezoud pwo. Blèm nan, men olye te konte sou rekonesans modèl konplèks aprann pandan fòmasyon. Yo te jwenn ke senpleman chanje non an ka chanje rezilta yo, yon siy potansyèl . Boulvèsan pou lavni aplikasyon
AI ki mande pou rezònman konsistan, egzat nan mond reyèl la. Dapre etid la, tout modèl yo teste, ki soti nan pi piti vèsyon sous louvri tankou Llama rive nan modèl propriétaires tankou OpenAI a GPT4o, te fè eksperyans degradasyon pèfòmans enpòtan lè done antre yo te fè chanjman w pèdi ensiyifyan. Chèchè Apple sijere ke AI ka .
Bezwen kon. Bine rezo neral ak rezònman tradisyonèl ki . Baze sou sen. Bòl (yo rele AI nerosym. Bolic) pou reyalize kapasite pou pran desizyon ak rezoud pwo. Blèm ki pi egzak. An jeneral, nou pa jwenn okenn prèv rezònman fòmèl nan modèl langaj, ki gen ladan modèl sous louvri tankou Llama, Phi, Gemma, ak Mistral, osi .
Byen ke dirijan modèl sous fèmen, ki gen ladan dènye OpenAI GPT4o ak seri o1. Mehrdad, otè de papye Farajta. Bar konkli sou x. Men, pwen enpòtan an se ke papye sa a te lanse pwòp li yo amelyore nouvo tès referans GSMSym. Bolic, lè l sèvi avèk modèl sen. Bolik jenere kesyon divèsifye kontwole pwosesis evalyasyon an, kidonk li te konprann pa kèk netizens kòm yon papye lavant.