Da li mogu da verujem regresiji?
SREDNJA APSOLUTNA GREŠKA
- MAE je vrlo jednostavna metrika koja izračunava apsolutnu razliku između stvarnih i predviđene vrednosti.
Uzmimo primer da imate ulazne i izlazne podatke i koristite linearnu regresiju, koja povlači liniju koja najbolje odgovara. Sada morate da pronađete MAE vašeg modela što je u osnovi greška modela poznat kao, greška. Sada pronađite razliku između stvarne i predviđene vrednosti koja je apsolutna greška, ali moramo pronaći apsolutnu srednju vrednost kompletnog skupa podataka. Dakle, saberite sve greške i podelite ih sa ukupnim brojem posmatranja i ovo je MAE. I cilj nam je da dobijemo minimalni MAE jer je ovo gubitak.
PREDNOST I NEDOSTATAK MAE
MAE koji dobijete je u istoj jedinici kao i izlazna promenljiva, takođe je najotporniji na vandredne situacije. Grafikon MAE nije diferenciran, tako da moramo da primenimo razne optimizatore kao što je Gradient poreklo koje se može razlikovati.
KOREN SREDNJE KVADRATNE GREŠKE
Kao što je RMSE jasno iz samog imena, da je to jednostavan kvadratni koren srednje kvadratne greške.
PREDNOSTI I NEDOSTATAK RMSE
Izlazna vrednost koju dobijete je u istoj jedinici kao i potrebna izlazna promenljiva, koja čini tumačenje gubitka lako. Nedostaci RMSE – Nije toliko robustan prema vanrednim vrednostima u poređenju sa MAE za izvođenje RMSE- većinu vremena ljudi koriste RMSE kao metriku evaluacije i uglavnom kada radite sa tehnikama dubokog učenja najpoželjnija metrika je RMSE.
R NA KVADRAT (R2)
R2 rezultat je metrika koja govori o performansama vašeg modela, a ne o gubitku u apsolutnom smislu koliko je bunara vaš model radio. Nasuprot tome, MAE i MSE zavise od konteksta kao što smo videli, dok je R2 rezultat nezavisno od konteksta. Uz pomoć R na kvadrat imamo osnovni model za upoređivanje modela koji nema nijedan drugi metrički pruža. Isto imamo i u problemima klasifikacije kojima smo postavili prag koji je fikvd na 0,5. U osnovi R2 na kvadrat izračunava koliko je linija regresije bolja od srednje linije. R2 na kvadrat je takođe poznat kao koeficijent determinacije ili ponekad poznat i kao dobrota odbaciti.
KAKO ĆETE PROTUMAČITI REZULTAT R2?
Pretpostavimo da je R2 rezultat nula onda je gornja linija regresije po srednjoj liniji jednaka sredstvu 1, tako da je nula. Dakle, u ovom slučaju, obe linije se preklapaju znači da su performanse modela najgore, nije sposoban da biste iskoristili izlaznu kolonu. Sada je drugi slučaj kada je R2 rezultat 1, što znači kada je član deljenja nula I to će se desiti kada linija regresije ne napravi nikakvu grešku, savršena je. U stvarnom sveta, nije moguće. Dakle, možemo zaključiti da kako se naša linija regresije kreće ka savršenstvu, R2 rezultat se pomera prema jednom. I performanse modela se poboljšavaju. Normalan slučaj je kada je R2 rezultat između nule i jedan kao 0,8 što znači da je vaš model je u stanju da objasni 80% varijanse podataka.
Autor
Bojan Šćepanović
MCB Menadžment Centar Beograd
063 7004 518