Hva er overfitting?
Overfitting er en modelleringsfeil som oppstår når en funksjon er for tett tilpasset et begrenset sett med datapunkter. Overfitting av modellen har vanligvis form av å lage en altfor kompleks modell for å forklare idiosynkrasier i dataene som ble undersøkt.
I virkeligheten har dataene som ofte studeres en viss grad av feil eller tilfeldig støy i seg. Dermed kan forsøk på å få modellen tilpasse seg for tett til litt unøyaktige data, infisere modellen med vesentlige feil og redusere dens prediktive kraft.
Viktige takeaways
- Overfitting er en modelleringsfeil som oppstår når en funksjon er for tett tilpasset et begrenset sett med datapunkter. Finansielle fagpersoner må alltid være klar over farene ved å overmontere en modell basert på begrensede data.
Forstå Overfitting
For eksempel er et vanlig problem å bruke datamaskinalgoritmer til å søke i omfattende databaser med historiske markedsdata for å finne mønstre. Gitt nok studie, er det ofte mulig å utvikle forseggjorte teoremer som ser ut til å forutsi ting som avkastning i aksjemarkedet med nøye nøyaktighet.
Imidlertid, når de brukes på data utenfor prøven, kan slike teoremer sannsynligvis vise seg å være bare overmontering av en modell til det som i virkeligheten bare var tilfeldigheter. I alle tilfeller er det viktig å teste en modell mot data som er utenfor prøven som ble brukt til å utvikle den.
Økonomiske fagpersoner må alltid være klar over farene ved å overmontere en modell basert på begrensede data.
