Pourquoi déterminons-nous les valeurs de λ dans la régularisation comme Ln λ, comme Ln λ = -18 au lieu de par exemple λ = 0,3?
-
02-11-2019 - |
Question
J'étudie la reconnaissance des modèles et l'apprentissage automatique de Christopher Bishop. Ce que j'ai réalisé, c'est qu'il définit les valeurs de λ comme ln λ. Par exemple:
Nous voyons que, pour une valeur de lnλ = −18, le sur-ajustement a été supprimé et nous obtenons maintenant une représentation beaucoup plus étroite de la fonction sous-jacente Sin (2πx). Si, cependant, nous utilisons une valeur trop grande pour λ, nous obtenons à nouveau un mauvais ajustement, comme le montre la figure 1.7 pour lnλ = 0
Quelle est la raison pour ça? Pourquoi n'utilise-t-il pas seulement λ?
Pas de solution correcte
Licencié sous: CC-BY-SA avec attribution
Non affilié à datascience.stackexchange