Pourquoi déterminons-nous les valeurs de λ dans la régularisation comme Ln λ, comme Ln λ = -18 au lieu de par exemple λ = 0,3?

https://datascience.stackexchange.com/questions/57357

regularization

02-11-2019
|

Question

J'étudie la reconnaissance des modèles et l'apprentissage automatique de Christopher Bishop. Ce que j'ai réalisé, c'est qu'il définit les valeurs de λ comme ln λ. Par exemple:

Nous voyons que, pour une valeur de lnλ = −18, le sur-ajustement a été supprimé et nous obtenons maintenant une représentation beaucoup plus étroite de la fonction sous-jacente Sin (2πx). Si, cependant, nous utilisons une valeur trop grande pour λ, nous obtenons à nouveau un mauvais ajustement, comme le montre la figure 1.7 pour lnλ = 0

Quelle est la raison pour ça? Pourquoi n'utilise-t-il pas seulement λ?

Pas de solution correcte

Licencié sous: CC-BY-SA avec attribution

Non affilié à datascience.stackexchange