Comment déterminer les paramètres optimaux C / Gamma libsvm?

https://stackoverflow.com/questions/2761240

02-10-2019
|

Question

J'utilise libsvm multi classement de la classe des ensembles de données avec un grand nombre de caractéristiques / attributs (environ 5.800 par chaque élément). Je voudrais choisir de meilleurs paramètres pour C et Gamma que les paramètres par défaut, je suis en train d'utiliser.

Je l'ai déjà essayé de courir easy.py, mais pour les ensembles de données que je utilise, le temps estimé est proche pour toujours (RAN easy.py à 20, 50, 100, et 200 échantillons de données et a un super-linéaire régression qui projetait mon temps d'exécution nécessaire de prendre des années).

Y at-il un moyen de plus rapidement arriver à de meilleures valeurs C et gamma que les valeurs par défaut? J'utilise les bibliothèques Java, si cela fait une différence.

La solution

Il est possible d'y arriver sans grille de recherche, comme je crois easy.py fait.

Regardez cet article de Trevor Hastie, et al: Le chemin entier Régularisation pour le support vecteur machine (PDF). Un « run SVM » calcule la perte de toutes les valeurs de « C » d'un seul coup, de sorte que vous pouvez voir comment il affecte votre performance SVM.

Ils ont une implémentation de cet algorithme que vous pouvez utiliser dans R par svmpath paquet.

Je crois que le noyau de l'algorithme est écrit en FORTRAN, mais est enveloppé dans R.

Licencié sous: CC-BY-SA avec attribution

Non affilié à StackOverflow