Come capire ottimale i parametri C / gamma in libsvm?

https://stackoverflow.com/questions/2761240

02-10-2019
|

Domanda

libsvm per multi- classificazione classe di set di dati con un gran numero di caratteristiche / attributi (circa 5.800 per ogni articolo). Mi piacerebbe scegliere migliori parametri per la C e Gamma quelli predefiniti Attualmente sto usando.

Ho già provato in esecuzione easy.py, ma per i set di dati che sto usando, il tempo stimato è vicina per sempre (easy.py ran a 20, 50, 100, e 200 campioni di dati ed ha ottenuto un super-lineari regressione che proiettava il mio tempo di esecuzione necessario prendere anni).

C'è un modo per arrivare più rapidamente a migliori valori di C e Gamma che le impostazioni predefinite? Sto utilizzando le librerie Java, se questo fa alcuna differenza.

Soluzione

E 'possibile per raggiungere questo obiettivo senza una ricerca a griglia, come credo easy.py fa.

Guardate questa carta da Trevor Hastie, et al: l'intero percorso regolarizzazione per la Support Vector Machine (PDF). Un "run SVM" calcolerà la perdita per tutti i valori di "C" in un solo colpo, in modo da poter vedere come effettua le prestazioni SVM.

Hanno un'implementazione di questo algoritmo che è possibile utilizzare in R attraverso la svmpath pacchetto.

Credo nucleo dell'algoritmo è scritta in FORTRAN, ma è avvolto in R.

Autorizzato sotto: CC-BY-SA insieme a attribuzione

Non affiliato a StackOverflow