risorse per principianti / introduzioni ai algoritmi di classificazione [chiusa]
Domanda
tutti. Sono del tutto nuovo al tema del algoritmi di classificazione, e hanno bisogno di alcune indicazioni buone su dove cominciare qualche "lettura seria". Sono in questo momento nel processo di scoprire, se l'apprendimento della macchina e algoritmi di classificazione automatizzata potrebbe essere una cosa utile da aggiungere a qualche applicazione di mine.
I già scansionato attraverso "Come risolverlo: euristiche moderni" da Z. Michalewicz e D. Fogel (in particolare, i capitoli sui classificatori lineari che utilizzano le reti neuronali), e sul lato pratico , attualmente sto cercando attraverso il href="http://www.cs.waikato.ac.nz/~ml/weka/" rel="noreferrer"> WEKA toolkit codice sorgente Purtroppo, mi manca un fondamento teorico serio in questo settore (per non parlare, dopo aver usato in alcun modo come ancora), in modo che qualsiasi accenno a dove andare a cercare il prossimo sarebbe apprezzato; in particolare, una buona introduzione di algoritmi di classificazione disponibili sarebbe utile. Essendo più un artigiano e meno teorico, più pratico, il meglio ... Suggerimenti, chiunque?
Soluzione
Ho sempre trovato Tutorial Andrew Moore di essere molto utile. Sono radicati nella teoria statistica solida e saranno molto utili per comprendere i documenti, se si sceglie di leggere loro in futuro. Ecco una breve descrizione:
Questi includono la classificazione algoritmi come ad esempio alberi di decisione, reti neurali, classificatori bayesiani, Support Vector Machines e carter-based (aka non parametrica) apprendimento. Essi comprendono la regressione algoritmi quali multivariata regressione polinomiale, MARS, Localmente Regressione ponderata, GMDH e neurale reti. E comprendono altri dati operazioni minerarie come il clustering (Modelli mistura, k-means e gerarchico), reti bayesiane e Reinforcement Learning
Altri suggerimenti
La risposta href="https://stackoverflow.com/questions/2750105/beginners-resources-introductions-to-classification-algorithms/2750152#2750152"> . Mi piacerebbe per aumentare, tuttavia, suggerendo qualche lettura sulla necessità che spinge la creazione di molti sistemi di classificazione, in primo luogo: l'identificazione di relazioni causali. Questo è importante per molti problemi di modellazione che coinvolgono inferenza statistica.
Il miglior risorsa corrente che io conosca per conoscere causalità e sistemi di classificatore (specialmente classificatori bayesiani) è libro di Judea Pearl "causalità:. modelli, il ragionamento e l'inferenza"
Panoramica del Machine Learning
Per ottenere una buona visione del campo, guarda il video lezioni di corso Machine Learning di Andrew Ng .
Questo corso (CS229) - insegnata dal professor Andrew Ng - fornisce un'ampia introduzione alle machine learning e pattern recognition statistico. Gli argomenti comprendono l'apprendimento supervisionato, apprendimento non supervisionato, teoria dell'apprendimento, apprendimento per rinforzo e controllo adattativo. Recenti applicazioni di apprendimento automatico, come ad esempio il controllo robotico, il data mining, la navigazione autonoma, la bioinformatica, il riconoscimento vocale, e il testo e l'elaborazione dei dati web vengono anche discussi.
Classificatori
Per quanto riguarda che classificatore si dovrebbe usare, vi consiglio prima di iniziare con Support Vector Machines (SVM) per le attività generali di classificazione applicata. Vi daranno state-of-the-art prestazioni, e non si ha realmente bisogno di comprendere tutta la teoria che sta dietro di loro di utilizzare solo l'applicazione fornita da un pacchetto come WEKA.
Se si dispone di un grande data-set, si potrebbe provare a utilizzare casuali Foreste . C'è anche un implementazione di questo algoritmo in WEKA, e treno molto più veloce su dati di grandi dimensioni. Mentre sono meno ampiamente usati di SVM, la loro precisione tende ad abbinare o quasi corrispondere la precisione si potrebbe ottenere da uno.