Raschiare il contenuto della pagina web
-
05-07-2019 - |
Domanda
Ho appena iniziato a esaminare questo, voglio grattare il mio Netgear Router ( http://192.168.0.1/setup.cgi?next_file=stattbl.htm ) le statistiche in un file CSV.
Corro Win & amp; Linux, ma principalmente conosci il C ++, qualche link / soluzione?
Soluzione
Conosco e scrivo c ++, ma per lo screen scraping preferirei usare un linguaggio di scripting come Python con alcune utili librerie, ad es. http://www.crummy.com/software/BeautifulSoup/
specialmente su Linux, Python dovrebbe essere già installato (o almeno facilmente installabile tramite i gestori di pacchetti).
Altri suggerimenti
Come suggerito MYYN, qualcosa come BeautifulSoup o Hpricot eccelle davvero in questo genere di cose, quindi se non sei assolutamente convinto che debba essere in C ++, dovresti davvero esaminare quelli (le basi sia di pitone che di rubino possono essere acquisite abbastanza rapidamente e sono certamente molto più semplici di C ++). In alternativa, controlla QTDOMDocument e TinyXML ++ .