Raspe el contenido de la página web
-
05-07-2019 - |
Pregunta
Acabo de empezar a investigar esto, quiero raspar mi enrutador Netgear ( http://192.168.0.1/setup.cgi?next_file=stattbl.htm ) estadísticas en un archivo csv.
Ejecuto Win & amp; Linux, pero principalmente conozca C ++, ¿algún enlace / solución?
Solución
Lo sé y escribí c ++, pero para el raspado de la pantalla prefiero usar un lenguaje de scripting como Python con algunas bibliotecas útiles, por ejemplo http://www.crummy.com/software/BeautifulSoup/
especialmente en Linux, Python ya debería estar instalado (o al menos fácilmente instalable a través de los gestores de paquetes).
Otros consejos
Como sugirió MYYN, algo como BeautifulSoup o Hpricot realmente sobresale en este tipo de cosas, así que si no está absolutamente convencido de que tiene que estar en C ++, realmente debería mirar esos (los conceptos básicos de python y ruby ??pueden recogerse con bastante rapidez y son mucho más sencillos que C ++). Alternativamente, consulte QTDOMDocument y TinyXML ++ .