Posted By: Jovo () on 'CZinternet'
Title: Stazeni interpretovaneho HTML
Date: Fri Oct 31 23:54:14 2014
Ahoj.
Po leta jsem pouzival jeden ze serveru statni spravy pro stahovani
informaci. Naplacal jsem si linky do souboru a pro kazdy link provedl
download. Stazenou stranku jsem prohnal pres HTML parser
(http://htmlparser.sourceforge.net/) a tim ziskal pozadovane informace.
Muj problem: ti zmetci si neceho podobneho vsimnuli a tak v HTML kodu je
misto dat JS (ajax & spol.), ktery data stahne a zobrazi :-)
Mam dojem, ze primo manipuluji DOM.
Uzivael v prohlizeci nic nepozna - vidi uplne to same, co pred tim.
Je nejaky zpusob, jak z jakehokoliv nastroje/knihovny/downloaderu dostat uz
interpretovany HTML kod? Nejspise by musel mit jadro FF, Chrome,...
Kolega zminil Selenium.
Diky,
Jovo.