注册 登录
编程论坛 JavaScript论坛

抓取page时遇到的javascript问题

panghaoyu 发布于 2013-09-02 00:05, 563 次点击
大家好,

我在使用工具抓取网页时遇到了问题:

我要抓取的网页中包含下面的代码片段

<div class="jsmenu" id="searchmenu">
    <ul>
      <li id="1_1" class="">
        <a href="javascript:ChangeTab('quick',1);SubmitTab('','SCAB','quick','',1);" title="AAA">search</a>
      </li>
      <li id ="1_2" class="active">
        <a href="javascript:ChangeTab('normol',2);SubmitTab('','SCAB','normol','',2);" title="BBB">standar</a>
      </li>
      <li id="1_3" class ="">
        <a href="javascript:ChangeTab('special',3);SubmitTab('','SCAB','special','',3);" title="CCC">special</a>
      </li>
    </ul>

... ... ....


我尝试了很多工具,诸如 TeleportUltra 、Offline_Explorer_Enterprise 等 都无法下载

<a href="javascript:ChangeTab 。。。 对应的链接页面,这些工具似乎都不会 解析 <a href="javascript:ChangeTab 的内容

不能打开并下载这些页面。还有其他什么工具可以用吗,或者编程的思路也行。

希望大家能指点指点我,先谢谢各位了。

另外,我的目标是 抓取  http URL 对应页面的所有内容,包括 css,js,images等,还要 上面提到的 <a href="javascript:ChangeTab

里面的内容,也就是整个页面的镜像 ,full page
2 回复
#2
诸葛修勤2013-09-03 01:05
不能下载 也可以保存一份 不就可以了?  随便开启浏览器的调试都可以获取到这些资源通过访问
#3
月暗2013-09-04 21:01
javascript是客户端运行的,

 <a href="javascript:ChangeTab('quick',1);SubmitTab('','SCAB','quick','',1);" title="AAA">search</a>这个连接会执行函数ChangeTab('quick',1)和SubmitTab('','SCAB','quick','',1);

要跳转的话大概在js代码里面有句window.location.href="xxx"。就跳转到xxx页面去了,你可以找下目标页面。
1