| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
共有 609 人关注过本帖
标题:如何将《吃喝玩乐之重生1997》全部章节网址和全文爬下来
只看楼主 加入收藏
王咸美
Rank: 1
等 级:新手上路
帖 子:879
专家分:3
注 册:2018-1-4
收藏
得分:0 
谢谢各位的热心指点!不好意思!章节太多没有仔细看,我怕万一出现这种状况不好处理。如何用老式IE浏览器下载各章节小说?还请高手赐教,再次谢谢🙏
前天 20:16
吹水佬
Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20
等 级:版主
威 望:451
帖 子:10899
专家分:43509
注 册:2014-5-20
收藏
得分:10 
回复 11楼 王咸美
什么破网,目录有两套,对应的章节内容也有差别,说不定也是从哪复制来的。
图片附件: 游客没有浏览图片的权限,请 登录注册

图片附件: 游客没有浏览图片的权限,请 登录注册


前天 21:48
王咸美
Rank: 1
等 级:新手上路
帖 子:879
专家分:3
注 册:2018-1-4
收藏
得分:0 
不知为何我的电脑上目录页打不开,先结贴吧。

[此贴子已经被作者于2025-11-21 23:20编辑过]

前天 22:59
吹水佬
Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20
等 级:版主
威 望:451
帖 子:10899
专家分:43509
注 册:2014-5-20
收藏(1)
得分:0 
没看头,内容缺失、乱码等,如第3章。

图片附件: 游客没有浏览图片的权限,请 登录注册

简单测试代码,只作参考,不能照抄。
程序代码:
SET DEFAULT TO (ADDBS(JUSTPATH(SYS(16))))
DECLARE long PostMessageA IN user32 long,long,long,long
IF !FILE("吃喝玩乐之重生1997.dbf")
    CREATE TABLE 吃喝玩乐之重生1997 (title C(100), addr C(254), txt M)
    USE 
ENDIF
USE 吃喝玩乐之重生1997 ALIAS tu
of = CREATEOBJECT("form1")
of.show(1)
CLOSE TABLES ALL 
CLEAR ALL
RETURN

DEFINE CLASS form1 as Form
    width = 800
    height = 600
    AutoCenter = .T.
    AllowOutput = .f.
    ADD OBJECT but as commandbutton WITH left=10,top=10,width=100,height=22,caption="开始"
    ADD OBJECT grd as grid WITH left=10,top=40,width=250,height=550,RecordSource="tu",AllowCellSelection=.f.
    ADD OBJECT edt as editbox WITH left=280,top=40,width=510,height=550
    ADD OBJECT web as Olecontrol with OleClass="Shell.Explorer.2",left=-100

    PROCEDURE Destroy
        UNBINDEVENTS(this.hWnd)
    ENDPROC
    
    PROCEDURE Init
        this.web.Silent = .t.
        BINDEVENT(this.hWnd, 0x401, this, "myMessage")
    ENDPROC

    PROCEDURE but.click
        ZAP IN "tu"
        thisform.edt.value = ""
        thisform.web.navigate("http://www./105790648")
    ENDPROC
    
    PROCEDURE grd.click
        thisform.edt.value = tu.txt
        thisform.edt.SelStart = 0
    ENDPROC

    PROCEDURE web.documentComplete(pdisp, url)
        IF (SYS(3095, pdisp) == SYS(3095, this))
            PostMessageA(thisform.hWnd, 0x401, 0, 0)
        ENDIF 
    ENDPROC

    FUNCTION myMessage(hWnd, uMsg, wParam, lParam)
        dom = this.web.document
        IF VARTYPE(dom) != "O"
            this.Enabled = .t.
            RETURN 
        ENDIF
        IF EMPTY(tu.addr)
            #if 1   && 0 or 1
                * ie版本高试用
            lis = dom.getElementsByClassName("line3")
            FOR EACH li IN lis
                INSERT INTO tu VALUES (li.firstChild.innertext, li.firstChild.href, "")
            ENDFOR
            #else
                * ie版本低试用
            lis = dom.getElementsByTagName("li")
            FOR EACH li IN lis
                IF li.classname == "line3"
                    INSERT INTO tu VALUES (;
                        li.getElementsByTagName("a").item[0].innertext,;
                        li.getElementsByTagName("a").item[0].href, "";
                    )
                ENDIF 
            ENDFOR
            #endif
            GO TOP IN "tu"
            this.grd.setfocus
            this.web.navigate(ALLTRIM(tu.addr))
            RETURN     
        ENDIF
        REPLACE tu.txt WITH ALLTRIM(tu.title)+ 0h0D0A0D0A + dom.getElementById("ad").innertext
        ? ALLTRIM(tu.title)
        SKIP IN "tu"
        IF !EOF("tu")
            this.grd.setfocus
            this.web.navigate(ALLTRIM(tu.addr))
            RETURN 
        ENDIF
        GO TOP IN "tu"
        this.grd.setfocus
        this.Enabled = .t.
    ENDFUNC
ENDDEFINE



[此贴子已经被作者于2025-11-21 23:45编辑过]

前天 23:30
王咸美
Rank: 1
等 级:新手上路
帖 子:879
专家分:3
注 册:2018-1-4
收藏
得分:0 
谢谢!
昨天 06:01
王咸美
Rank: 1
等 级:新手上路
帖 子:879
专家分:3
注 册:2018-1-4
收藏
得分:0 
@吹水佬:各章节网址爬下来了,没有见到各章节小说内容!

[此贴子已经被作者于2025-11-22 10:11编辑过]

昨天 08:38
快速回复:如何将《吃喝玩乐之重生1997》全部章节网址和全文爬下来
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.018754 second(s), 8 queries.
Copyright©2004-2025, BC-CN.NET, All Rights Reserved