注册 登录
编程论坛 C语言论坛

求助: 网页源码下载、整理综合问题

追梦人zmrghy 发布于 2023-03-27 16:28, 882 次点击
一些编程技术BBS的文章,必需登入后,才能复制程序代码。。。
于是,就想到了,下载网页源码,来获取文章中的程序代码。。。

可是,我水平太有限。
只会使用String^->Substring()和String^->Replace()俩个函数来整理下载的源代码。
然后,保存为txt文本文件。

文本文件,很不方便。。。。
1,文本文件,没有了插图。
2,文本文件,每一行就是文章一段落,一段没结束文本文档,不会自动换行。
3,网页编程技术文章,“程序代码”部分,都有行号和底纹颜色,哪些是“程序代码”部分一目了然。。。。。



所以,如何解决这3个问题。
最好,使用Word2007,加入插图,
Word,可以自动换行。
“程序代码”部分添加行号和底纹颜色



这只是初步想,如何实际,一窍不通。。。。。
还要麻烦大家。。。。。。。。

下载的源码文件
只有本站会员才能查看附件,请 登录



整理后的源码文件
只有本站会员才能查看附件,请 登录


只有本站会员才能查看附件,请 登录


只有本站会员才能查看附件,请 登录


[此贴子已经被作者于2023-3-27 18:05编辑过]

9 回复
#2
wp2319572023-03-29 16:56
有些东西根本就不在源码里 哦
#3
追梦人zmrghy2023-03-30 04:07
回复 2楼 wp231957
傻子都知道,这只是一种文本格式。。。
不是,文本的内容。。。。
为什么要使用Word,不就是看Word可以支持很多种文本格式吗???
只有本站会员才能查看附件,请 登录


我只 人工使用Word添加页面背景色。
不会使用程序代码添加页面背景色。

如何,添加行号。就更不会了。。。。。
#4
wp2319572023-03-30 06:20
回复 3楼 追梦人zmrghy
你连代码从哪里下载都不知道,就研究如何修饰,不觉得没意义吗
#5
追梦人zmrghy2023-03-30 12:42
回复 4楼 wp231957
开始 <div id=\"content_views\" class=\"htmledit_views\">
结束 <div id=\"treeSkill\">

源码开始 <pre><code>
源码结束</code></pre>


大同小异,差不多。
太低能的问题。。。。。

只有本站会员才能查看附件,请 登录


能不能讲些,小学生的问题,不要总是讲幼儿园(学前班)的问题。。。

[此贴子已经被作者于2023-3-30 12:58编辑过]

#6
wp2319572023-03-30 13:43
回复 5楼 追梦人zmrghy
bbs需要登录,这就需要一个账号密码,登录方式或带cookie登录,或用无头浏览器
只有你能拿到目标资料,才能继续进行下一步的研究
#7
追梦人zmrghy2023-03-30 13:59
回复 6楼 wp231957
我问的是,如何使用程序代码设置Word文档格式。(添加页面底纹色,和行号)。。。。。
代码已经可以整理成txt文本文件了。。。
你还说,不知道程序代码,从哪里下载的。。。。


如果不是BBS就是博客。
反正,不登入,就不让复制程序代码。
可以,从网页源码中读出来。。。。
但文本格式,想做到像网页那样,程序代码一目了然,太难了。

我除了BBS和BLOGS也不看其它的,编程技术文章。。。。

[此贴子已经被作者于2023-3-30 14:06编辑过]

#8
追梦人zmrghy2023-03-30 14:09
回复 6楼 wp231957
Accept: */*
Accept-Encoding: identity;q=1, *;q=0
Accept-Language: zh-CN,zh;q=0.9
Connection: keep-alive
Host: v26-web.
Range: bytes=0-
Referer: https://v26-web.
Sec-Fetch-Dest: video
Sec-Fetch-Mode: no-cors
Sec-Fetch-Site: same-origin
User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36


就是找不到cookie:
#9
wp2319572023-03-30 14:53
回复 7楼 追梦人zmrghy
不考虑python吗    我感觉c 写这些东西  有些弱
#10
追梦人zmrghy2023-03-30 20:55
回复 9楼 wp231957
python学了几天了,
感觉,太别扭。
没有{},
多一个空格就出错,
少一个空格也出错。。。
1