编程论坛
注册
登录
编程论坛
→
VC++/MFC
winpcap抓取url
守住一颗心
发布于 2013-08-20 13:16, 848 次点击
用winpcap会一个网页会抓取很多的数据,有什么思路可以从中提取出一个准确的网址呢?求思路
6 回复
#2
yuccn
2013-08-20 13:37
1、把winpcap的数据抓取到的数据过滤出tcp协议的数据
2、在1 的数据基础上,过滤出80端口的数据(或者你做协议识别分析出http数据也行)
3、2中得到的数据就是http协议的数据了,你在根据http协议分析出你要的数据(比如标题 内容,图片等等)
#3
守住一颗心
2013-08-20 13:42
回复 2楼 yuccn
1、那个乱码问题还是没法解决,服务器发过来的数据经过了压缩可能,不好弄。
2、我现在已经抓出http了,就是不知道用什么方法找出我打开这个网页的URL,因为会有很多的http数据。没思路。。。
#4
yuccn
2013-08-20 13:49
回复 3楼 守住一颗心
建议你先学习下http协议。
只有本站会员才能查看附件,请
登录
#5
守住一颗心
2013-08-20 14:26
回复 4楼 yuccn
好的,我再去学习,不过公司急着要啊,我实在着急。。。。这是相对url吧。。。怎么得到准确的绝对url呢?
#6
yuccn
2013-08-20 16:27
不是相对的,而是http请求。
把我刚刚发的那个 第二行和第一行拼起来,再把后面的http版本去掉就是http请求地址了
http协议的内容~
#7
yuccn
2013-08-20 16:28
http协议内容有点多,急不来~
1