注册 登录
编程论坛 C# 论坛

关于自动抓取新闻的程序

万光海 发布于 2014-01-09 16:03, 842 次点击
1、    进入“百度新闻”界面:http://news.baidu.com/,输入关键词,比如“雾霾”,搜索界面显示“找到相关新闻约4,000,000篇”,要求软件能够按时间统计新闻条数,即统计每一天(和每一周)有多少条有关“雾霾”的新闻,假设从2004年2月1日起到今天共有4,000,000篇,要求软件能够统计显示下表(此表新闻数为假设值):
表1: 每日统计
时间    2013/12/30    2013/12/29    2013/12/28    ……..    2004/2/2    2004/2/1
新闻数    2300    4500    1210    ………    30    43

表2:每周统计
时间    2013/12/23--30    2013/12/16--23    2013/12/9—
16    ……..    2004/2/8--15    2004/2/1--7
新闻数    12300    14500    11210    ………    230    142


2、    同样的进行“google news”英文新闻的统计,进入“google news”界面:https://news.google.ca/,其它要求与百度新闻的相同。
大神们!求助啊!
2 回复
#2
wangnannan2014-01-09 16:22
程序是没时间给你做了 你可以搜索下网络抓取的知识 都是分析HTML然后截取
#3
黄占林2014-01-25 01:15
网页瓢虫
1