编程论坛's Archiver

kevin·prince 发表于 2008-6-17 16:02

急。有能购实现自动检索网络信息得办法嘛?

急。有能购实现自动检索网络信息得办法嘛?
标题可能比较模糊,我自己说下吧。我们公司目前做了个门户网站www.hanghangwin.com框架,数据库都做好了,现在里面得内容急缺。而且框架很大,光是人工填加信息得话能累死。

包括论坛文章,行业咨讯,产品供应,求购,加盟合作等等。分类几千个!
考虑到网站前期没有知名度,而且没什么人气,因为资源太少。只能是我们自己网里面填加内容,原本我们打算靠人工填加得,可是做到现在为止,越发觉得做不下去了。工作量太大了。

我们填加那些内容都是从引擎中进行搜索相关关键词,然后拷贝到我们网上。都是人工得,我想问下有没有可能做个东西,让系统自动收录那些信息,或者指定收录相关内容呢?

这方面我一壳不通,希望有专业人士帮我解决目前得这个难题,我请吃饭。
我得QQ是280338498 电话是021-59141855 13816759230
请大侠们帮忙,我敬候佳音。

hmhz 发表于 2008-6-17 16:17

网页程序目前还没那么智能化,只能靠软件来达到目的
而且程序编写起来工作量也不小,因为细节方面太多,你的门户网站内容繁多,每个栏目都上百甚至上千个小栏目,要编写这样的所有程序都需要花费几个月的时间

yms123 发表于 2008-6-17 18:58

楼主的意图就是想盗版别的网站的文章[tk13] ,个人记得网上有一种叫做新闻小偷的程序能盗版某个网站的所有文章,那个程序的内部原理其实也是Ajax,远程访问分析某个网站的URL比如newsdisplay.asp?newsid=123后面这个newsid就可以用无限循环的方法来穷举,然后得到所有新闻网业的HTML代码,分析其HTML代码结构把跟文章数据无关的html代码都过过滤掉。

页: [1]

Powered by Discuz! Archiver 6.1.0  © 2001-2007 Comsenz Inc.