QQ登录

只需一步,快速开始

 找回密码
 注册

QQ登录

只需一步,快速开始

查看: 3181|回复: 8

求助:为何用wget抓不了这个页面,浏览器却可以浏览。

[复制链接]
发表于 2006-4-7 14:05:03 | 显示全部楼层 |阅读模式
wget抓的时候服务器总是报500服务器内部错,但用浏览器却可以很正常的打开。
http://www.nmc.gov.cn/nmc/citySearch.do?inputMode=citysearch&type=second&cityid=54511

原来我以为可能是程序处理了浏览器的信息了,但我把Firefox的UserAgent里所有的信息都不提交,还是可以正常打开,唯独wget不能正常抓取。
发表于 2006-4-7 15:59:14 | 显示全部楼层
浏览器也是500
回复

使用道具 举报

 楼主| 发表于 2006-4-7 17:38:26 | 显示全部楼层
我在Windows下用Firefox和IE都能正常打开啊
回复

使用道具 举报

发表于 2006-4-7 18:01:20 | 显示全部楼层
还是500,什么浏览器都是500
回复

使用道具 举报

发表于 2006-4-7 20:35:17 | 显示全部楼层
我的也是500
回复

使用道具 举报

 楼主| 发表于 2006-4-7 20:50:04 | 显示全部楼层
终于弄明白了,是cookie的问题,先访问一下首页www.nmc.gov.cn,保存cookie,再用wget抓时载入cookie就不会出错了。
回复

使用道具 举报

发表于 2006-4-17 17:26:39 | 显示全部楼层
追问一下,Wget可以把整个网站GET下来不,要用哪个参数?
回复

使用道具 举报

发表于 2006-4-18 14:14:53 | 显示全部楼层
wget -r -p -np -k http://********
回复

使用道具 举报

发表于 2006-4-20 16:12:59 | 显示全部楼层
www.×××××.com/products_tx2.asp?pid=47
可不可以不让他下载这个ducts_tx2.asp?pid=47,直接下载www.×××××.com/products_tx2.asp
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

GMT+8, 2024-6-29 09:22 , Processed in 0.127599 second(s), 16 queries .

© 2021 Powered by Discuz! X3.5.

快速回复 返回顶部 返回列表