网址:??http://hotel.qunar.com/city/beij ... 4%E6%98%9F%E7%BA%A7
第一级想采集酒店名称,最低价格,评论数,进行样例复制和翻页采集。
第二级想进入每个酒店的链接获取不同用户的评论(1页)进行层级采集。

但在第一级就有问题了
但是在第一级样例复制和翻页采集的测试都没有问题,数据出的来,参存完规则爬取数据时,网页没有出现,还报错了。

求教,谢谢!


规则名称: beiijing-20190927-02


共 8 个关于本帖的回复 最后回复于 5?天前

沙发
hky_12345 新手上路 发表于 5?天前 | 只看该作者
刚刚网页好像显示不全 http://hotel.qunar.com/city/beijing_city/q-%E4%BA%94%E6%98%9F%E7%BA%A7
板凳
Fuller 管理员 发表于 5?天前 | 只看该作者


这样换一下useragent。

你的任务名是什么?
地板
Fuller 管理员 发表于 5?天前 | 只看该作者
我加载了你的规则,样本页面网址不对。我用你在第二个帖子发出的网址分析了你的规则,规则是正确的
5#
Fuller 管理员 发表于 5?天前 | 只看该作者
我测试了一下,我这里运行良好,一方面换一下useragent,另外,检查一下网速,观察加载这个页面要花费多久
6#
hky_12345 新手上路 发表于 5?天前 | 只看该作者
好的,谢谢你了!!!
7#
hky_12345 新手上路 发表于 5?天前 | 只看该作者
Fuller 发表于 2019-9-27 09:28
这样换一下useragent。

你的任务名是什么?

啥是任务名?
8#
MebiuW 初级会员 发表于 5?天前 | 只看该作者

就是采集规则的名字,现在把规则统一叫成任务
9#
hky_12345 新手上路 发表于 5?天前 | 只看该作者
MebiuW 发表于 2019-9-27 10:02
就是采集规则的名字,现在把规则统一叫成任务

好的,叫 beiijing-20190927-02(不过之后可能会删除)。问题目前已经解决,应该是用了太多次集搜客爬网站的原因,被反爬了。换了一个浏览器,爬取到了携程。
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 关于鸿蒙操作系统的知乎讨论热点分析
  • 采集知乎上关于华为鸿蒙的问题和回答
  • 分词和分类检索平台使用手册
  • 用365体育官方中文版 ios_体育比分365为什么不能注册_365 体育投注推荐佣金采集机场出租车进场出场数据的公告
  • 摘取泉港区政府工作报告中的数字遇到的问题

热门用户

GMT+8, 2019-10-2 14:37