当前位置: 首页 > news >正文

网站建设 常见问题网络营销教材电子版

网站建设 常见问题,网络营销教材电子版,360建站平台,拦截网站做跳转在DangSpider类中设置一个基础url base_url http://category.dangdang.com/pg page 1在parse方法中 # 每一页的爬取逻辑都是一样的&#xff0c;所以只需要执行每一页的请求再次调用parse方法就可以了if self.page < 100:self.page 1url self.base_url str(self.page)…
  1. 在DangSpider类中设置一个基础url
base_url = 'http://category.dangdang.com/pg'
page = 1
  1. 在parse方法中
# 每一页的爬取逻辑都是一样的,所以只需要执行每一页的请求再次调用parse方法就可以了if self.page < 100:self.page += 1url = self.base_url + str(self.page) + '-cp01.01.07.00.00.00.html'# 调用parse方法# scrapy.Request就是scrapy的get请求# url就是请求地址 callback就是要执行的那个函数  注意不要加()yield scrapy.Request(url=url, callback=self.parse)

完整的dang.py

import scrapy
from ..items import ScrapyDangdang39Itemclass DangSpider(scrapy.Spider):name = "dang"allowed_domains = ["category.dangdang.com"]start_urls = ["http://category.dangdang.com/cp01.01.07.00.00.00.html"]base_url = 'http://category.dangdang.com/pg'page = 1def parse(self, response):# 所有的seletor的对象,都可以再次调用xpath方法li_list = response.xpath('//div[@id="search_nature_rg"]//li')for li in li_list:# 获取图片src = li.xpath('.//img/@data-original').extract_first()# 第一张图片和其他图片的标签的属性不一样# 第一张图片的src是可以使用的,其他图片的地址在data-original里if src:src = srcelse:src = li.xpath('.//img/@src').extract_first()# 获取名字name = li.xpath('.//img/@alt').extract_first()# 获取价格price = li.xpath('.//p[@class="price"]/span[1]/text()').extract_first()book = ScrapyDangdang39Item(src=src, name=name, price=price)# 获取一个book就将book传递给pipelinesyield book# 每一页的爬取逻辑都是一样的,所以只需要执行每一页的请求再次调用parse方法就可以了if self.page < 100:self.page += 1url = self.base_url + str(self.page) + '-cp01.01.07.00.00.00.html'# 调用parse方法# scrapy.Request就是scrapy的get请求# url就是请求地址 callback就是要执行的那个函数  注意不要加()yield scrapy.Request(url=url, callback=self.parse)
http://www.ysxn.cn/news/2260.html

相关文章:

  • 长春广告公司网站建设利尔化学股票
  • 自学设计的网站seo外链工具有用吗
  • dremrever怎么做网站百度医生
  • 广州番禺哪里有学网站建设温州seo推广外包
  • 东莞外贸网站营销策略包括哪些方面
  • 网站正能量晚上在线观看网络优化师是什么工作
  • 做网站开发需要的笔记本配置引擎搜索器
  • 如何做网站广告互联网企业营销策略
  • 怎么开发属于自己的app软件seo推广骗局
  • 40万用户自助建站石家庄seo结算
  • 冠县住房和城乡建设局网站房地产销售怎么找客户
  • 租一个服务器要多少钱seo搜索优化公司
  • 做pc端网站如何整合营销的特点有哪些
  • 做app_需要先做网站吗谷歌seo是什么职业
  • 网站建设合同是否属于技术服务合同域名查询官网
  • 网站建设和优化要求下载百度地图2022最新版官方
  • 网站作品怎么做深圳关键词优化软件
  • 站长工具网站备案网站如何优化排名软件
  • 做药物分析网站怎样做app推广
  • 如何跟帖做网站关键词分析软件
  • 做网站应该了解什么问题网络促销策略
  • 郑州做网站推广的公司域名解析查询工具
  • 安卓网站建站系统济南seo网站排名优化工具
  • 美篇在哪个网站做的2023年8月疫情恢复
  • 绵阳公司商务网站制作google chrome浏览器
  • 南通网站开发招聘市场调研
  • 社区微网站建设方案宁波seo托管公司
  • 做热区的网站seo关键词查询工具
  • 张家港网站制作公司自己怎么做网站
  • goz建站24小时自助下单平台网站便宜