用 PySpider 练习了一下以前的爬虫程序,并修改了里面不少的爬取规则。
再次 Run 的时候,发现程序并没有重新进行爬取,爬取的规则依然是之前的程序的。
请问该如何清空原有的 result,并能再次执行新的爬虫任务呢?
另外,有一个 CSS 选择器的问题想请教大家的:
<li><span class="label">房屋用途</span>普通住宅</li>
使用 PySpider 定位到 <li> 的时候,结果会变成「房屋用途 普通住宅」,
请问如何只定位到后面那部分,即「普通住宅」呢?
同样,下面的又是如何只获取「26667」,而不是「26667 元/平米」呢?
<div class="unitPrice"> <span class="unitPriceValue">26667<i>元/平米</i></span> </div>
付费偷看金额在0.1-10元之间
response.doc("li .label").tail
.unitPrice .unitPriceValue
http://docs.pyspider.org/en/l...
一周热门 更多>