pyspider如何清空之前的结果再重新执行爬虫任务呢? 财富值100

2016-10-30 08:52发布

用 PySpider 练习了一下以前的爬虫程序,并修改了里面不少的爬取规则。

再次 Run 的时候,发现程序并没有重新进行爬取,爬取的规则依然是之前的程序的。

请问该如何清空原有的 result,并能再次执行新的爬虫任务呢?

另外,有一个 CSS 选择器的问题想请教大家的:

<li><span class="label">房屋用途</span>普通住宅</li> 

使用 PySpider 定位到 <li> 的时候,结果会变成「房屋用途 普通住宅」,

请问如何只定位到后面那部分,即「普通住宅」呢?

同样,下面的又是如何只获取「26667」,而不是「26667 元/平米」呢?

<div class="unitPrice">     <span class="unitPriceValue">26667<i>元/平米</i></span> </div>
友情提示: 此问题已得到解决,问题已经关闭,关闭后问题禁止继续编辑,回答。
该问题目前已经被作者或者管理员关闭, 无法添加新回复
3条回答
段曼 - 我很好
1楼-- · 2016-10-30 08:46

response.doc("li .label").tail

.unitPrice .unitPriceValue

一周热门 更多>