爬取人大经济论坛问题 财富值55

2016-10-14 17:12发布

这是搜索页
http://s.pinggu.org/search.ph...

这是请求时候看到的内容

这里有两个问题,
在form data里面有两个数据不知怎么获取。
一个是srchtxt,这个应该是搜索的那个字段,要怎么处理拼接进来。
另外一个是:formhash,这个可以在元素页面可以看到

但是这个也是在post搜索之后才有的,所以就是不知要怎么处理这两个字段。

2条回答
段曼 - 我很好
1楼 · 2016-10-14 17:58.采纳回答

formhash就按楼上说的去访问两次就可以了
srchtxt。。。你自己爬取的时候肯定要自己写关键字阿。。。要不爬啥啊

第一个 formhash 的获取,再搜索之前,事先访问一下http://s.pinggu.org/search.php 这个连接,这个时候,就会产生formhash这个字段了。另外一个字段出现乱码,我猜测的原因是,这个网页采用的gbk编码,所以说你传值的时候,也改变编码即可。

一周热门 更多>