提交表单后,爬虫怎样能获得真正的下载链接? 财富值7

2016-10-25 11:01发布

需要在网站点击保存,完成弹出的表单来定制下载:

点击后,出现这两个:

然而并没有一个链接是直接打开就能下载的那种,之前只爬过静态网页,非常小白,网上介绍的案例往往是用正则匹配到文件的下载链接直接写入就可以,不清楚这种需要提交表单,并且下载的文档内容由表单决定的情况需要怎么处理。求指教,非常感谢。

友情提示: 此问题已得到解决,问题已经关闭,关闭后问题禁止继续编辑,回答。
该问题目前已经被作者或者管理员关闭, 无法添加新回复
1条回答

应先分析提交表单的请求header及提交参数信息、返回的header信息,然后再利用python模拟提交,最终解决问题,大体就是这个思路