在实验室搞了个服务器,准备用爬虫来做一个自动做种机。BT软件使用Deluge,监视某个文件夹内的torrent文件,同时爬虫每二十分钟跑一次(使用crontab)下载大小、做种人数何时合适的种子到该文件夹内。

下面是一些关于这个爬虫的内容。

登录

主要内容来自Python实现北邮人BT模拟登陆,登录Byr需要向https://bt.byr.cn/takelogin.phpPOST发送四个参数,即

{
    'username': username,
    'password': password,
    'imagestring': 验证码,
    'imagehash': 验证码图片Hash
}

其中验证码图片Hash在html内name=imagehashimg内,验证码识别使用Github上的一个专门的Repo

页面Parse

使用BeautifulSoup对页面进行操作,主要操作每个tr

Code

历史记录

  • 2018-06-15 - 初稿

猜你喜欢


文章标题:北邮人BT爬虫

文章字数:401

本文作者:Mickir

发布时间:2018-06-15

最后更新:2018-07-15

原始链接:https://mickir.me/blog/byr-spider.html

版权声明: "署名-非商用-相同方式共享 4.0" 转载请保留原文链接及作者。