在实验室搞了个服务器,准备用爬虫来做一个自动做种机。BT软件使用Deluge,监视某个文件夹内的torrent文件,同时爬虫每二十分钟跑一次(使用crontab)下载大小、做种人数何时合适的种子到该文件夹内。

下面是一些关于这个爬虫的内容。

登录

主要内容来自Python实现北邮人BT模拟登陆,登录Byr需要向https://bt.byr.cn/takelogin.phpPOST发送四个参数,即

{
    'username': username,
    'password': password,
    'imagestring': 验证码,
    'imagehash': 验证码图片Hash
}

其中验证码图片Hash在html内name=imagehashimg内,验证码识别使用Github上的一个专门的Repo

页面Parse

使用BeautifulSoup对页面进行操作,主要操作每个tr

Code