在实验室搞了个服务器,准备用爬虫来做一个自动做种机。BT软件使用Deluge,监视某个文件夹内的torrent
文件,同时爬虫每二十分钟跑一次(使用crontab
)下载大小、做种人数何时合适的种子到该文件夹内。
下面是一些关于这个爬虫的内容。
登录
主要内容来自Python实现北邮人BT模拟登陆,登录Byr需要向https://bt.byr.cn/takelogin.php
POST发送四个参数,即
{
'username': username,
'password': password,
'imagestring': 验证码,
'imagehash': 验证码图片Hash
}
其中验证码图片Hash在html内name=imagehash
的img
内,验证码识别使用Github上的一个专门的Repo。
页面Parse
使用BeautifulSoup对页面进行操作,主要操作每个tr