少女祈祷中...

PixiC部署文档


本篇概述:这是一篇关于PixiC项目的部署文档,旨在帮助感兴趣的各位部署PixiC项目,获取Pixiv的插画和数据。

如果你有一定的基础,那么可以跳过部分节点,文档尽可能从0到1,详细的讲述部署过程。


PixiC部署文档

Github仓库地址:PixiC

(此文留存备份)

1、Python&MySQL


项目环境

目前只有win系统的部署文档,用户大多数是win用户,所以目前PixiC未兼容win以外的系统。

  • Python 3.7.6
  • MySQL 5.7.14

Python


Python版本尽可能和项目一致,当然高版本也是可以的.

如果你不需要用到数据库,下面MySQL这步可以跳过.

  • 如何判断你需不需要用到数据库呢?

  • 如果是只需要下载插画到本地或你根本不知道数据库是什么, 那么下面这一部分可以略过.

MySQL


MySQL可以使用WampServer,phpStudy,phpEnv等集成环境轻松安装, 也可以只安装MySQL数据库. MySQL版本尽量用最新或者稳定的,项目测试尚未更新MySQL版本.(建议采用最新版本)

安装完数据库, 可以使用mysql-cmd来管理, 也可以使用数据库可视化/管理工具进行管理. (建议采用最新版本)

Tips


安装Python时记得勾选Add Python to Path以及注意安装路径.

PixiC-1.png

第一个红框框选的位置为Python的安装目录(重点), 第二个为添加Python到环境变量.

安装完成后, Win + R, 输入cmd, 输入Python. 如图,则安装成功.

PixiC-2.png

初次安装完python, 建议更新pip版本

1
python -m pip install --upgrade pip

使用pip –version查看pip版本

1
pip --version

MySQL及MySQL管理工具安装完成如下:

PixiC-3.png

PixiC-4.png

2、Python依赖


安装PixiC需要的第三方库依赖

下载本项目到本地.

1
git clone https://github.com/Coder-Sakura/PixiC.git

或者通过Download ZIP下载

PixiC-5.png

下载或解压到本地后,切换到v2.0目录,,打开cmd(在地址栏输入cmd)

1
pip install -r requirements.txt

如果pip更新下载过慢或失败,尝试使用国内豆瓣源

1
pip install -r requirements.txt -i http://pypi.douban.com/simple --trusted-host pypi.douban.com

安装依赖时,出现 You should consider upgrading via the ‘python -m pip install –upgrade pip’ command. 字样时,说明你的pip需要更新,使用提示给出的更新命令。

1
python -m pip install --upgrade pip

安装依赖完毕后,使用pip list检查是否安装成功。

1
pip list

3、Chrome&Webdriver


通过Selenium驱动ChromeDriver,获取Chrome上Pixiv账户的Cookie,从而达到绕过Pixiv Google v3验证的目的。

简而言之,没有这一步的部署,根本获取不了你的Pixiv账号的信息,也就是没有登录(Pixiv对游客账号是有限制的),那么PixiC就无从谈起了。

Chrome


Chrome官方下载: https://www.google.cn/intl/zh-CN/chrome/

蓝奏云: ChromeSetup.exe

使用Chrome://version, 查看Chrome浏览器版本及个人资料路径(重点)

PixiC-6.png

ChromeDriver


ChromeDriver仓库地址:http://chromedriver.storage.googleapis.com/index.html

根据Chrome版本号,下载对应的ChromeDriver。

上面是83.0.4103.61,那么这里选择对应的进行下载。

PixiC-7.png

PixiC-8.png

测试环境在win,这里选择chromedriver_win32.zip下载。

注意! chromedriver版本要与Chrome浏览器版本对应,如果PixiC中的Selenium驱动不了chromedriver,请检查前面二者的版本号。

解压完毕,将chromedriver.exe放在python.exe所在目录下(推荐)

(Python的安装目录不一样,截图仅供参考)

PixiC-10.png

python.exe所在路径,在第一点的Tips中有描述。

或者可以通过以下方法找到

1
2
import sys
sys.path

PixiC-9.png

sys.path中也有给出上面截图的路径。

测试Chromedriver是否正常工作


1
2
3
4
from selenium import webdriver
driver = webdriver.Chrome()
driver.get("https://www.pixiv.net")
driver.close()

复制到cmd窗口中执行或新建一个py脚本运行

测试结果: Chrome打开并访问Pixiv,之后关闭Chrome

4、配置文件


打开PixiC项目v2.0/config.py文件

使用sublime text(推荐)/notepad++/pycharm/vscode等等代码编辑器打开。

蓝奏云: Sublime Text3 v3.2.1中文免安装版

定制配置文件


在PixiC配置之前,先要明确自己利用PixiC的目的是下列哪一种?

  1. 下载Pixiv账号关注/收藏作品原图
  2. 包含1,存储数据到数据库/使用API对接酷q机器人等拓展应用

第一点的话,阅读简单配置即可。

第二点的话,请阅读简单配置及拓展,以及MySQL环境需要安装。

简单配置


目录路径

字段 说明 备注
ROOT_PATH Pixiv账号关注画师的作品下载目录 必填,ROOT_PATH= r’H:\follow’
BOOKMARK_PATH Pixiv账号收藏作品下载目录 必填,BOOKMARK_PATH= r’H:\bookmark’
PRO_DIR Chrome浏览器用户数据目录 必填,参照第三节Chrome&Webdriver进行填写

如果关注和收藏过多,ROOT_PATHBOOKMARK_PATH建议选择容量剩余较大的硬盘的目录。
这里给出下载容量参考:

  • 355关注用户,3000收藏数限制,120G;5000收藏作品,全下载14G
  • 2400关注用户,2000收藏数限制,747G

关于PRO_DIR字段,配置文件中注释有提供参考

用户信息

字段 说明 备注
USER_ID Chrome浏览器登录的Pixiv账号的uid 默认为空
COOKIE_UPDATE_ENABLED 控制是否更新本地cookie 首次运行设置为True
  • COOKIE_UPDATE_ENABLED项首次运行设置为True以更新cookie到本地,后续运行设置为False可快速启动。

模块控制开关及轮询周期

字段 说明 备注
PIXIV_CRAWLER_ENABLED 关注用户作品爬虫模块开关 默认True,False即关闭
PIXIV_BOOKMARK_ENABLED 收藏作品爬虫模块开关 默认True,False即关闭
PIXIV_API_ENABLED API模块开关 默认False
USERS_CYCLE 关注爬虫轮询间隔 默认43200秒
USERS_LIMIT 关注爬虫下载作品的收藏最低限制 默认3000收藏以上
BOOKMARK_CYCLE 收藏爬虫轮询间隔 默认7200秒
BOOKMARK_LIMIT 收藏爬虫下载作品的收藏最低限制 默认0收藏,全下载

PIXIV_CRAWLER_ENABLEDPIXIV_BOOKMARK_ENABLED默认开启,PIXIV_API_ENABLED如果需要开启,参考拓展配置。

拓展配置


API设置

字段 说明 备注
API_HOST 主机ip 默认本地,0.0.0.0/127.0.0.1
API_PORT 端口 默认1526
API_THREAD API线程数 默认8
RANDOM_LIMIT API-random接口-最大返回数 默认10
RANDOM_BOOKMARK_ENABLE API-random接口-是否开启收藏数筛选 默认True
RANDOM_BOOKMARK_LIMIT API-random接口-返回插画最小收藏数 默认3000收藏数以上

数据库连接信息

字段 说明 备注
DB_ENABLE 数据库开关 默认为False,True为开启
DB_HOST 主机ip 默认本地,localhost/127.0.0.1
DB_PORT 端口 3306
DB_USER 用户名
DB_PASSWD 密码
DB_DATABASE 数据库库名 moe
DB_CHARSET 数据库/表编码 utf8mb4

数据库连接信息根据实际填写,DB_ENABLE看个人需求。

不过注意:

  • DB_ENABLEPIXIV_API_ENABLED同时开启,都为True,可同时使用数据库及API
  • DB_ENABLE为True,PIXIV_API_ENABLED为False,爬虫模块使用数据库进行存储
  • DB_ENABLEPIXIV_API_ENABLED都为False,无法使用数据库及API
  • DB_ENABLE为False,PIXIV_API_ENABLED为True,结果与上一点相同

DB_DATABASEDB_CHARSETv2.0/doc/create.sql一致,建议不修改

以上便是配置文件部分

5、运行


首次运行,配置好配置文件,在Chrome上登录Pixiv账号,关闭Chrome。

打开cmd,切换到v2.0目录下 / 或进入v2.0目录后再从地址栏打开cmd

输入命令:

1
python scheduler.py

接下来享受自己关注画师的作品和收藏的作品下载到本地,或者数据存储进数据库里吧!

-------------本文结束感谢您的阅读-------------

本文标题:PixiC部署文档

文章作者:Coder-Sakura

发布时间:2020年06月24日 - 12:44:27

最后更新:2020年06月24日 - 12:49:44

原始链接:https://coder-sakura.github.io/blog/2020/06/24/pixic-bu-shu/

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。