常用命令工具记录

几个命令工具的备忘录，纯自用，忘了啥写啥。

2 March 2021

Pixiv数据分析

寒假的时候利用家里不计费的网爬取了600w+P站的图片数据。一开始的目的是解决：由于P站本身的搜索页面1000页限制，而导致的无法通过搜索爬取较早图片信息，这一问题。所以在爬取的一开始，我的目标是获取高收藏的高质量作品。我采取的爬取策略是通过第一个画师的收藏夹开始，获取他收藏夹内的图片信息，接着将这些图片的画师id加入画师数据库。当当前画师的收藏夹爬取完毕后，就从画师数据库中随机抽取一个新的画师重复之前的步骤。这样的策略可以从点到面的快速、无休止地多线程爬取高质量的画作。

2 March 2017

Pyinstaller打包PyQt5踩的坑

在做完一个P站的爬虫后,我决定为之制作一个UI界面，并使用Pyinstaller打包为exe发布。

然后呢，我不出意料的踩了很多坑_(:3」∠)_

27 January 2017

asyncio的学习与应用

一直在制作完善pixiv的爬虫，最近遇到了一个问题，学校的网络环境太差了，导致了IO阻塞时间过长，常常出现线程长时间阻塞，占用了时间和内存。

为了解决这个问题，我决定尝试制定一个超时的图片删除重新爬取的过程，三次爬取不全则log报错不再爬取。

同时将整个脚本搬运至3.5版本，重新用asyncio异步编写，减少线程使用。

4 December 2016

魔方

为了写出一个Python版的二阶段算法求解魔方。

今天开始学cpp（蜜汁需求得到的蜜汁结果）。

就酱紫。

随时更新。

12 October 2016

Python常用库文档

现在的搜索引擎非常不讲武德，记录一些常用的 Python 库文档地址，为不时之需。

9 October 2016

Abrahum Link

Tag: #Python

常用命令工具记录

Pixiv数据分析

Pyinstaller打包PyQt5踩的坑

asyncio的学习与应用

魔方

Python常用库文档