Python 标准模块-sys

2023-10-18

sys 模块主要是针对与 Python 解释器相关的变量和方法，不是主机操作系统。

常用属性与方法

more >>

Python Selenium 自动化

2023-10-18

官方文档: Selenium 浏览器自动化项目

Selenium 是支持 web 浏览器自动化的一系列工具和库的综合项目。它提供了扩展来模拟用户与浏览器的交互，用于扩展浏览器分配的分发服务器，以及用于实现 W3C WebDriver 规范的基础结构，该规范允许您为所有主要 Web 浏览器编写可互换的代码。

Selenium 的核心是 WebDriver，这是一个编写指令集的接口，可以在许多浏览器中互换运行。这里有一个最简单的说明：

more >>

展开全文 >>

Python 爬虫解析库的安装

2023-10-18

参考内容：Python3 网络爬虫开发实战-崔庆才

抓取网页代码之后，下一步就是从网页中提取信息。提取信息的方式有多种多样，可以使用正则来提取，但是写起来相对较繁琐。这里还有许多强大的解析库，如 lxml，Beautiful Soup，pyquery 等。此外还提供了非常大的解析方法，如 XPath 解析和 CSS 选择器解析等，利用它们，我们可以高效便捷地从网页中提取有效信息。

more >>

展开全文 >>

爬虫框架的安装

2023-10-18

参考内容：Python3 网络爬虫开发实战-崔庆才

我们直接用 requests，Selenium 等库写爬虫，如果爬取量不是太大，速度要求不高，是完全可以满足需求的。但是写多了会发现其内部许多代码和组件是可以复用的，如果我们把这些组件抽离出来，将各个功能模块化，就慢慢会形成一个框架雏形，久而久之，爬虫的框架就诞生了。

more >>

展开全文 >>

APP 爬取相关库的安装

2023-10-18

参考内容：Python3 网络爬虫开发实战-崔庆才

除了 Web 网页，爬虫也可以抓取 App 的数据。App 中的页面要加载出来，首先需要获取数据，而这些数据一般是通过请求服务器的接口来获取的。由于 App 没有浏览器这种可以比较直观的看到后台请求的工具，所以主要用一些抓包技术来抓取数据。

more >>

展开全文 >>

存储库的安装

2023-10-18

参考内容：Python3 网络爬虫开发实战-崔庆才

在数据库的安装介绍了几个数据库的安装方式，但这仅仅是用来存储数据的数据库，它们提供了存储服务，但如果想和 Python 交互的话，还需要安装一些 Python 存储库，如 MySQL 需要安装 PyMySQL，MongoDB 需要安装 PyMongo 等。

more >>

展开全文 >>

使用 Pandas 做数据可视化

2023-10-18

内容来源：https://mp.weixin.qq.com/s/k5hmJAljN4vu52HP9wWBxQ

数据客户化可以让我们很直观的发现数据中隐藏的规律，察觉到变量之间的互动关系，可以帮助我们更好的给他人解释现象，做到一图胜千文的说明效果。

常见的数据可视化库有：

matplotlib：是最常见的2维库，可以算作可视化的必备技能库，由于 matplotlib 是比较底层的库，api 很多，代码学起来不太容易。
seaborn：是构建于 matplotlib 基础上，能满足绝大多数可视化需求。更特殊的需求还是需要学习 matplotlib；
pyecharts：上面两个库都是静态的可视化库，而 pyecharts 有很好的 web 兼容性，可以做到可视化的动态效果。

more >>

展开全文 >>

Flask 入门(二)

2023-10-18

原文地址：[Python web 开发实战]

即插视图

即插视图的灵感来自 Django 的基于类而不是函数的通用视图方式，这样的视图就可以支持继承了。视图类型有两种类型。

more >>

展开全文 >>

Python 标准模块-os

2023-10-18

官方文档地址: os – 各种操作系统接口

os 模块是 Python 标准库中的一个用于访问操作系统相关功能的模块，os 提供了一种可移植的使用操作系统功能的方法。使用 os 模块中提供的接口，可以实现跨平台访问，但是，并不是所有的 os 模块中的接口在全平台都通用，有些接口的实现是依赖特定平台的，比如 Linux 相关的文件权限管理和进程管理。

os 模块的主要功能有:

more >>

展开全文 >>

Python 标准模块 - subprocess

2023-10-18

subprocess 是 Python 自带的模块，无须安装，它主要用来取代一些旧的模块或方法，如 os.system, os.spawn*, os.popen*, commands.*等，因此如果需要使用 Python 调用外部命令或任务时，则优先使用 subprocess 模块。使用 subprocess 模块可以方便地执行操作系统支持的命令，可与其他应用程序结合使用。

subprocess.run() 方法

subprocess.run() 是官方推荐使用的方法，几乎所有的工作都可以由它来完成。

more >>

展开全文 >>