01|搭建你的第一个自动化工作台
场景引入:一封来自产品经理的邮件
周一早晨,你打开邮箱,发现产品经理发来一条消息:“能不能写个脚本,把这 500 个 Excel 里的数据汇总一下?手动复制粘贴太慢了。“你看着那堆文件,心里盘算——如果有一门语言能快速上手、几行代码就搞定这种重复劳动,该多好。
这门语言就是 Python。
但在动手写脚本之前,你需要先把工具准备好。这一章的目标很明确:理解 Python 的定位,完成环境搭建,写出第一段可运行的代码。
Python 在技术栈中的定位
Python 是一门通用型解释语言,诞生于 1991 年。它的设计哲学可以归纳为一个词:可读性。语法结构接近自然语言描述,同样的业务逻辑,用 Python 表达通常比 C 或 Java 短数倍。
来看一个直观的对比。判断一个人是否成年并输出提示,Python 的写法是:
if reg_age >= 18:
print("已成年")
else:
print("未成年")
即使你从未接触过编程,大概也能读懂这段代码的含义。正是这种”接近伪代码”的特质,让 Python 成为入门编程的首选语言。
这种简洁并非没有代价。Python 采用解释执行的方式——代码不需要预先编译为机器码,而是由解释器逐句翻译并运行。这意味着执行速度不及编译型语言。但在自动化脚本、数据处理、Web 后端、机器学习等绝大多数应用场景中,开发速度远比运行速度重要。
举个例子:完成同样一个数据汇总任务,用底层语言可能需要上百行代码和半天时间,而 Python 可能只需要二十行代码和十分钟。代码越短,引入缺陷的概率也越低。
Python 的版本
关于版本:Python 2 已于 2020 年 1 月 1 日正式停止维护,本教程全部基于 Python 3(建议使用 3.12 及以上版本)。如果你在网络上看到不带括号的 print 语句(如 print "hello"),那属于 Python 2 语法,可以直接跳过。
Python 的核心应用领域
Python 的应用范围之广,在编程语言中名列前茅:
- 自动化与脚本:批量重命名文件、定时抓取数据、自动生成报表、自动发送邮件
- 后端服务:构建 API 接口、处理业务逻辑、开发 Web 应用
- 数据科学与机器学习:数据清洗、统计分析、模型训练、可视化呈现
- 系统运维:服务器批量部署、日志分析、监控告警
- 快速原型验证:把想法用最短时间变成可运行的 demo
- 桌面小工具:用 GUI 库开发简单的桌面应用程序
丰富的生态
Python 拥有数十万个第三方库(你可以理解为别人已经造好的工具),覆盖了你能想到的几乎所有领域。无论是发送 HTTP 请求、处理 Excel 表格、操作数据库还是训练神经网络,都有成熟的库可以直接调用。
活跃的社区
全球数百万开发者使用 Python,技术论坛、问答网站、开源项目中有海量的 Python 相关资源。遇到问题时,大概率能在网上找到解答。
就业与职业发展
数据分析师、机器学习工程师、后端开发、DevOps 工程师、测试工程师等众多岗位都将 Python 列为必备或加分技能。掌握 Python 不仅能提高日常工作效率,也能为职业发展打开更多可能性。
Python 的局限性
客观地说,Python 也有不足:
- 执行效率:相比 C/C++/Rust/Go 等编译型语言,Python 的运行速度确实慢很多
- 移动端开发:Python 不太适合开发手机 App
- 代码保护:Python 是解释型语言,代码以明文存在,不容易加密
然而,对于多数工程场景而言,这些局限不构成实际障碍。“一小时写完并投入使用”与”一周写完但跑得快十倍”之间,前者往往是更务实的选择。况且计算机的性能在不断提升,Python 的速度劣势在大多数场景中已经感知不到。
安装 Python 运行环境
Windows 平台
- 前往 Python 官方下载页面,获取最新 3.x 安装包
- 运行安装程序时,务必勾选底部的”Add Python to PATH”选项——遗漏此步骤会导致命令行无法识别
python命令 - 完成安装
也可以通过 Scoop 包管理器快速安装:
scoop install python
macOS 平台
推荐使用 Homebrew:
brew install python3
也可以从官方网站下载 macOS 版安装包。
Linux 平台
主流发行版通常已预装 Python 3。验证方式:
python3 --version
若未安装,使用系统包管理器:
# Debian / Ubuntu
sudo apt-get install python3
# RHEL / CentOS
sudo yum install python3
# Fedora
sudo dnf install python3
验证安装
在终端(Windows 为 PowerShell 或命令提示符)中执行:
python --version
macOS / Linux 可能需要使用 python3:
python3 --version
如果输出类似 Python 3.12.x,说明安装成功。
排查常见问题:
- Windows 下提示”不是内部或外部命令”:重新运行安装程序并勾选 PATH 选项,或手动将 Python 安装路径加入系统环境变量
- macOS 下
python命令无效:尝试python3,macOS 默认可能不提供python别名
运行第一段代码
交互模式
在终端输入 python(或 python3)进入交互式解释器:
Python 3.12.0 (tags/v3.12.0:...)
Type "help", "copyright", "credits" or "license" for more information.
>>>
>>> 是输入提示符。输入以下内容并按回车:
>>> print("environment ready")
environment ready
print() 是 Python 的内置输出函数,它将括号内的内容显示在屏幕上。
输入 exit() 退出交互模式。
脚本模式
交互模式适合快速验证,但实际开发中代码需要保存为文件。
- 创建一个工作目录,例如
workspace - 在目录下新建文件
startup.py(Python 脚本以.py为扩展名) - 写入以下内容:
print("environment ready")
print("automation workbench initialized")
- 在终端中运行:
python startup.py
输出:
environment ready
automation workbench initialized
更多脚本示例
# 计算矩形的面积
width = 12
height = 8
area = width * height
print(area) # 96
# 字符串的拼接
print("auto" + "mation") # automation
# 重复输出
print("=-" * 20) # 输出 "=-" 重复 20 次,共 40 个字符
# 同时输出多个值
print("宽", width, "高", height, "面积", area)
把交互模式当作草稿本
交互模式在验证语法和做快速计算时非常方便。你可以把它当成一个增强版计算器:
>>> 365 * 24 # 一年有多少小时
8760
>>> 2 ** 16 # 2 的 16 次方
65536
>>> 100 / 7 # 除法(结果为浮点数)
14.285714285714286
>>> 100 // 7 # 整除(只取整数部分)
14
>>> 100 % 7 # 取余(100 除以 7 的余数)
2
>>> 1.5e8 # 科学计数法:1.5 亿
150000000.0
Python 支持的基本算术运算一览:
| 运算符 | 含义 | 示例 | 结果 |
|---|---|---|---|
+ | 加法 | 3 + 5 | 8 |
- | 减法 | 10 - 4 | 6 |
* | 乘法 | 6 * 7 | 42 |
/ | 除法 | 15 / 4 | 3.75 |
// | 整除 | 15 // 4 | 3 |
% | 取余 | 15 % 4 | 3 |
** | 幂运算 | 2 ** 10 | 1024 |
交互模式中有一个特殊变量 _(下划线),它保存上一次表达式的计算结果,在连续计算时非常方便:
>>> 200 + 300
500
>>> _ * 2
1000
>>> unit_cost = 49.9
>>> unit_cost * 0.8
39.92
>>> round(_, 1) # 对上一次结果四舍五入
39.9
# 号后面的内容是注释,解释器会跳过它们。注释是写给人看的,用于说明代码意图。养成写注释的习惯,会让未来维护代码的人(通常是你自己)受益匪浅。
解释型执行与编译型执行的区别
为什么 Python 不需要”编译”就能运行?
编程语言按执行方式可分为两类:
编译型(如 C、Go)
源代码 → 编译器 → 机器码 → 直接执行
特点:运行速度快,但编译过程耗时
解释型(如 Python、Ruby)
源代码 → 解释器 → 逐行翻译执行
特点:开发迭代快,但运行速度慢
Python 默认使用名为 CPython 的解释器(用 C 语言编写)。还有 PyPy(JIT 编译,运行更快)、Jython(运行在 JVM 上)等替代实现。此外,IPython 是一个基于 CPython 的增强交互式 Shell,提供更好的补全和调试体验。学习阶段使用默认的 CPython 即可。
两种运行方式的适用场景
| 方式 | 适用场景 | 特点 |
|---|---|---|
| 交互模式 | 验证语法、快速计算、学习新特性 | 即时反馈,不保存代码 |
| 脚本文件 | 编写完整程序、项目开发 | 代码持久化,可重复运行 |
建议:学习新语法时先在交互模式中试验,确认理解后再写入脚本文件。
配置开发工具
用纯文本编辑器写代码虽然可行,但专业的编辑器能显著提升效率。这里推荐 Visual Studio Code。
VS Code 的核心优势
- 免费且开源
- 启动速度快,资源占用低
- 通过插件生态支持语法高亮、智能补全、错误检测
- 内置终端,可直接运行代码
- 跨平台支持
快速配置步骤
- 下载并安装 VS Code
- 打开扩展面板(左侧栏的方块图标)
- 搜索并安装 “Python” 官方扩展
- 可选:安装中文语言包
运行代码
打开 .py 文件后:
- 点击右上角三角形按钮运行
- 或使用快捷键
Ctrl+F5(Windows)/Control+F5(Mac) - 或在内置终端中手动执行
python 文件名.py
其他可选工具
- PyCharm:功能全面的专业 IDE,社区版免费,适合大型项目
- Sublime Text:极轻量的文本编辑器
- Jupyter Notebook:交互式笔记本,适合数据探索
包管理工具 pip
Python 生态拥有数十万个第三方库。安装和管理这些库的工具是 pip,它随 Python 一同安装。
核心命令
# 安装库
pip install httpx
# 安装指定版本
pip install httpx==0.28.1
# 升级库
pip install --upgrade httpx
# 卸载库
pip uninstall httpx
# 列出已安装的库
pip list
# 查看某个库的详情
pip show httpx
动手体验
安装一个文本艺术库并使用它:
pip install pyfiglet
创建 banner.py:
import pyfiglet
output = pyfiglet.figlet_format("Ready")
print(output)
运行后你会看到由字符组成的大号艺术字,类似这样:
____ _
| _ \ ___ __ _ __| |_ _
| |_) / _ \/ _` |/ _` | | | |
| _ < __/ (_| | (_| | |_| |
|_| \_\___|\__,_|\__,_|\__, |
|___/
这个小实验展示了 Python 第三方库的使用方式:先用 pip install 安装,然后在代码中用 import 导入,接着调用库提供的函数。后续章节会详细讲解这个流程。
加速下载
默认的包仓库服务器在海外,下载速度可能较慢。可以临时指定镜像源:
pip install httpx -i https://pypi.tuna.tsinghua.edu.cn/simple
也可以设置为永久默认:
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
pip 命令无法使用时的替代方式
# 方式一:通过 python -m 调用
python -m pip install httpx
# 方式二:macOS/Linux 可能需要用 pip3
pip3 install httpx
虚拟环境概述
当你同时维护多个项目,每个项目依赖的库版本可能不同。Python 提供了虚拟环境(virtual environment)机制,为每个项目创建独立的依赖空间:
# 创建虚拟环境
python -m venv proj_env
# 激活
# Windows:
proj_env\Scripts\activate
# macOS / Linux:
source proj_env/bin/activate
# 激活后,终端前缀会出现 (proj_env)
# 此时安装的库仅对当前环境生效
pip install httpx
# 退出虚拟环境
deactivate
入门阶段可以暂不使用虚拟环境。当你开始处理多个并行项目时,建议养成为每个项目单独创建环境的习惯。
动手实验:用 Python 完成一个实际任务
在结束本章之前,让我们用已经掌握的知识完成一个稍微完整的练习。创建一个文件 sys_info.py,运行后输出一些系统和 Python 环境的基本信息:
import sys
import platform
print("===== 环境信息报告 =====")
print(f"Python 版本: {sys.version}")
print(f"操作系统: {platform.system()} {platform.release()}")
print(f"处理器架构: {platform.machine()}")
print(f"当前编码: {sys.getdefaultencoding()}")
print("========================")
print("环境检查完毕,一切就绪!")
这里用到了 import 语句来引入 Python 标准库中的 sys 和 platform 模块。虽然我们还没有正式学习模块的概念,但这个例子可以让你初步感受 Python 标准库的强大——只需几行代码就能获取操作系统和运行环境的详细信息。
运行这段脚本:
python sys_info.py
你会看到类似如下的输出:
===== 环境信息报告 =====
Python 版本: 3.12.0 (main, Oct 2 2024, ...)
操作系统: Darwin 25.0.0
处理器架构: arm64
当前编码: utf-8
========================
环境检查完毕,一切就绪!
本章回顾
| 要点 | 内容 |
|---|---|
| Python 的定位 | 通用解释型语言,强调可读性和开发效率 |
| 版本选择 | 使用 Python 3(2 已停止维护) |
| 环境安装 | Windows / macOS / Linux 三种方式 |
| 交互模式 | 即时验证语法,适合学习和快速计算 |
| 脚本模式 | 代码保存为 .py 文件,可重复运行 |
| 开发工具 | 推荐 VS Code + Python 扩展 |
| pip | 第三方库的安装与管理 |
实践任务
- 在你的系统上完成 Python 安装,在交互模式中执行
print("environment ready"),确认环境正常 - 创建一个
.py脚本文件,包含多行print()调用,在终端中运行它并观察输出 - 安装并配置 VS Code 的 Python 开发环境,用编辑器打开上一步的脚本文件并运行
- 使用 pip 安装
pyfiglet库,编写脚本调用它生成 ASCII 艺术字 - 在交互模式中尝试各种算术运算:加减乘除、整除、取余、幂运算
- 运行本章最后的
sys_info.py示例,查看你的 Python 运行环境信息
完成以上任务后,你已经具备了 Python 开发的基础设施。下一章,我们将从一个数据录入场景出发,学习如何用变量存储信息、区分不同的数据类型,并掌握字符串处理的核心技巧。
购买课程解锁全部内容
零基础到独立开发:Python 自动化与 Web 实战
¥29.90