跳到主要内容
预计阅读 21 分钟

01|搭建你的第一个自动化工作台

场景引入:一封来自产品经理的邮件

周一早晨,你打开邮箱,发现产品经理发来一条消息:“能不能写个脚本,把这 500 个 Excel 里的数据汇总一下?手动复制粘贴太慢了。“你看着那堆文件,心里盘算——如果有一门语言能快速上手、几行代码就搞定这种重复劳动,该多好。

这门语言就是 Python。

但在动手写脚本之前,你需要先把工具准备好。这一章的目标很明确:理解 Python 的定位,完成环境搭建,写出第一段可运行的代码


Python 在技术栈中的定位

Python 是一门通用型解释语言,诞生于 1991 年。它的设计哲学可以归纳为一个词:可读性。语法结构接近自然语言描述,同样的业务逻辑,用 Python 表达通常比 C 或 Java 短数倍。

来看一个直观的对比。判断一个人是否成年并输出提示,Python 的写法是:

if reg_age >= 18:
    print("已成年")
else:
    print("未成年")

即使你从未接触过编程,大概也能读懂这段代码的含义。正是这种”接近伪代码”的特质,让 Python 成为入门编程的首选语言。

这种简洁并非没有代价。Python 采用解释执行的方式——代码不需要预先编译为机器码,而是由解释器逐句翻译并运行。这意味着执行速度不及编译型语言。但在自动化脚本、数据处理、Web 后端、机器学习等绝大多数应用场景中,开发速度远比运行速度重要。

举个例子:完成同样一个数据汇总任务,用底层语言可能需要上百行代码和半天时间,而 Python 可能只需要二十行代码和十分钟。代码越短,引入缺陷的概率也越低。

Python 的版本

关于版本:Python 2 已于 2020 年 1 月 1 日正式停止维护,本教程全部基于 Python 3(建议使用 3.12 及以上版本)。如果你在网络上看到不带括号的 print 语句(如 print "hello"),那属于 Python 2 语法,可以直接跳过。

Python 的核心应用领域

Python 的应用范围之广,在编程语言中名列前茅:

  • 自动化与脚本:批量重命名文件、定时抓取数据、自动生成报表、自动发送邮件
  • 后端服务:构建 API 接口、处理业务逻辑、开发 Web 应用
  • 数据科学与机器学习:数据清洗、统计分析、模型训练、可视化呈现
  • 系统运维:服务器批量部署、日志分析、监控告警
  • 快速原型验证:把想法用最短时间变成可运行的 demo
  • 桌面小工具:用 GUI 库开发简单的桌面应用程序

丰富的生态

Python 拥有数十万个第三方库(你可以理解为别人已经造好的工具),覆盖了你能想到的几乎所有领域。无论是发送 HTTP 请求、处理 Excel 表格、操作数据库还是训练神经网络,都有成熟的库可以直接调用。

活跃的社区

全球数百万开发者使用 Python,技术论坛、问答网站、开源项目中有海量的 Python 相关资源。遇到问题时,大概率能在网上找到解答。

就业与职业发展

数据分析师、机器学习工程师、后端开发、DevOps 工程师、测试工程师等众多岗位都将 Python 列为必备或加分技能。掌握 Python 不仅能提高日常工作效率,也能为职业发展打开更多可能性。

Python 的局限性

客观地说,Python 也有不足:

  • 执行效率:相比 C/C++/Rust/Go 等编译型语言,Python 的运行速度确实慢很多
  • 移动端开发:Python 不太适合开发手机 App
  • 代码保护:Python 是解释型语言,代码以明文存在,不容易加密

然而,对于多数工程场景而言,这些局限不构成实际障碍。“一小时写完并投入使用”与”一周写完但跑得快十倍”之间,前者往往是更务实的选择。况且计算机的性能在不断提升,Python 的速度劣势在大多数场景中已经感知不到。


安装 Python 运行环境

Windows 平台

  1. 前往 Python 官方下载页面,获取最新 3.x 安装包
  2. 运行安装程序时,务必勾选底部的”Add Python to PATH”选项——遗漏此步骤会导致命令行无法识别 python 命令
  3. 完成安装

也可以通过 Scoop 包管理器快速安装:

scoop install python

macOS 平台

推荐使用 Homebrew:

brew install python3

也可以从官方网站下载 macOS 版安装包。

Linux 平台

主流发行版通常已预装 Python 3。验证方式:

python3 --version

若未安装,使用系统包管理器:

# Debian / Ubuntu
sudo apt-get install python3

# RHEL / CentOS
sudo yum install python3

# Fedora
sudo dnf install python3

验证安装

在终端(Windows 为 PowerShell 或命令提示符)中执行:

python --version

macOS / Linux 可能需要使用 python3

python3 --version

如果输出类似 Python 3.12.x,说明安装成功。

排查常见问题:

  • Windows 下提示”不是内部或外部命令”:重新运行安装程序并勾选 PATH 选项,或手动将 Python 安装路径加入系统环境变量
  • macOS 下 python 命令无效:尝试 python3,macOS 默认可能不提供 python 别名

运行第一段代码

交互模式

在终端输入 python(或 python3)进入交互式解释器:

Python 3.12.0 (tags/v3.12.0:...)
Type "help", "copyright", "credits" or "license" for more information.
>>>

>>> 是输入提示符。输入以下内容并按回车:

>>> print("environment ready")
environment ready

print() 是 Python 的内置输出函数,它将括号内的内容显示在屏幕上。

输入 exit() 退出交互模式。

脚本模式

交互模式适合快速验证,但实际开发中代码需要保存为文件。

  1. 创建一个工作目录,例如 workspace
  2. 在目录下新建文件 startup.py(Python 脚本以 .py 为扩展名)
  3. 写入以下内容:
print("environment ready")
print("automation workbench initialized")
  1. 在终端中运行:
python startup.py

输出:

environment ready
automation workbench initialized

更多脚本示例

# 计算矩形的面积
width = 12
height = 8
area = width * height
print(area)                   # 96

# 字符串的拼接
print("auto" + "mation")     # automation

# 重复输出
print("=-" * 20)              # 输出 "=-" 重复 20 次,共 40 个字符

# 同时输出多个值
print("宽", width, "高", height, "面积", area)

把交互模式当作草稿本

交互模式在验证语法和做快速计算时非常方便。你可以把它当成一个增强版计算器:

>>> 365 * 24              # 一年有多少小时
8760
>>> 2 ** 16               # 2 的 16 次方
65536
>>> 100 / 7               # 除法(结果为浮点数)
14.285714285714286
>>> 100 // 7              # 整除(只取整数部分)
14
>>> 100 % 7               # 取余(100 除以 7 的余数)
2
>>> 1.5e8                 # 科学计数法:1.5 亿
150000000.0

Python 支持的基本算术运算一览:

运算符含义示例结果
+加法3 + 58
-减法10 - 46
*乘法6 * 742
/除法15 / 43.75
//整除15 // 43
%取余15 % 43
**幂运算2 ** 101024

交互模式中有一个特殊变量 _(下划线),它保存上一次表达式的计算结果,在连续计算时非常方便:

>>> 200 + 300
500
>>> _ * 2
1000
>>> unit_cost = 49.9
>>> unit_cost * 0.8
39.92
>>> round(_, 1)       # 对上一次结果四舍五入
39.9

# 号后面的内容是注释,解释器会跳过它们。注释是写给人看的,用于说明代码意图。养成写注释的习惯,会让未来维护代码的人(通常是你自己)受益匪浅。


解释型执行与编译型执行的区别

为什么 Python 不需要”编译”就能运行?

编程语言按执行方式可分为两类:

编译型(如 C、Go)
  源代码 → 编译器 → 机器码 → 直接执行
  特点:运行速度快,但编译过程耗时

解释型(如 Python、Ruby)
  源代码 → 解释器 → 逐行翻译执行
  特点:开发迭代快,但运行速度慢

Python 默认使用名为 CPython 的解释器(用 C 语言编写)。还有 PyPy(JIT 编译,运行更快)、Jython(运行在 JVM 上)等替代实现。此外,IPython 是一个基于 CPython 的增强交互式 Shell,提供更好的补全和调试体验。学习阶段使用默认的 CPython 即可。

两种运行方式的适用场景

方式适用场景特点
交互模式验证语法、快速计算、学习新特性即时反馈,不保存代码
脚本文件编写完整程序、项目开发代码持久化,可重复运行

建议:学习新语法时先在交互模式中试验,确认理解后再写入脚本文件。


配置开发工具

用纯文本编辑器写代码虽然可行,但专业的编辑器能显著提升效率。这里推荐 Visual Studio Code

VS Code 的核心优势

  • 免费且开源
  • 启动速度快,资源占用低
  • 通过插件生态支持语法高亮、智能补全、错误检测
  • 内置终端,可直接运行代码
  • 跨平台支持

快速配置步骤

  1. 下载并安装 VS Code
  2. 打开扩展面板(左侧栏的方块图标)
  3. 搜索并安装 “Python” 官方扩展
  4. 可选:安装中文语言包

运行代码

打开 .py 文件后:

  • 点击右上角三角形按钮运行
  • 或使用快捷键 Ctrl+F5(Windows)/ Control+F5(Mac)
  • 或在内置终端中手动执行 python 文件名.py

其他可选工具

  • PyCharm:功能全面的专业 IDE,社区版免费,适合大型项目
  • Sublime Text:极轻量的文本编辑器
  • Jupyter Notebook:交互式笔记本,适合数据探索

包管理工具 pip

Python 生态拥有数十万个第三方库。安装和管理这些库的工具是 pip,它随 Python 一同安装。

核心命令

# 安装库
pip install httpx

# 安装指定版本
pip install httpx==0.28.1

# 升级库
pip install --upgrade httpx

# 卸载库
pip uninstall httpx

# 列出已安装的库
pip list

# 查看某个库的详情
pip show httpx

动手体验

安装一个文本艺术库并使用它:

pip install pyfiglet

创建 banner.py

import pyfiglet

output = pyfiglet.figlet_format("Ready")
print(output)

运行后你会看到由字符组成的大号艺术字,类似这样:

 ____                _
|  _ \ ___  __ _  __| |_   _
| |_) / _ \/ _` |/ _` | | | |
|  _ <  __/ (_| | (_| | |_| |
|_| \_\___|\__,_|\__,_|\__, |
                       |___/

这个小实验展示了 Python 第三方库的使用方式:先用 pip install 安装,然后在代码中用 import 导入,接着调用库提供的函数。后续章节会详细讲解这个流程。

加速下载

默认的包仓库服务器在海外,下载速度可能较慢。可以临时指定镜像源:

pip install httpx -i https://pypi.tuna.tsinghua.edu.cn/simple

也可以设置为永久默认:

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

pip 命令无法使用时的替代方式

# 方式一:通过 python -m 调用
python -m pip install httpx

# 方式二:macOS/Linux 可能需要用 pip3
pip3 install httpx

虚拟环境概述

当你同时维护多个项目,每个项目依赖的库版本可能不同。Python 提供了虚拟环境(virtual environment)机制,为每个项目创建独立的依赖空间:

# 创建虚拟环境
python -m venv proj_env

# 激活
# Windows:
proj_env\Scripts\activate
# macOS / Linux:
source proj_env/bin/activate

# 激活后,终端前缀会出现 (proj_env)
# 此时安装的库仅对当前环境生效
pip install httpx

# 退出虚拟环境
deactivate

入门阶段可以暂不使用虚拟环境。当你开始处理多个并行项目时,建议养成为每个项目单独创建环境的习惯。


动手实验:用 Python 完成一个实际任务

在结束本章之前,让我们用已经掌握的知识完成一个稍微完整的练习。创建一个文件 sys_info.py,运行后输出一些系统和 Python 环境的基本信息:

import sys
import platform

print("===== 环境信息报告 =====")
print(f"Python 版本: {sys.version}")
print(f"操作系统: {platform.system()} {platform.release()}")
print(f"处理器架构: {platform.machine()}")
print(f"当前编码: {sys.getdefaultencoding()}")
print("========================")
print("环境检查完毕,一切就绪!")

这里用到了 import 语句来引入 Python 标准库中的 sysplatform 模块。虽然我们还没有正式学习模块的概念,但这个例子可以让你初步感受 Python 标准库的强大——只需几行代码就能获取操作系统和运行环境的详细信息。

运行这段脚本:

python sys_info.py

你会看到类似如下的输出:

===== 环境信息报告 =====
Python 版本: 3.12.0 (main, Oct  2 2024, ...)
操作系统: Darwin 25.0.0
处理器架构: arm64
当前编码: utf-8
========================
环境检查完毕,一切就绪!

本章回顾

要点内容
Python 的定位通用解释型语言,强调可读性和开发效率
版本选择使用 Python 3(2 已停止维护)
环境安装Windows / macOS / Linux 三种方式
交互模式即时验证语法,适合学习和快速计算
脚本模式代码保存为 .py 文件,可重复运行
开发工具推荐 VS Code + Python 扩展
pip第三方库的安装与管理

实践任务

  1. 在你的系统上完成 Python 安装,在交互模式中执行 print("environment ready"),确认环境正常
  2. 创建一个 .py 脚本文件,包含多行 print() 调用,在终端中运行它并观察输出
  3. 安装并配置 VS Code 的 Python 开发环境,用编辑器打开上一步的脚本文件并运行
  4. 使用 pip 安装 pyfiglet 库,编写脚本调用它生成 ASCII 艺术字
  5. 在交互模式中尝试各种算术运算:加减乘除、整除、取余、幂运算
  6. 运行本章最后的 sys_info.py 示例,查看你的 Python 运行环境信息

完成以上任务后,你已经具备了 Python 开发的基础设施。下一章,我们将从一个数据录入场景出发,学习如何用变量存储信息、区分不同的数据类型,并掌握字符串处理的核心技巧。

购买课程解锁全部内容

零基础到独立开发:Python 自动化与 Web 实战

¥29.90