一文学会Power Query:让数据清洗实现自动化

张开发
2026/5/24 8:48:25 15 分钟阅读
一文学会Power Query:让数据清洗实现自动化
🏷️ 标签:Excel | Power Query | 数据清洗 | ETL | 数据分析 | Excel技巧前言:你还在手动清洗数据吗?数据分析师圈子里有个经典笑话:“80%的时间在清洗数据,20%的时间在抱怨为什么要清洗数据。”这话说得扎心,但很真实。想象这样一个场景:每周一,你都要从ERP系统导出一份上周销售数据,然后:删除空白行把"2024-01-01"格式统一成"20240101"把"销售额"列的数字格式修复(因为导出时它莫名其妙变成了文本)把A列和B列合并成一个字段删除C列里那些乱码把处理好的数据复制到汇总表里每周重复一次,每次20分钟。一年下来,8小时就这么没了。今天这篇文章,我要介绍的工具——Power Query——能把这20分钟变成一键自动,5秒钟搞定。而且——你改需求了?加个字段?换个数据源?点点鼠标就能改,公式不用动一根汗毛。一、Power Query 是什么?先破除三个误解误解一:“Power Query就是个高级筛选工具”错。Power Query的核心是ETL:E(Extract) → 提取:从各种数据源拉取数据 T(Transform)→ 转换:清洗、改造、重构数据 L(Load) → 加载:把处理好的数据放到目标位置这跟"筛选"完全不是一个量级的东西。误解二:“Power Query太复杂,Excel基础用户用不上”Power Query最大的特点,恰恰就是不需要写代码。所有操作都是"点击 + 点点鼠标",每一步操作都被自动记录成"查询步骤"——你可以随时回溯、修改、删除任何一步。比Excel函数还直观,因为你能看到每一步在做什么。误解三:“Power Query加载很慢,不如手动快”那是因为你没体会到**“下次更快”**的价值。Power Query的查询一旦建立,下次数据更新时,你只需要"刷新",所有步骤自动重跑。手动处理:每周20分钟 × 52周 = 17小时/年Power Query:第1次建查询30分钟,之后每次刷新5秒钟用得越久,省得越多。二、Power Query 界面:认识三个核心区域2.1 启动 Power Query方法一:数据 → 获取数据 → 选择数据源方法二:数据 → 从表/区域(把当前Excel数据加载到Power Query)方法三:直接 Alt + N + P(新版本快捷键)2.2 Power Query 编辑器的三大区域┌──────────────────────────────────────────────────────┐ │ 功能区(操作按钮都在这里) │ │ [主页] [转换] [添加列] [查看] │ ├──────────────────────────────────────────────────────┤ │ 查询列表(左边栏)│ 数据预览(中间主区域) │ │ 查询1 │ ┌────┬────┬────┐ │ │ 查询2 │ │列A │列B │列C │ │ │ 查询3 │ ├────┼────┼────┤ │ │ │ │数据│数据│数据│ │ │ │ └────┴────┴────┘ │ ├──────────────────────────────────────────────────────┤ │ 查询设置(右边栏) │ │ 应用的步骤: │ │ ① 源(数据来源) │ │ ② 更改的类型 │ │ ③ 删除的空行 │ │ ④ 合并列

更多文章