03
第 03 个办公场景

数据清洗:把乱报名表聊成可统计数据

想要高效办公,唯有套路得 AI。办公不是拼指令,而是会交代活。 Codex-ZH 办公实战只记一个套路:问补做。

今天这件活

场景

你手里有一张活动报名表,手机号格式不一、城市写法不统一、渠道别名混在一起,还有重复报名和测试记录。最怕的不是表难看,而是后面统计出来的数不准。

问补做

 先说你现在最烦的事。

 说清材料在哪、要改成什么样、哪些不能碰。

 聊清楚了,结果就出来了。

把活聊清楚,也就做完了。

先说你怕统计不准

不用先讲函数、公式或清洗规则。把你最担心的事说出来,Codex-ZH 会先帮你拆问题。

我有一张报名表,手机号、城市、渠道看起来都有点乱,还有重复报名。我怕最后统计出来不准,你先帮我看看该怎么清理。
Codex-ZH · 报名表清洗
你先说报名表乱、怕统计不准,Codex-ZH 帮你拆出清洗范围
这里 Codex-ZH 没有直接动表,而是先把问题拆成几类:手机号、城市、渠道、重复报名、异常记录和输出结果

当它把范围问出来,你就补三件事:文件在哪、结果要什么、原始表哪些地方不能碰。

把路径和底线补齐

这一步不是写技术规则,而是把办公里的底线说清楚:原表别动、结果另存、要有问题记录。

资料在桌面上的“报名表清洗”文件夹,里面有 raw_signups.csv 和 cleaning_rules.md。原始表别动,结果放到桌面上的“报名表清洗结果”文件夹。最后给我清理后的表、问题记录、简单汇总,最好再有一个 Excel 汇总表。你先确认一下会怎么处理。
Codex-ZH · 报名表清洗
你补充文件路径、原表不动、输出文件和 Excel 汇总表要求
Codex-ZH 会把你的话收敛成明确清单:哪些字段要统一、哪些记录要删除、会输出哪些文件。这样你能先看懂它准备怎么做。

方案清楚以后,再确认执行。接下来你看的重点不是过程多复杂,而是它有没有交付可检查的结果。

确认后看交付结果

这次它生成了清理后的 CSV、问题记录、摘要和 Excel 汇总表。

可以,就按这个方案清理。
Codex-ZH · 报名表清洗
Codex-ZH 完成数据清洗,并列出输出文件、汇总结果和主要处理
完成页会告诉你原始记录数、有效记录数、问题记录数,以及主要处理动作。你不用猜它删了什么,直接看问题记录就行
报名表清洗结果预览
本篇交付物

做到这样,表就能拿去统计

这次清洗不是把表变漂亮,而是把数据变得可追溯、可复核。

  • 原始 12 条记录保留,清理后有效记录 7 条。
  • 11 条问题记录单独列出,能看到删除、异常和字段修正原因。
  • 生成 Excel 汇总表,方便发给同事继续检查。
收工前,把这个套路带走

数据清洗最怕的不是不会公式,而是不敢说清楚要保留什么、要删什么

下次你遇到一张乱表,不用先想怎么写函数。先把担心说出来,再补清原表、规则、输出和不能碰的地方,Codex-ZH 就能把表变成可检查的交付物。

问:我怕哪里统计不准。 补:表在哪,按什么规则清,原表能不能动,结果要放哪。 做:看清理结果、问题记录和汇总表是否能复核。

表格工作不是先会公式,而是先把清洗标准聊清楚。