来的问卷数据和文字稿。
“电脑密码是初始密码,登录后自己改。公司内网有共享盘,常用的分析模板、过往项目案例、公司规章制度都在里面,你有空可以看看。通讯工具用企业微信,我已经把你拉进项目群了。其他事情,边做边学。”李岚交代得很简洁,没有多余的寒暄或鼓励,说完就转身回到了自己斜后方不远的一个工位。
陈默坐下,打开电脑,登录。桌面很干净,只有几个必备软件的图标。他先按照提示修改了密码,然后登录企业微信。果然有一个名为“烘焙项目组(核心)”的群,成员包括方经理、李岚、另一个叫“赵鹏”的男同事,以及他自己。李岚在群里@了他,发了一个文件压缩包和一个在线文档链接。压缩包是数据分析模板和操作指南,在线文档是项目背景和本次数据清洗的具体要求。
他点开在线文档,快速浏览。项目背景很简单,就是一家本地烘焙品牌想了解消费者画像和购买偏好,委托他们做调研。数据清洗要求包括:剔除填写时间过短或过长的问卷;处理缺失值和明显矛盾的回答(如年龄填18岁但职业填“退休”);将开放题的文本回答进行初步归类编码;将整理好的数据填入指定的Excel模板的对应位置。文档里还附带了一些简单的数据透视表示例,说明最终需要产出哪些基础的统计图表(如年龄分布、购买频率、口味偏好排行等)。
任务本身并不复杂,甚至可以说有些机械。但对陈默而言,这是一个全新的领域。他之前的数据录入是机械的票据识别,而现在是对“有意义的”商业数据进行处理。他需要理解每个字段(如Q1:性别,Q2:年龄……)的含义,判断哪些是有效数据,哪些是“噪音”。他打开李岚给的原始数据文件,是SPSS格式的,他不太熟,但操作指南里有如何导出为Excel的步骤。他一步步照着做。
下午的时间就在熟悉软件、阅读指南、尝试操作中过去。他遇到几个小问题:某个字段的取值说明看不懂,某个清洗规则在具体数据上
本章未完,请点击"下一页"继续阅读! 第3页 / 共7页