线上调研数据处理的四个原则
在进行线上调研的时候,注意以下四个原则,可以帮助你少走弯路,少踩坑。
通过线上调研的方式收集的数据,因其调研方法有别于传统的面对面调研,所以在进行数据处理分析时需要额外注意一些细节。
原则一:数据完整
在线调研的数据,是通过网页或手机app收集而来,难免会存在因为浏览器插件、安全软件、不兼容等因素导致的数据丢失情况。因此在调研上线前首先要进行测试,多尝试几种浏览器进行测试,看能否正常递交数据;其次,在分析数据时,首先要进行数据完整性检查,包括是否有漏答、跳题逻辑是否正确,否则你可能会在报告写到一半时,发现数据有缺失。
原则二:数据干净
在线调研不可避免会存在乱答题的情况,如果乱答题的人太多,容易影响数据质量,所以在检查了数据完整性后,需要对数据进行清洗,可以从以下几个方面进行:
- 答题时长,一方面可以邀请几个同事进行试填答,做好计时,另一方面可以计算平均(去掉极端值)答题时间,也可以考虑一个成年人的阅读字数来计算参考,以上述几个时间都可以作为标准来进行清洗。另外,答题时间太久了也需要清洗掉。(注意不同逻辑条件下,用户回答的问题数可能会不一样,需要考虑此方面)
- 填空题答题质量,填空题的内容能反映出一个填答者的态度,如果很敷衍、甚至乱答的,可以进行剔除;
- 题目或选项之间隐藏逻辑,比如:年龄25岁以上,还说自己在读高中;个人年收入大于家庭年收入;同时选择了两个明显互相矛盾的选项;
- 选项个数,所有多选题的选项都只选1个,尤其是明显不是一个答案的选择题(比如,你知道哪些洗发水品牌);
- 矩阵题(表格形式)都选同一个选项的;
- 建议在问卷设计时,设置1-2个可以进行验证的地雷题,以便筛选出去那些不认真填答的人;(如:前面题目询问家中拥有的设备,如汽车、ipad。。。,后面题目询问家中是否有私家车);
原则三:数据代表性
问卷数据一般是通过抽样调查的方式获得,因此抽样方法不一样,回收回来的数据代表性意义也不一样;如果是随机抽样(受限于各种条件,一般无法做到真正意义上的随机抽样),则回收的数据可以认为具有代表性-能代表总体;若采用分层抽样(如分地区各抽取10万用户),这样的抽样获得的数据,由于事先进行了样本配比,所以其不能代表总体,在结果统计时,需要对不同地区的样本进行加权(权重可以参考不同地区用户的实际占比)处理。
原则四:数据处理过程可回溯
在进行数据检查、清洗的过程中,往往需要进行多步骤操作,难免发生在处理的过程中出错的情况,因此需要在一些关键步骤上进行数据保存,并进行备注,以防止需要回溯的情况;在编写查错程序时,也要将程序保存下来,防止出错,也方便进行反查;
在线调研数据处理时要特别注意上述原则,能让你的工作更有效率、少走弯路。(什么,你们有DP?那这篇文章你就当看看热闹!)
作者:李兆平
来源:http://ued.ctrip.com/?p=5614
关键字:产品经理, 线上调研, 数据, 调研
版权声明
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!