线上调研数据处理的四个原则

2018-01-02 13:17:00

在进行线上调研的时候，注意以下四个原则，可以帮助你少走弯路，少踩坑。

通过线上调研的方式收集的数据，因其调研方法有别于传统的面对面调研，所以在进行数据处理分析时需要额外注意一些细节。

原则一：数据完整

在线调研的数据，是通过网页或手机app收集而来，难免会存在因为浏览器插件、安全软件、不兼容等因素导致的数据丢失情况。因此在调研上线前首先要进行测试，多尝试几种浏览器进行测试，看能否正常递交数据；其次，在分析数据时，首先要进行数据完整性检查，包括是否有漏答、跳题逻辑是否正确，否则你可能会在报告写到一半时，发现数据有缺失。

原则二：数据干净

在线调研不可避免会存在乱答题的情况，如果乱答题的人太多，容易影响数据质量，所以在检查了数据完整性后，需要对数据进行清洗，可以从以下几个方面进行：

答题时长，一方面可以邀请几个同事进行试填答，做好计时，另一方面可以计算平均（去掉极端值）答题时间，也可以考虑一个成年人的阅读字数来计算参考，以上述几个时间都可以作为标准来进行清洗。另外，答题时间太久了也需要清洗掉。（注意不同逻辑条件下，用户回答的问题数可能会不一样，需要考虑此方面）
填空题答题质量，填空题的内容能反映出一个填答者的态度，如果很敷衍、甚至乱答的，可以进行剔除；
题目或选项之间隐藏逻辑，比如：年龄25岁以上，还说自己在读高中；个人年收入大于家庭年收入；同时选择了两个明显互相矛盾的选项；
选项个数，所有多选题的选项都只选1个，尤其是明显不是一个答案的选择题（比如，你知道哪些洗发水品牌）；
矩阵题（表格形式）都选同一个选项的；
建议在问卷设计时，设置1-2个可以进行验证的地雷题，以便筛选出去那些不认真填答的人；（如：前面题目询问家中拥有的设备，如汽车、ipad。。。，后面题目询问家中是否有私家车）；

原则三：数据代表性

问卷数据一般是通过抽样调查的方式获得，因此抽样方法不一样，回收回来的数据代表性意义也不一样；如果是随机抽样（受限于各种条件，一般无法做到真正意义上的随机抽样），则回收的数据可以认为具有代表性-能代表总体；若采用分层抽样（如分地区各抽取10万用户），这样的抽样获得的数据，由于事先进行了样本配比，所以其不能代表总体，在结果统计时，需要对不同地区的样本进行加权（权重可以参考不同地区用户的实际占比）处理。

原则四：数据处理过程可回溯

在进行数据检查、清洗的过程中，往往需要进行多步骤操作，难免发生在处理的过程中出错的情况，因此需要在一些关键步骤上进行数据保存，并进行备注，以防止需要回溯的情况；在编写查错程序时，也要将程序保存下来，防止出错，也方便进行反查；
在线调研数据处理时要特别注意上述原则，能让你的工作更有效率、少走弯路。（什么，你们有DP？那这篇文章你就当看看热闹！）

作者：李兆平
来源：http://ued.ctrip.com/?p=5614

关键字：产品经理, 线上调研, 数据, 调研

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符，请点击举报进行投诉反馈！