客户体验：问卷调研的样本量大小怎么确定？

龙国富 2024-05-13 12:05:51

在体验管理日常的问卷调研工作中，样本量大小的确定一直是很多小伙伴搞不清楚的地方。

现在网上也有一些免费的工具可以帮助进行计算，不过如果你缺少对其中变量的理解，就是拿到一个样本量的大小，也不知道怎么去解释，这很容易被其他人质疑。

理解这个事情一点都不难，你花几分钟时间，我来给你讲讲～

以下，enjoy～

一、什么是调研样本量？

🤔 想象一下，你很好奇早餐吃 Weetabix（一种早餐麦片）的长跑运动员和不吃的运动员在比赛中的表现是否有差异？？？

要弄清楚这个问题，理论上我们需要调查全世界的长跑运动员，但这显然不现实。

这时候，样本大小就变得重要了。

样本大小是指你在调查、研究或实验中包括的受试对象数量。

在对大量人群进行调查时，选择正确的样本大小至关重要，因为你不可能向每个人收集数据。相反，你可以从整个群体中随机抽取一些人，让他们代表整个群体。

假设你是一家咖啡店☕️的老板，你想知道顾客对新推出的「榛果拿铁☕️」的喜好程度。你的咖啡店在全国有 500 多家分店，服务超过百万的的顾客。

显然，你无法询问每一位顾客他们对「榛果拿铁☕️」的看法，因此你需要进行抽样调查。

在这个例子中，样本大小就是你选择调查的顾客数量。假设你决定调查 1,000 名顾客。

这 1,000 名顾客需要随机选择，以确保他们能够代表你所有的顾客。这样，无论是常来的老顾客还是偶尔光顾的新顾客，都有机会被包括在你的调查中。

通过这 1,000 名顾客的反馈，你可以得到一个关于顾客对「榛果拿铁☕️」喜好度的大致了解。

比如，如果 750 名顾客表示喜欢这款新饮品，你可以说，在一定的置信水平和置信区间下，大部分顾客对「榛果拿铁☕️」持积极态度。

这样的调查结果可以帮助你做出是否继续推广「榛果拿铁☕️」或调整食谱的决策。

通过这个过程，我们可以看到，合理的样本大小对于获取可靠信息，帮助我们做出更好的决策是非常关键的。

二、计算样本量需要了解什么？

当我们想了解一个大群体的某个特征时，通常不可能问遍每个人，这时候就需要抽样调查。

但怎么确保我们抽取的这一小撮人能代表整个群体呢？这就需要用到几个关键概念：置信区间、置信水平、人口规模和标准差。

1）置信区间（Confidence interval）

置信区间就像是给我们的调查结果划定一个合理的误差范围（margin of error）。

比如，我们在母亲节调查了一群杭州的朋友，发现 65% 的人计划给母亲买礼物，置信区间是 ±2.75%。

这就像是说，我们非常有信心（但不是 100% 确定）真实的比例会落在 63.25% 到 67.75% 之间。

想象一下，你用尺子量东西，但尺子上的刻度有点模糊，所以你会说这个长度大概在 9 到 11 厘米之间，这个“大概”就类似置信区间。

2）置信水平（Confidence level）

置信水平告诉我们这个“大概”有多靠谱。

如果置信水平是 95%，那就像是说，如果我们进行 20 次独立的同样调查，有 19 次的结果都会落在那个置信区间内。

这就像是你重复 20 次测量，19 次的结果都在 9 到 11 厘米之间。

3）人口规模（Population size）

人口规模就是你研究对象的总数。

比如全杭州人就是你的研究对象，那人口规模就是杭州的总人口数。

4）标准差（Standard Deviation）

标准差是衡量数据变化的一种方式。

如果大家的回答的选项都差不多，那标准差就小；如果大家的回答参差不齐，标准差就大。标准差小，你需要的样本量就会少一些；标准差大，你需要更多样本来确保调查结果的准确性。

当我们把这些因素结合起来，就可以计算出需要多大的样本量才能让我们的调查结果既准确又有信心。

如果我们不希望误差太大，就需要更多的样本；如果能容忍较大的误差，样本量可以少一些。

当然，如果调查的问题非常关键，比如涉及到重大决策，我们就会希望误差尽可能小，这时就需要更多的样本来确保结果的可靠性。

三、如何计算样本量的大小？

要计算样本大小，了解如何使用 Z 分数和样本大小公式是关键。即使你不知道总体的确切规模，这些信息仍然可以帮助你确定需要多少样本来进行有效的调查或研究。