과학적으로 선정한 1,000명의 표본이라면 4천만이 넘는 한국인들의 의견을 거의 정확히 반영할 수 있다. 이것은 말하자면 1,000명을 대상으로 제대로 이루어진 조사라면 4천만명 모두를 대상으로 한 조사와 비슷한 결과를 얻는다는 것이다.
그러나 만일 1,000명을 대상으로 제대로 실시한 다른 조사가 처음 조사와 조금 다른 결과를 보여준다면 어떻게 되는가? 그 둘 중 어느 조사도 틀린 것은 아니다. 이처럼 있을 수 있는 차이의 범위를 표집에 의한 오차라고 하는데, 흔히 오차한계라고 부른다.
여기서 '오차'는 실수를 범한다는 의미의 오류가 아니다. 그보다는 표본을 사용하는 여론조사에서 그 결과는 근사치일 수 밖에 없는데 그 근사치의 가능한 범위를 나타낸다.
여론조사자는 표본에 입각한 조사 결과의 확실성 정도를 "신뢰도 수준"으로 표현한다. 이것은 말하자면 표본을 통해 얻은 결과가 전체 모집단을 대상으로 조사했을 경우 얻게 될 결과의 일정한 범위 내에 속할 확률을 의미하는데, 보통은 95%의 신뢰도를 사용해 그러한 판단을 내린다.
예를 들어, 전국적 규모의 어떤 여론조사에서 오차한계가 ±3%라는 말은 만일에 전국의 모든 성인을 대상으로 같은 시기에 같은 방법으로 동일한 질문을 조사했다면, 그 여론조사의 결과가 모집단 값의 ±3%내에 속할 가능성이 95%임을 의미한다.
이는 응답자들이 여론조사에 협조적이었는지, 질문을 잘 이해했는지, 또는 다른 방법론적 문제가 있는지 등과는 아무런 상관이 없다. 표집오차는 전체모집단 대신 표본을 사용하는데서 오는 오차로, 여론조사의 온갖 잠재적인 오류 가운데 하나일 뿐이다. 표집오차는 응답거부나 인터뷰가 여의치 않는 사람들에 대한 정보는 전혀 제공하지 않는다. 또 질문을 어떻게 하느냐에 따라서 그리고 인터뷰 도중에 조사원이 어떻게 하느냐에 따라서 응답이 달라질 수 있는데, 표집오차는 이런 것에 대해서는 아무 것도 말해 주지 않는다.
표집오차는 조사결과의 모든 수치에 각각 적용된다는 사실을 명심해야 한다. 위의 예를 들면, 수치 하나 하나에 대해 적어도 ±3%의 오차가 있다는 것이다. 그래서 대통령선거에 관한 여론조사에서 후보자가 2명이면 표집오차는 두 사람 모두에게 적용되는 것이다.