1. 영어능력평가는 왜 ‘측정’이 아니라 ‘판단’의 문제인가

📑 목차

이 글은 영어능력평가론 시리즈의 첫 번째 글이다. 이 글에서는 영어능력평가를 단순한 점수 산출이나 기술적 측정의 문제로 보는 관점에서 벗어나, 평가가 본질적으로 어떤 판단 구조 위에서 이루어지는 제도적 행위인지를 살펴본다. 이후 글에서는 이 판단이 어떤 기준과 철학을 통해 유지되고 관리되는지를 단계적으로 확장해 나간다.

영어능력평가는 흔히 점수를 매기는 도구로 이해된다. 시험을 보고, 채점을 하고, 점수로 서열을 나눈다는 인식이 자연스럽게 따라온다. 그러나 이 인식은 평가가 실제로 작동하는 방식을 충분히 설명하지 못한다. 점수는 결과일 뿐이며, 그 결과에 이르기까지의 모든 선택과 배제의 과정은 판단에 의해 이루어진다.

누군가는 평가를 기술의 문제라고 말한다. 문항을 어떻게 만들 것인가, 신뢰도를 어떻게 높일 것인가, 채점의 일관성을 어떻게 확보할 것인가가 중요하다고 주장한다. 물론 이러한 요소들은 평가의 품질을 구성하는 핵심 요소다. 그러나 기술이 아무리 정교해져도, 평가가 무엇을 측정하고 무엇을 측정하지 않을 것인지는 기술이 아니라 판단의 영역이다.

영어능력평가에서 가장 먼저 이루어지는 판단은 무엇을 영어 능력이라고 볼 것인가에 대한 선택이다. 읽기, 듣기, 말하기, 쓰기 중 무엇을 포함할 것인지, 실제 사용 능력과 형식적 정확성 중 무엇을 더 중시할 것인지에 따라 평가의 성격은 전혀 달라진다. 이 선택은 통계로 해결되지 않는다. 그것은 평가가 사회에서 어떤 역할을 하기를 원하는가에 대한 판단이다.

또 다른 판단은 평가의 결과를 어떻게 사용할 것인가에 관한 문제다. 동일한 시험 점수라도 선발 도구로 사용될 때와 학습 진단 도구로 사용될 때 의미는 완전히 달라진다. 이때 점수 자체보다 중요한 것은 그 점수가 어떤 결정을 정당화하는 데 사용되는가이다. 평가는 항상 어떤 결정을 뒷받침하는 근거로 작동하며, 이 지점에서 평가의 책임 문제가 발생한다.

영어능력평가를 판단의 문제로 보아야 하는 이유는 여기서 분명해진다. 평가는 중립적인 정보 제공 장치가 아니다. 평가는 특정한 기준을 전제로 삼아 어떤 사람에게는 기회를 열어주고, 어떤 사람에게는 기회를 제한한다. 이 작용은 기술적 정확성만으로 정당화될 수 없다. 판단의 기준과 그 기준을 선택한 이유가 설명될 수 있어야 한다.

평가가 논란의 대상이 되는 순간을 떠올려 보면, 대부분의 갈등은 점수 계산 오류 때문이 아니다. 오히려 왜 이런 방식으로 평가했는가, 왜 이 능력이 중요하다고 보았는가에 대한 질문에서 갈등이 시작된다. 이는 평가가 기술의 영역을 넘어 판단의 영역에 있다는 명확한 증거다.

영어능력평가를 판단으로 인식하면, 평가를 설계하는 사람의 역할도 달라진다. 설계자는 단순히 문항을 만드는 기술자가 아니라, 기준을 선택하고 그 기준이 미치는 영향을 고려해야 하는 책임 있는 판단자다. 이 책임은 점수를 정확히 계산하는 것보다 훨씬 무겁다.

또한 평가를 사용하는 기관 역시 단순한 소비자가 아니다. 평가 결과를 어떤 결정에 사용할 것인지를 선택하는 순간, 그 기관 역시 판단의 책임을 공유하게 된다. 평가를 외주화한다고 해서 판단의 책임까지 외주화할 수는 없다.

이처럼 영어능력평가는 측정의 문제를 넘어선다. 그것은 어떤 능력을 중요하게 볼 것인지, 어떤 기준으로 사람을 구분할 것인지, 그리고 그 구분이 사회적으로 어떤 영향을 미칠 것인지를 포함하는 판단의 연쇄다. 점수는 이 연쇄의 마지막에 놓인 숫자일 뿐이다.

이 관점에서 보면, 좋은 평가는 단순히 신뢰도 높은 시험이 아니다. 좋은 평가는 자신의 판단 기준을 숨기지 않고 드러내며, 그 기준이 왜 선택되었는지를 설명할 수 있는 평가다. 설명 가능성은 평가의 부가 요소가 아니라 핵심 조건이다.

영어능력평가가 판단의 문제라는 인식은 이후의 모든 논의를 위한 출발점이 된다. 평가의 공정성, 타당성, 신뢰성, 책임성에 대한 논의는 모두 어떤 판단을 어떻게 관리할 것인가라는 질문으로 수렴된다. 이 질문에 답하지 못한 평가는 기술적으로 아무리 완벽해 보여도 사회적 신뢰를 얻기 어렵다.

이 글에서 제기한 문제의식은 이후 글들에서 구체화된다. 다음 글에서는 영어능력평가에서 말하는 공정성이 무엇을 의미하며, 왜 공정성이 단순한 동일 대우를 의미하지 않는지를 살펴본다. 이를 통해 평가 판단의 첫 번째 기준이 어떻게 형성되는지를 이어서 논의하게 될 것이다.

이 글은 영어능력평가를 기술적 측정이 아닌 판단의 문제로 바라보는 관점을 제시했다. 다음 글에서는 이 판단이 공정성이라는 개념과 어떻게 연결되는지를 구체적으로 다룬다.

저작자표시 비영리 변경금지 (새창열림)

'영어능력평가론' 카테고리의 다른 글

6. 평가가 학습을 지원하기 위해 반드시 갖춰야 할 설계 원칙 (0)	2025.12.30
5. 시험 결과 해석의 혼란이 교육 현장을 왜곡하는 방식 (0)	2025.12.30
4. 같은 영어시험이라도 결과 해석이 달라지는 이유 (0)	2025.12.30
3. 시험 목적에 따라 영어시험 유형은 어떻게 달라지는가 (0)	2025.12.29
2. 영어시험은 왜 만들어지는가: 시험 목적의 분류 (0)	2025.12.29

다 나와! 영어학!