📑 목차
이 글은 영어능력평가론 시리즈의 스물다섯 번째 글이다. 앞선 글에서는 영어 말하기 평가의 신뢰도를 실제로 높이기 위한 설계 전략과 운영 방식을 살펴보았다. 이 글에서는 그러한 노력에도 불구하고 말하기 평가가 왜 구조적으로 완벽해질 수 없는지, 그리고 그 한계를 어떻게 이해하고 활용해야 하는지를 중심으로 논의를 전개한다. 다음 글에서는 이러한 한계 인식이 읽기·쓰기 평가로 어떻게 확장되는지를 다룬다.
영어 말하기 평가를 다루다 보면 결국 하나의 질문에 도달하게 된다. 이렇게 많은 기준과 절차, 훈련과 관리가 이루어지는데도 왜 말하기 평가는 여전히 논쟁적인가라는 질문이다. 이 질문에 답하기 위해서는 말하기 평가의 결함을 나열하기보다, 말하기 평가가 어떤 성질의 평가인지부터 다시 바라볼 필요가 있다. 말하기 평가는 본질적으로 완전함을 목표로 설계될 수 없는 평가 영역이다.
영어 말하기 평가는 인간의 언어 생성 활동을 대상으로 한다. 언어 생성은 고정된 정답을 가지지 않으며, 상황과 맥락에 따라 달라진다. 동일한 의미라도 서로 다른 표현이 가능하고, 동일한 표현도 서로 다른 의미로 해석될 수 있다. 이 가변성은 말하기 능력의 본질적 특성이다. 평가가 이 능력을 대상으로 하는 순간, 완벽한 표준화는 원리적으로 불가능해진다.
앞선 글에서 살펴본 채점 기준 구조화, 채점자 훈련, 이중 채점은 모두 이 가변성을 관리하기 위한 전략이다. 그러나 이 전략들은 가변성을 제거하지 않는다. 이 전략들은 가변성이 평가 결과를 무작위적으로 만들지 않도록 경계선을 설정할 뿐이다. 이 점을 이해하지 못할 경우, 신뢰도 향상 전략은 종종 과도한 기대를 낳는다.
말하기 평가가 완벽해질 수 없는 또 다른 이유는 판단의 불가피성 때문이다. 말하기 수행을 평가하는 순간, 누군가는 그 수행의 질을 판단해야 한다. 이 판단은 규칙을 따르지만, 기계적 계산이 아니다. 판단에는 항상 해석이 포함된다. 해석이 개입되는 한, 완전한 일치는 기대할 수 없다. 이는 말하기 평가의 약점이 아니라, 말하기 평가가 인간 능력을 다룬다는 증거다.
해석 중심 타당도 관점에서 보면, 말하기 평가의 한계는 점수의 문제가 아니라 해석의 문제로 전환된다. 점수가 완벽하지 않다는 사실보다 중요한 것은 그 점수를 어디까지 해석할 수 있는가다. 말하기 평가 점수를 미세한 서열이나 절대적 능력 지표로 사용하는 순간, 평가의 한계는 결함으로 변한다. 반대로 점수를 제한된 맥락에서 산출된 정보로 이해할 경우, 그 한계는 관리 가능한 조건이 된다.
공정성 논의에서도 이 한계 인식은 중요하다. 완벽한 일관성을 전제로 한 공정성은 현실에서 달성될 수 없다. 말하기 평가는 응시자의 심리 상태, 상호작용 방식, 순간적 판단에 영향을 받는다. 이러한 변인을 완전히 제거하려는 시도는 평가를 왜곡시킬 위험이 있다. 공정성은 차이를 없애는 것이 아니라, 차이가 어떤 의미를 가지는지를 설명하는 데서 확보된다.
형평성 관점에서도 말하기 평가의 불완전성은 중요한 의미를 가진다. 다양한 말하기 방식과 표현 전략이 존재한다는 사실은, 단일한 이상적 수행 모델이 존재하지 않음을 의미한다. 말하기 평가가 완벽한 기준을 제시할 수 없다는 점은, 동시에 다양한 수행을 포용할 가능성을 내포한다. 이 한계를 인정할 때, 평가는 특정 말하기 스타일에 대한 편향을 경계할 수 있다.
평가 설계자에게 이 한계 인식은 포기의 이유가 아니다. 오히려 이 인식은 설계자의 책임을 분명히 한다. 평가 설계자는 완벽한 측정을 약속하는 대신, 평가가 제공할 수 있는 정보의 성격과 범위를 명확히 제시해야 한다. 이는 평가의 권위를 낮추는 행위가 아니라, 평가 사용의 신뢰를 높이는 행위다.
채점자 관점에서도 한계 인식은 중요하다. 채점자가 자신의 판단을 절대적 기준으로 인식하는 순간, 평가의 위험성은 커진다. 반대로 자신의 판단이 기준과 맥락 안에서 이루어진 해석임을 인식할 때, 채점은 보다 책임 있게 이루어진다. 한계를 인식하는 채점자는 오히려 더 신중한 판단을 내린다.
학습자에게 말하기 평가의 불완전성은 또 다른 의미를 가진다. 말하기 점수가 자신의 전반적인 능력이나 잠재력을 완전히 대변하지 않는다는 사실을 이해할 때, 학습자는 점수를 방어하거나 거부하기보다 학습 정보로 활용할 수 있다. 이 전환은 평가가 학습을 위축시키는 도구가 아니라, 학습을 안내하는 도구로 기능하게 만든다.
결국 영어 말하기 평가의 한계는 제거해야 할 결함이 아니라, 해석과 사용을 조절하기 위한 기준점이다. 이 한계를 인식하지 못한 평가는 과도한 확신을 낳고, 그 확신은 평가 오용으로 이어진다. 반대로 한계를 전제로 한 평가는 신중한 해석과 책임 있는 사용을 가능하게 한다.
완벽한 말하기 평가는 존재하지 않는다. 그러나 의미 없는 말하기 평가도 존재하지 않는다. 말하기 평가는 그 불완전성을 인정할 때 비로소 교육적 판단에 기여할 수 있다. 이 역설을 이해하는 것이 영어능력평가를 깊이 있게 이해하는 출발점이다.
이 글에서는 영어 말하기 평가가 왜 구조적으로 완벽해질 수 없는지, 그리고 그 한계를 어떻게 의미 있게 이해해야 하는지를 살펴보았다. 다음 글에서는 이러한 한계 인식이 읽기와 쓰기 평가, 특히 수행 중심 읽기·쓰기 평가로 어떻게 확장되는지를 중심으로 논의를 이어간다.
'영어학: 영어능력평가론' 카테고리의 다른 글
| 26. 읽기·쓰기 평가는 말하기 평가와 어떤 다른 한계를 가지는가 (0) | 2026.01.06 |
|---|---|
| 27. 읽기 평가에서 문항 하나는 왜 능력 해석 전체를 바꿔 놓는가 (0) | 2026.01.06 |
| 24. 영어 말하기 평가의 신뢰도는 실제로 어떻게 높일 수 있는가 (0) | 2026.01.05 |
| 23. 영어 말하기 평가에서 채점과 신뢰도는 왜 핵심 문제가 되는가 (0) | 2026.01.05 |
| 22. 영어 말하기 평가는 왜 듣기 평가와 전혀 다른 논리를 요구하는가 (0) | 2026.01.05 |