'하이러닝 AI 서논술형 평가시스템'. 경기도교육청 제공| 문제: '산업혁명이 일어난 1850년대 이후 인간활동이 지구 대기 조성에 끼친 영향'에 대해 서술하시오. |
"복사평형의 개념과 온실가스의 역할, 지구 온난화의 관계에 대해 구체적으로 언급함. 다만 각 그래프별 구체적인 수치나 세부 변화 양상에 대한 분석은 부족함."
|
안양 부림중 한 학생의 서술형 답안에 대해 교사가 아닌 AI가 채점한 내용이다.
AI는 400자 이상의 채점 근거와 함께 '그래프 분석', '복사평형의 원리 이해', '기후변화의 원인 설명' 등 3가지 항목을 1·2·3점으로 나눠 총점을 도출했다.
경기도교육청, AI 서·논술 평가시스템 첫 선
18일 오전 경기도교육청 남부청사 컨퍼런스룸에서 열린 '하이러닝 AI 서논술형 평가 시스템' 시연회에서 교육청 관계자가 운영 체계를 설명하고 있다. 경기도교육청 제공경기도교육청은 18일 오전 도교육청 남부청사 2층 컨퍼런스룸에서 '하이러닝 AI 서논술형 평가시스템'을 선보였다.
AI 평가시스템의 작동 원리는 비교적 간단했다. 우선 교사는 '각 그래프의 변화 추세를 명확히 이해하고 분석해 기후변화의 특성과 경향성을 서술했는지', '복사평형 원리를 깊이 이해하고, 이산화탄소 배출량 증가가 지구 평균기온에 미치는 영향을 명확히 설명했는지' 등 출제한 서·논술형 문제의 채점 기준을 설정한다.
학생이 수기로 쓴 답안지를 OCR(광학 문자 인식) 엔진을 이용해 디지털 문자로 전환한 다음 AI에 평가를 맡기는 방식이다. AI는 이를 토대로 채점 근거, 점수와 함께 강점·보완점·피드백까지 다양한 의견을 제시한다.
AI의 채점이 교사의 채점은 얼마나 일치할까. 분석 결과, 큰 차이는 없는 것으로 나타났다.
교사의 채점과 AI의 체점이 얼마나 일치하는 지를 보여주는 상관계수는 과학 과목이 0.957, 국어 0.945, 사회 0.958로 집계됐다. 상관계수 지표는 0 '전혀 상관없음', 0~0.3 '약한 양의 상관관계', 0.3~0.7 '보통 양의 상관관계', 0.7~0.9 '강한 양의 상관관계', 1 '완전한 양의 상관관계'를 의미한다. 결론적으로 교사와 AI의 채점 결과가 큰 차이가 없는 것으로 교육청은 판단했다.
이날 AI 평가시스템을 선보인 부림중 배성현 교사는 "다양한 논술형 문제를 다루고 싶지만 채점 논란의 소지 때문에 꺼렸는데 AI라는 공신력 있는 보조자료가 생겼다"며 "채점뿐 아니라 다양한 피드백까지 제공해 학습에 큰 도움이 될 것 같다"고 평가했다.
그러면서 "30명 기준 한 학급을 채점하는 데 4~5분 정도 걸렸다"며 "시험을 본 후 바로 학생들의 이해 정도를 알 수 있어 효율적"이라고 덧붙였다.
7월부터 중1·고1 대상 시범 운영…최종 목표는 '대학입시 개혁'
임태희 경기도교육감이 '하이러닝 AI 서논술형 평가 시스템' 도입 취재에 대해 설명하고 있다. 경기도교육청 제공
도교육청은 7월부터 중·고등학교 1학년, 국어·사회·과학 교과를 대상으로 새로운 AI 평가시스템을 시범 운영할 계획이다.
또 활용 역량 강화를 위해 4천여 명의 교원을 대상으로 연수를 추진하고, 정책실행·시범운영연구회에서 실증 연구와 현장 우수사례를 발굴할 수 있도록 지원한다. AI 평가시스템의 점검이 마무리되면 적용 범위를 전 학년·교과로 확대할 계획이다.
더 나아가 AI 평가시스템을 전국 초·중·고·대학 등으로 확대해 하나의 답을 요구하는 기존의 수학능력시험에 벗어나 학생들이 창의력을 발휘할 수 있도록 돕는 '대학입시 개혁'을 이끌어 낸다는 구상이다.
임태희 경기도교육감은 "교육의 본질은 정답을 찾는 기술이 아닌 학생이 살아갈 미래 사회 역량과 인성을 준비하는 것"이라며 "AI 평가시스템은 학생 성장을 지원하고 입시 중심 교육을 바꾸기 위한 시도"라고 말했다.