한국판 영유아 자폐 선별 검사(KM-CHAT)의 적용을 위한 기초연구

Preliminary Examination of Clinical Use of the Korean Modified-Checklist of Autism in Toddlers

Article information

Commun Sci Disord Vol. 18, No. 2, 172-182, June, 2013
Publication date (electronic) : 2013 June 30
doi : https://doi.org/10.12963/csd.13017
aDepartment of Communication Disorders, Korea Nazarene University, Cheonan, Korea
bCommunicative Disorders Program, California State University, Fullerton, CA, USA
김수진a, 송혜경b, 홍경훈,a
a나사렛대학교 언어치료학과
b미국 캘리포니아 주립대학 Communicative Disorders Program
Corresponding author: Gyunghun Hong, PhD E-mail: ghun@kornu.ac.kr / Tel: +82-41-570-7868 / Fax: +82-41-570-1675
Received 2012 December 30; Accepted 2013 March 21.

Abstract

Objectives:

The purpose of this study is to examine the clinical use of the Korean version of the Modified-Checklist of Autism in Toddlers (KM-CHAT) in Korean children. Research questions were to compare the rates of the positive identification between initial screening and follow-up interview on those items failed on the initial screening; to compare identification rate differences by genders and in three age groups; and to examine response patterns on the 23 items between screen positive and negative groups.

Methods:

Parents of children (age between 16 and 36 months old) were recruited to complete the Korean version of the M-CHAT (23 items of yes/no responses) from private/public day care centers in Cheonan, Korea. The collected M-CHAT responses (n=208) were scored using an automatic scoring program which Diana Robins provided on her Website.

Results:

There were notable differences in screen positive rates between the initial and follow-up screening. No gender and age group differences were observed. Response distribution analysis revealed remarkable differences on two items after the follow-up interview. This difference occurred in both screen positive and negative groups.

Conclusion:

This preliminary result indicates that follow-up interviews are warranted for those children who screen positive on the initial screening. It will be useful to have the trained personnel (speech-language therapists, pediatricians, nurses, etc.) conduct the follow-up interview immediately after screening of 16-36 months old Korean children with the KM-CHAT. Two specific items that revealed remarkably high fail responses should be considered for revision of the Korean translation.

Objectives

자폐성 장애는 신경생리적, 유전적, 발달적 장애로 분류되는 대표적인 발달장애(Filipek et al., 1999)로 그 원인이 알려져 있지는 않다. 가장 대표적인 증상은 의사소통의 문제와 사회적 상호작용의 문제, 상동행동을 보이는 것으로 DSM-IV (Diagnostic and Statistical Manual of Mental Disorders; American Psychiatric Association, 1994)에서는 이 세 가지 문제를 동시에 보이는 것을 진단 준거로 삼고 있다. 자폐성 장애는 여러 가지 이유로 계속 증가하고 있는 추세로 국내 특정 도시지역에서 전수 조사를 통해 조사한 결과에서는 10,000명 당 자폐성 장애는 9.2명인 것으로 조사되었으나(Hong et al., 1999), 최근 국내에서 이루어진 학령기 아동에 대한 대규모연구에서는 2.64%에 이른다고 발표된 바 있다(Kim et al., 2011). 영국, 미국, 중국, 오만, 스웨덴 등의 연구들은 결과에서 10,000명 당 1명에서 157명(0.1%-1.5%)으로 다소 넓은 범위의 유병률을 보여주었다(Zaroff & Uhm, 2011). 이렇게 유병률이 다양한 것은 진단기 준의 변화를 반영하기도 하고, 자폐성 장애가 널리 알려지고 중요한 장애로 인식이 변화된 것을 반영하기도 한다.

일반적으로 자폐성 장애 아동들의 경우, 부모들이 아이들의 발달에서 이상을 감지하는 시기는 2세 이전인 반면, 자폐성 장애로 전문가에게 진단을 받는 시기는 대부분 3-4세 이후로 알려져 있다 (Kleinman et al., 2008). 부모들이 상대적으로 이른 시기에 아동의이상을 발견하고도 전문적인 진단을 늦게 받게 되는 이유 중의 하나는 부모가 객관적으로 아동의 발달형태를 평가할 적절한 검사가 부족하다는 것일 수 있다. 자폐성 장애의 조기 진단은 아동이 진단 이후에 관련 서비스를 받을 수 있으며, 또한 부모의 걱정과 혼동을 감소시킬 수 있다는 점에서 매우 중요하다. 장애아동에 대한 조기 중재가 빠를수록 아동의 후일 언어, 정서, 행동 및 학업발달까지도 예후가 더 좋다는 사실은 잘 알려져 있다(Dawson et al., 2010; Moeller, 2000; Rossetti, 2001). 특히 우리나라는 2012년 8월부터 장애아동복지지원법이 본격적으로 시행되기 시작되어 모든 영유아 보육시설에서 장애의 유무에 따라 차별할 수 없게 되었다. 동시에 모든 시설에서 특수교사와 장애아 담당 보육교사가 배치됨은 물론 이들이 적절한 자격을 갖추도록 특별직무교육과정이 개발되고 있다. 이처럼 장애인에 대한 서비스 혜택이 확대되었으나, 만약 진단을 받지 않은 상태로 자폐성 장애를 갖고 있는 어린 영유아가 일반 아동 들과 통합되는 경우에, 자폐성 장애에 대한 인식이 부족한 교사들 로부터 소위 문제아로 낙인이 찍히고 충분한 돌봄을 받지 못하게 되면 아동과 그 가족은 모두 혼란에 빠지게 될 수 있을 것이다.

자폐성 장애의 진단과정에서는 소아정신과 전문의를 비롯한 심리학, 언어병리학, 특수교육학 분야의 전문가들이 협력하고 있다. 그러나 진단과정에서 가장 중요한 의뢰와 정보원 역할을 하는 것은 부모나 양육자 또는 영유아기에 아동을 담당하는 보육이나 교육기관의 관련자일 수 있다. 따라서 자폐성 장애아동들의 조기 선별을 위해서는 이러한 사람들이 쉽고 간편하게 검사를 실시할 수 있는 선별검사 개발이 우선시 된다. 현재 부모나 양육자로부터 보고를 구하는 방법으로 가장 많이 사용하고 있는 검사는 설문지 형태의 검사이다(Kogan et al., 2009; Reznick et al., 2007; Wetherby, Brosnan- Maddox, Peace, & Newton, 2008).

자폐성 장애의 경우 운동발달과 같은 이상이 보이지 않고, 증상이 사례마다 다양하게 나타나고, 가장 주요한 증상인 사회적 상호작용과 언어발달지체 등의 결함은 영유아기에 관찰되기 어려울 수 있다(Robins, Fein, Barton, & Green, 2001). 이런 이유로 널리 사용되고 있는 대부분의 자폐 검사들이 3세 이후의 아동에게 적용할수 있도록 개발되어 있다. 그러나 국내외의 많은 연구들(Dietz, Swinkels, van Daalen, van Engeland, & Buitelaar, 2006; Kim, 2010; Lee, 2008; Robins et al., 2001; Wetherby, Brosnan-Maddox, Peace, & Newton, 2008)은 3세 이전의 영유아 시기에도 충분히 장애를 판별할 수 있는 정도로 증상이 나타나며 선별검사를 통해 위험군으로 진단하여 조기 개입을 통해 아동과 교사 및 가족에게 도움을 줄 수 있다고 제안한 바 있다. 또한 최근 보육문화의 변화로 영유아도 보육시설 이용이 늘어나면서 다양한 사회적 상호작용 기회에 노출되고 있어 조기선별 진단의 중요성은 더욱 커지고 있다.

영유아기 선별 가능성을 검증하고 언어 이전기 특징을 제시한 Wetherby 등(2008)의 전형적 검사 내용으로는 제스쳐, 소리내기, 공동참조, 상징놀이 등을 포함하는 것이다. 이러한 특징을 담고 있는 영유아기 자폐 선별검사로 미국을 비롯한 전 세계에서 가장 널리 사용되고 있는 선별검사가 개정판 영아기 자폐성 장애 선별검사 (The Modified Checklist for Autism in Toddlers, M-CHAT; Robins et al., 2001)이다. M-CHAT은 CHAT (Baron-Cohen, Allen, & Gillberg, 1992)을 기초로 하여, 원 검사에 포함되었던 검사자 관찰용 5개 문항을 제외시키고, 기존의 부모 보고용 9문항에 14문항을 추가하여 총 23개의 부모 보고형 문항만으로 구성되어 있으며, 대상은 16개월에서 30개월이다.

M-CHAT의 전신이라고 할 수 있는 CHAT은 국내에서 ‘한국판 영유아기 자폐선별 검사(K-CHAT; Kim, Kim, & Lee, 2002)’로 번역되고 타당성과 변별력에 대한 검증을 거쳐 보급된 바 있다. 연구자들은 이 문항이 한국에서도 16개월부터 20개월 유아를 대상으로 자폐성 장애를 선별하는데 유용할 수 있음을 보여주었다. 이 연구에서 정상 발달 아동 68명과 지적 장애아동 49명 및 자폐성 장애로 진단 받은 아동 49명을 대상으로 실시한 결과 자폐성 장애를 진단 받은 아동을 선별해낼 수 있음을 확인하였다. 또한 집단별 반응 경향성을 분석하였는데, 자폐 선별 기준문항이라고 제안된 5번(흉내놀이 유무), 7번(흥미로운 것 지적하기), 9번(흥미로운 것 보여주기)의 세 문항 중 하나 이상에서 선별된 경우가 자폐아동 집단은 49명 중 43명(약 90%)으로 일반아동(약 10%)과 지적 장애아동 집단 (약 20%)과 비교해 현격한 차이를 보였다.

영국에서 개발되어 미국에서도 널리 사용되던 CHAT에 Robins 등(2001)은 다양한 경험적 데이터를 보강하고, 필요한 적용 대상의 연령 범위를 확장하여 수정판인 M-CHAT을 제작하였다. MCHAT은 전형적인 자폐 선별 문항을 추가하고 전반적인 발달을 선별할 수 있는 문항들이 추가되었으며, 대상 연령을 16개월에서 30개월까지 확장시켜 보급하였다. 이 검사의 한국어 번역판은 제공되어 있지만(Appendix 1), 국내에서나 미국에서 이 검사를 한국 아동들에게 사용하는 것이 유용한지 검증 연구가 진행된 바 없다.

M-CHAT 개발과정에서 Robins 등(2001)은 총 1,293명(일반 영유아 1,122명, 조기 중재 영유아 171명)을 대상으로 선별 검사를 실시한 결과 39명, 약 3%가 자폐성 장애로 진단되었다고 보고하였다. 자폐성 장애로 진단받은 영유아의 평균점수는 23문항 중 10.3점이었다. 변별력이 높은 6개 문항에 대한 평균점수는 4.1점이었다. 변별력이 높다고 보고된 6개의 문항은 타인에 대한 관심, 흥미로운 것 지적하거나 보여주기, 모방하기, 이름에 반응하기, 공동 참조물에대한 반응하기 등을 평가하기 위한 문항들이다. 의사소통 과정 그자체 혹은 의사소통의 전제 기술들에 해당하는 이 문항들은 자폐성 장애의 변별에 가장 중요한 기준이 되는 것이라고 할 수 있다.

Pandey 등(2008)은 대상 아동들을 월령(16-23개월, 24-30개월의 두 집단)과 자폐성 장애의 위험 정도(고, 저)를 기준으로 나눈 네집단에 대하여 M-CHAT을 실시한 결과 장애를 정확하게 예측한 비율이 어린 집단(16-23개월)보다 나이든 집단(24-30개월)에서 더 높았음을 보여주면서 어리고 위험성이 낮은 집단에게 적용할 때는 다른 임상적 정보가 더 필요하다고 하였다. 그러나 선별 검사는 검사를 진행하는 검사자의 전문성과 검사에 참여하는 부모의 지식이 나 해석이 문제가 될 수 있다. Sigman, Dijamco, Gratier와 Rozga (2004)는 실제로 부모들이 요구하기 행동과 관심 공유 행동을 구분하지 못한다고 지적하였다. 또한 외국에서 개발된 검사를 적용하기 위해서는 언어적, 문화적, 사회적 차이를 반영할 수 있으므로 별도의 개발과 검증절차가 요구된다. 특히 영국에서 개발된 CHAT을 미국에서 적용하는 과정에도 같은 언어권임에도 불구하고 문화적 차이로 그 적용의 한계점이 생긴 것이 M-CHAT의 개발 배경 중 하나였음을 상기한다면 한국에서의 적용을 위한 과정은 보다 더 면밀한 검증과정이 필요할 것이다. Kim 등(2002)은 K-CHAT 개발연구에서 일반아동 집단의 부모관찰 보고와 전문가관찰 보고 간의 일치율이 50% 내외였다고 보고하고, Baron-Cohen 등(1992)의 연구에서 영국에서 CHAT을 사용한 부모와 전문가 간의 일치율이 92%로 나타난 것을 고려할 때, 두 연구 간의 큰 일치율 차이가 문화적 차이 및 문항의 번역과정이 영향을 미쳤을 것으로 해석하였다. 그러므로 본 연구는 한국의 자폐성 장애아동들의 조기 진단과 중재를 위하여 한국어로 번역된 M-CHAT (Korean M-CHAT ver. 2; http://www2.gsu.edu/~psydlr/DianaLRobins/Official_M-CHAT_Website.html)을 한국의 16개월에서 36개월의 영유아들에게 적용 하기 위하여 검사의 개발과정에 필요한 기초자료를 수집하고 적용 가능성을 검증하는데 목적이 있었다. 우리나라의 경우 자폐 선별 검사가 부족하고, 진단이 대부분 3세 이후에 내려지는 현실을 감안 할 때, 대상 연령의 확대는 연구분야뿐만 아니라 임상적으로 큰 의의가 있다. 구체적인 연구목적은 다음과 같다.

첫째, 설문지를 통한 1차 선별 과정을 통해 위험군으로 선별되는 비율과, 1차로 선별된 위험군을 대상으로 2차 전화 후속 면담을 통해 최종 위험군으로 선별되는 비율을 비교 한다.

둘째, 성별 및 월령(age)을 기준으로 집단 간에 유의미한 차이가 있는지 알아보고, 이를 토대로 16-36개월 사이의 유아들에 대하여 본 검사의 적용 가능성을 검토한다.

셋째, 최종 검사결과를 토대로 각 문항별 실패 비율을 통해 국내일반적인 유아의 각 문항별 반응패턴에 대한 양상을 알아보고, 선별된 위험군 집단과 검사에서 통과한 집단의 반응비율 양상을 분석한다.

연구 방법

연구 대상

천안 지역에 거주하는 16개월부터 36개월까지의 유아를 대상으로 하여 부모님께 유아에 대한 기본적인 정보(생년월일, 성별, 응답자, 응답일 등)를 묻는 설문지와 선별 문항이 포함된 검사지를 배포하고 작성하도록 하였다. 대상은 아동의 월령에 따라 집단 I은 생후 16개월부터 22개월, 집단 II는 23개월부터 29개월 그리고 집단 III은 30개월부터 36개월의 세 집단으로 분류하고, 각 집단별로 60명을 표집하고자 하였다. 최종적으로 수거하여 분석한 대상자 수는 총 208명으로 남아는 105명, 여아는 103명이었다. 집단별로는 집단I이 59명(남녀비율 30:29), 평균연령 19.47개월, 집단 II가 87명(42:45), 평균연령 26.22개월, 그리고 집단 III이 62명(34:28), 평균 32.92개월이었다.

도구

본 연구에서 사용한 M-CHAT의 한국어 번역본은 M-CHAT의 개발자인 D. L. Robins의 Website (http://www2.gsu.edu/~psydlr/DianaLRobins/Official_M-CHAT_Website.html)에 탑재되어 있는 Korean M-CHAT (김현욱 번역)을 저작권자인 D. L. Robins, D. Fein, & M. Barton과 번역자의 사용허가를 받아서 몇몇 문항들의 어휘와 표현을 약간 수정(Korean M-CHAT ver. 2)한 후에 10명의 한국 부모들을 대상으로 두 번역본의 이해도를 평가토록 하였으며, 이해도가 높게 나타난 Korean M-CHAT ver. 2를 본 연구에서 사용하였다. Korean M-CHAT ver. 2에서 수정된 문항은 1번, 5번, 8번, 14번, 그리고 22번 문항이었다. 현재 D. L. Robins의 Website에는 Korean M-CHAT 과 Korean M-CHAT ver. 2가 모두 탑재되어 있다. 본 연구에서 사용한 Korean M-CHAT ver. 2는 Appendix 1 과 같다. M-CHAT의 1-9번 문항은 CHAT으로부터 가져온 문항이고, 더해진 14개의 문항은 상호작용, 의사소통 수용과 표현, 상동행동, 청력 및 운동능력과 같은 전반적인 발달 내용이 포함되었다. 특히 여섯 개의 문항은 자폐성 장애 변별력이 높은 고변별 문항(critical items)으로 알려져 있다(Robins et al., 2001). 여섯 개의 고변별 문항은 검사 문항들 중 2번(다른 아동에 대한 관심), 7번(흥미로운 것 가리키기), 9번(흥미로운 것 보여주기), 13번(어른 모방하기), 14 번(이름에 반응하기), 15번(어른이 가리킨 물건 쳐다보기)이다. 본연구 대상자 208명에게 실시한 23개 문항에 대한 반응 분석으로 구한 Cronbach’s alpha는 .983으로 문항 간 내적 일치도가 매우 높게 나타났다.

절차

천안의 어린이집을 정기적으로 혹은 비정기적으로 이용하는 부모들에게 연구의 취지를 설명하고 선별 검사에 참여할 것에 대한 동의를 구했다. 동의한 부모에게 1차 검사인 설문 검사지를 배포하였으며 응답이 완료된 설문 검사지를 수거하였다. ‘1차 검사 결과’는 M-CAHT의 제작자인 D. Robins이 제공해준 채점 프로그램(http://www2.gsu.edu/~psydlr/DianaLRobins/Official_M-CHAT_Website.html)을 이용하여 채점하고, 엑셀 매크로프로그램을 이용하여 대상자별 반응을 자동 집계하였다.

1차 검사 결과를 집계한 후에 2차 선별 검사를 실시할 대상자를 선발하였다. 2차 선별 검사 대상자는 원 검사에서 제시하고 있는 채점 방식에 따라 고변별 문항 6개 중에서 2개 이상의 문항에서 실패 하거나 전체 23개 문항 가운데 3개 이상에서 실패하는 사례였다. 분석 결과, 고변별 문항에서 1차로 7명이 선별되었고, 전체 문항에 서는 54명이 선별되었다. 그러나 고변별 문항에서 선별된 7명 중 6명이 전체 문항 점수에서도 3점 이상을 받은 관계로, 최종적으로 1차로 선별된 대상자의 수는 총 55명이었으며, 따라서 전체 검사를 실시한 208명 가운데 후속 면담(phone follow-up)을 실시한 경우는 총 55사례(26.4%)였다. 후속 면담 대상자에게는 전화통화를 이용하여 실패한 문항에 대해 D. Robins의 Website에 제시된 한국어판 후속 면담 절차에 따라 반응을 확인 하였다. 후속 면담을 통해 부모가 문항에 대한 오해가 있었던 경우에 반응이 바뀌었으며, 이렇게 바뀐 반응을 통해 나온 ‘최종 검사 결과’를 다시 채점하고 집계하였다. 후속 면담에서 사용한 일반적인 질문형태와 절차의 예는 다음과 같았다.

	<후속 면담의 예>
	검사에서 ‘아이가 소리에 민감하다’에 ‘예’라고 하셨는데,맞나요?
	엄마: 예
	검사자: 아이가 세탁기 소리와 같은 소리에 부정적인 반응, 예를들어, 귀를 막는다든지 또는 운다든지 하는 해동을 보이나요?
	엄마: 아니요,
	검사자: 아기 우는 소리에는요?
	엄마: 아니요
	검사자: 청소기 소리는요?
	엄마: 아니요,
	검사자: 사이렌 소리는요?
	엄마: 아니요
	검사자: 자동차 소리는요?
	엄마: 아니요,
	검사자: 문이 꽝 닫히는 소리는요?
	엄마: 아니요
	검사자: 아, 그러면, 부정적인 반응은 없고, 단지 소리를 잘 듣는다는 말씀이군요.
	엄마: 예. 작은 소리도 잘 듣는다는 거였어요.

자료 분석

각 문항은 ‘예/아니오’라고 응답한 결과에 따라 통과 또는 실패로 결정되었다. 검사 문항 중 11번(소리에 대한 민감성), 18번(얼굴 주변에서의 특이한 손동작), 20번(청각 문제), 22번(허공 응시)의 네 문항은 ‘아니오’라고 응답한 경우에 통과(reverse items)로 분석되며, 나머지 19개의 문항은 ‘예’라고 응답한 경우에 통과로 분석된다. 각 문항을 통과한 경우에는 0점, 실패한 경우에는 1점을 부과하고 이점수를 합하여 총점을 구하였다. 부가적으로 고변별 문항 6개에서 실패한 경우의 점수를 합하여 고변별 문항 합을 구하였다.

‘1차 검사 결과’와 후속 면담 후 ‘최종 검사 결과’의 문항별 반응 점수는 엑셀을 이용해서 분석하였으며, 최종 검사 결과를 토대로한 기술 통계치와 집단 간 차이는 SPSS ver. 14.0 (SPSS Inc., Chicago, IL, USA)를 이용하여 분석하였다.

연구 결과

1차와 2차 선별 과정을 통한 위험군 선별 비율 결과

1차 선별 과정인 선별 검사지 반응만을 이용하여 고변별 6문항중 2점 이상을 얻는 경우 위험군으로 분류하는 기준을 통해 선별된 인원은 7명(3.3%)이었으며, 이후 7명에 대하여 2차 선별절차로 후속 면담을 통해 선별된 인원은 1명(0.5%)에 불과하였다(Table 1).

Number of children who failed on six critical items (n= 208)

역시 1차 선별 과정인 선별 검사지의 전체 문항 점수에서 3점 이상이면 위험군으로 선별되는 기준으로 분석한 결과, 1차에서는 총 54명(26.3%)이 선별되었으며, 추후 전화를 통한 후속 면담을 통해 최종적으로 선별된 인원은 총 22명(10.5%)이었다(Table 2). 고변별 문항에서 선별된 최종 한 명이 전체 문항 점수를 통한 분석에서도 선별되었기 때문에 두 가지 기준 모두를 적용한 경우에도 최종 선별된 위험군 아동의 수는 총 22명이었다. 선별된 아동의 월령 평균은 27.4개월(범위: 18-36개월)이었고, 성비는 남아가 12명(11.3%), 여아가 10명(9.8%)이었다.

Number of children who failed on total items in each screening time (n= 208)

성별과 월령에 따른 집단 간 차이 분석 결과

후속 면담 확인을 마친 최종 점수에 대하여 각 연령집단별로 문항별 실패 빈도(Table 3)와 성별과 연령집단 간의 고변별 점수와 전체 점수의 평균을 분석하였다(Table 4). 성별로 나누어 분석한 경우, 남아의 고변별 문항 점수 합의 평균은 0.17이었으며, 전체 문항 점수의 합의 평균은 1.59였다. 여아의 고변별 문항 점수 합의 평균은 0.13이고 전체 문항 점수 합의 평균은 1.53으로 남아와 유사하게 나타났다. 월령으로 나누어 분석한 경우, 모든 집단의 평균도 유사 한 수준으로 나타났다.

Number of children in each age group who failed each item (n= 208)

Mean scores in each age group by gender on critical items and total items (n= 208)

연령집단과 성별을 독립변수로 하여 이원분산분석을 실시한 결과, 고변별 문항 점수의 합에서 연령(F(2, 205)=1.467, p>.05)과 성별 (F(1, 206)= 0.406, p>.05) 및 상호작용 효과(F(2, 205)=2.475, p>.05)는 모두 유의미하지 않으며, 전체 문항 점수의 합에서도 연령(F(2, 205)= 0.835, p>.05)과 성별(F(1, 206)= 0.106, p>.05) 및 상호작용 효과(F(2, 205)= 0.084, p>.05)가 모두 유의미하지 않았다.

문항별 반응 비율 분석 결과

1차 및 2차 후속 면담 간의 문항별 실패반응 비율 비교

1차 선별 검사와 2차 후속 면담 후의 문항별 실패반응 비율은 Table 5와 같았다. 후속 면담 후 응답 전환비율이 5% 이상인 문항은 11번과 18번이었다. 특히 11번 문항은 약 20여명(10%)의 반응이 통과로 바뀌었으며, 18번 문항은 10명(5.7%)의 반응이 실패에서 통과로 바뀌었다. 추후 전화 인터뷰를 마친 최종 반응을 통해 5% (10명) 이상 실패한 문항을 살펴보면 11번, 18번, 23번, 22번, 1번과 17번 순서로 실패비율이 높았다. 특히 11번은 약 63%가 실패하고, 18번은 약 29%가 실패하였다. 11번 문항은 통과한 유아가 실패한 유아보다 적었다.

Percentage of children in each screening time who failed each item (n= 208)

선별집단과 통과집단의 문항별 반응 비율

최종적으로 선별된 위험군 집단인 22명과 검사에서 통과한 집단 186명의 문항별 실패반응 비율을 구한 결과는 Table 6과 같다. 분석 결과, 선별집단과 통과집단 모두에서 실패율이 높은 문항들은 11번, 18번이었으며, 11번의 경우에는 두 집단이 거의 유사한 수준을 나타냈다. 통과집단에서는 이 두 문항을 제외하고는 23번이 7% 그리고 나머지는 모두 5% 미만의 실패율을 보였다. 통과집단과 비해 상대적으로 선별집단에서만 특히 높은 실패율을 나타낸 문항은 1번, 2번, 5번, 6번, 7번, 17번, 19번, 22번, 23번의 문항들이었다.

Percentage of children who failed each item in screen positive and negative group

논의 및 결론

본 연구는 자폐 선별 검사인 M-CHAT (Robins et al., 2001)의 한국어판을 개발하기에 앞서, 이 검사가 16-36개월의 한국 영유아들 에게 적용 가능한 지를 검증하고, 적용 이전에 고려해야 할 점들을 분석하는데 목적이 있었다. 연구 결과 및 그에 대한 논의는 다음과 같다.

첫째, 설문검사를 통해 1차로 선별된 위험군과 이들을 대상으로 2차 후속 검사인 전화면담을 통해 최종적으로 선별된 위험군의 비율을 비교한 결과, 두 위험군의 비율에는 상당한 차이가 있었다. 본 연구에서 고변별 문항을 사용한 선별 점수 준거를 적용한 경우에는 1차 선별 비율인 3.3% (7명)에서 0.5% (1명)으로 감소되었으며, 전체 문항 선별 점수 준거를 사용한 경우에는 26.3% (54명)에서 10.5% (22명)로 감소되어, 두 가지 채점 준거 모두에서 1차와 2차 검사의 선별 비율 간에 차이가 나타났다. 이러한 결과는 첫째, 검사의 정확성을 높이기 위한 후속 전화면담의 중요성을 시사한다. 검사의 정확도를 높이기 위해서는 ‘문제가 있는’ 대상이 ‘문제가 있다’고 평가되는 검사의 민감도(sensitivity)와 ‘문제가 없는’ 대상이 ‘문제가 없다’고 평가되는 특이도(specificity)가 높아야 한다. 그러나 이 두 가지의 척도는 서로 상충되는 면이 있으므로, 서로를 손상시키지 않는 적절한 방법을 찾는 것이 중요하다. 본 연구 결과, 2차 후속 면담을 통해 위험군에서 제외된 경우가 많이 발생했다는 것은 2차 전화면담이 특이도의 확률을 높일 수 있는 중요한 절차임을 보여준다. Robins 등(2001)은 총 1,293명의 대상자들에게 M-CHAT을 실시한 결과, 대상자의 약 90%가 1차 검사만으로 선별 준거를 통과하였고, 1차 검사에서 선별 준거를 통과하지 못한 약 6% (74명)는 2차 전화면담을 실시하여 검사를 통과하였으며, 이들은 후에 언어나 다른 지체 또는 자폐나 pervasive developmental disorder (PDD)로 진단되지 않았다고 보고하였다. 이 연구에서 연구자들은 M-CHAT 을 개발하면서 CHAT (Baron-Cohen et al., 1996)에 없는 절차인 2차 전화 후속면담을 포함시킨 이유를 검사의 민감도를 감소시키지 않으면서 특이도를 높게 유지할 수 있는 방법이 될 수 있기 때문으 로 보고한 바 있다. 또한 CHAT의 경우 부모 보고용 문항과 함께 관 찰자 보고용 문항을 포함한 반면, M-CHAT은 부모 보고용 방법만을 사용하였기 때문에 부모 보고에 대한 신뢰성을 확보할 수 있는 절차가 필요하며 2차 후속 면담이 그에 대한 적절한 대안으로 보여 진다. 특히 CHAT의 한국어판인 K-CHAT의 개발연구에서 Kim, Kim, & Lee (2002)은 K-CHAT이 타당도는 전반적으로 높게 나타 났으나, 부모보고와 관찰을 통한 검사자 보고 간의 일치도는 Baron- Cohen 등(1992) 연구의 92%보다 훨씬 낮은 약 50%-60% 수준 을 나타냈다고 보고하였다. 이러한 차이가 연구자들이 기술한 바 와 같이 영국과 한국 부모들 간의 문화나 인식의 차이에서 비롯되었는지는 확실히 알 수 없으나, KM-CHAT의 개발에서도 2차 후속 면담의 중요성을 시사하는 선행 연구결과라 할 수 있다. Kleinman 등(2008)도 저위험군 집단에 M-CHAT만을 적용했을 때는 positive predictive value (PPV)가 매우 낮았으나, 후속 전화면담을 통하여 PPV를 유효한 수준으로 향상시킬 수 있었다고 보고하고, 2차 후속 전화면담이 틀린 선별 결과(false positives)의 비율을 낮출 수 있는 중요한 절차라고 강조한 바 있다. 또한 1차와 2차 선별 비율 간의 큰 차이는, 둘째, 응답 전환률이 특히 높은 문항들이 있다면 해당 문항들의 적절성에 대한 세심한 검토와 수정이 필요하다는 것을 반영하는 결과라 할 수 있다. 이는 다음에서 문항별 분석 결과와 함께 고려하여 논의하였다.

둘째, KM-CHAT을 한국의 16-36개월까지의 유아들에게까지 확장하여 적용하는 것이 가능한지를 검토하기 위하여 본 연구의 대상자들을 16-22개월, 23-29개월 그리고 30-36개월로 나누고, 문항별로 연령대 간 반응형태와 연령집단 및 성별 간 통계적 차이를 분석하였다. 그 결과, 문항들에 대한 집단의 반응형태가 대체로 유사하였으며, 고변별 문항이나 전체 문항의 실패율 또한 집단이나 성별 간에 유의한 차이가 없었다. 이러한 결과는 KM-CHAT의 대상을 M-CHAT의 원 대상 연령보다 넓은 36개월까지 확대하여 적용할 수 있는 가능성을 보여준다. 몇몇 선행 연구들도 M-CHAT을 기존의 연령대보다 확대 실시하고 검사의 적절성을 보고한 바 있다.Yama 등(2012)은 네덜란드 유아들을 대상으로 M-CHAT의 확대 가능 연령대를 연구한 결과, 20개월에서 48개월까지 적절한 선별이 가능했다고 보고한 바 있다. Canal-Bedia 등(2011)도 18-36개월의 스페인 영유아들을 대상으로 M-CHAT을 실시한 결과, Robins 등 (2001)의 연구에서 제시한 수준과 유사한 민감도와 특이도를 나타 냈음을 보고하였다. 우리나라의 경우 특히 경제적이고 평가방법이 쉬운 적절한 조기 자폐 선별 검사가 부족하며, 자폐 진단이 일반적으로 3세 이후가 되어야 내려지는 현실을 감안할 때, KM-CHAT이 36개월까지 선별 검사의 대상 연령을 확대할 수 있다면 이는 임상적으로 중요한 의의를 갖게 될 것이다.

셋째, 본 연구의 1차와 2차 검사의 문항별 반응비율 및 선별된 집단과 통과한 집단 간의 문항별 반응비율을 분석하였다. 앞에서 기술한 바와 같이, 1차 검사 이후 2차 후속 전화면담에서 응답의 전환률이 높게 나타난 문항들은 설문지 형식의 문항에 대한 부모들의 이해가 낮다는 것을 반영하는 것으로, 이는 문항의 의미를 좀 더 정확하게 전달하기 위한 수정이 필요함을 시사한다. 본 연구에서 실제로 전화 후속 면담 결과 많은 부모들이 문항의 의도를 잘못 이해 하였음을 보고한 바 있다. 특히 1차와 2차 검사 간의 반응 전환율이 가장 높았던 문항인 11번과 18번 문항에 대해서 대부분의 응답 전 환자들이 유사한 반응을 나타냈는데, 예를 들어, 11번 문항 ‘아이가 소리에 민감하다고 느끼시나요?’ 중에서 ‘민감’에 대하여 검사문항 에서 의도한 바와는 반대로 부정적인 의미를 긍정적인 의미로 해석 하여 반응한 것으로 나타났다. 즉, 1차 검사에서 11번 문항에 대해 ‘예’로 반응한 대부분의 응답자들은 2차 전화면담 결과, ‘작은 소리도 잘 듣는다’는 의미로 반응한 것으로 나타났다. 18번 문항 ‘아이가 자신의 얼굴 주위에서 손가락으로 특이한 행동을 하나요?’는 ‘코를 후비는 행동’, ‘곤지곤지’, ‘얼굴을 만지는 행동’ 등과 같이 얼굴 가까이에서 손을 사용하는 행동이나 놀이, 또는 얼굴에 손을 대는 행동 등을 ‘예’로 반응한 것으로 나타났다. 따라서 KM-CHAT의 개발 단계에서 해당 문항들은 검사의 의도를 좀 더 잘 전달할 수 있는 표현으로 수정할 필요성이 있다고 판단된다. 그러나 원 M-CHAT을 사용한 Robins 등(2001)의 연구에서도 11번 문항(Does your child ever seem oversensitive to noise?)과 18번 문항(Does your child make unusual finger movements near his/her face?)이 1차 2차 검사 모두에서 가장 높은 실패율을 나타낸 문항들이며, 또한 M-CHAT을 스페인어로 번역하여 스페인어권 유아들을 검사한 Canal-Bedia 등(2011)의 연구에서도 이 두 문항이 가장 높은 응답 실패율을 나타냈다고 보고되었다. 이러한 결과들은 이 문항들이 자폐아를 선별하는 데 민감한 내용이면서도, 영유아 시기의 발달 특성상 다른 언어권에서도 부모들이 잘못 이해할 가능성이 높은내용이라는 점을 반영한다.

본 연구에서 검사의 문항별 실패율 순위는 선행 연구들의 결과와 상당히 유사한 것으로 나타났다. Robins 등(2001)과 Canal-Bedia 등(2011)은 2차 후속 면담 없이 1차 검사만 실시한 집단, 그리고 2차 후속 전화면담을 실시한 결과 선별되지 않은 집단, 그리고 2차 후속 검사 이후 자폐가 아닌 다른 발달장애로 진단된 집단과 자폐로 진단된 집단의 4개 집단으로 나누어 M-CHAT의 문항별 실패율을 분석하였다. 이 연구들의 1, 2차 검사에서 선별되지 않은 집단의 실패율이 높은 문항들이 본 연구결과와 상당히 동일한 것으로 나타났다. 본 연구에서 고실패율 문항의 순위가 11번, 18번, 23번, 1번, 22번 순이었으며, Robins 등(2001)은 11번, 22번, 19번, 18번 순으로 나타났고, Canal-Bedia 등(2011)은 18번, 11번, 22번, 23번의 순위를 보였다. 본 연구에서1번, 2번, 11번 등의 문항은 두 연구들에 비해 높은 실패율을 나타냈는데 이는 두 연구들에 비해 적은 대상자 수, 문화적 차이, 또는 앞서 기술한 바와 같이 본 연구에서 사용한 검사가 아직 개발이 완료되지 않은 관계로 일부 문항은 수정이 필요한 상태라는 점이 그 이유일 수 있다. 본 연구에서 최종으로 2차 검사 후에 선별 준거를 통과하지 못한 선별집단과 통과집단으로 나누어 문항별 실패율을 분석한 결과, 통과집단에서는 11번 문항 과 18번 문항을 제외하고는 모두 7% 이하, 대부분이 5% 미만으로 나타난 반면, 선별된 집단에서는 앞의 두 선행연구에서 자폐나 기타 발달장애가 있는 아동들이 높은 실패를 보였다고 보고된 2번, 5 번, 6번, 7번, 17번, 19번과 같은 문항들이 13%-26.1% 범위의 높은 실패율을 나타냈다. 본 연구의 2차 검사 선별 대상자들이 아직 정확한 진단을 받지 않은 점을 고려할 때, 이러한 결과를 직접적으로 연결하기에는 제한적이긴 하지만, 선행 추적연구(Kleinman et al., 2008)에서도 보고된 M-CHAT의 높은 민감도를 함께 고려하면, 본 연구의 선별집단과 통과집단의 문항별 실패율의 패턴이 두 선행연구의 결과와 유사하다는 점은 본 검사문항들의 적절성을 지지하는 것으로 볼 수 있다.

M-CHAT은 여러 언어권의 연구들에서 신뢰도와 타당도가 검증된 자폐 영유아 선별 검사다(Canal-Bedia et al., 2011; Kleinman et al., 2008; Robins et al., 2001; Wong et al., 2004; Yama et al., 2012). 따라서 타당도와 신뢰도를 갖춘 KM-CHAT의 개발은 영유아 중재, 교육현장 또는 보건소, 소아과와 같은 기관들에서 부모 보고를 통하여 자폐 가능성이 높은 영유아를 조기 선별하고 적절한 중재를 제공하는데 매우 유용하게 사용될 수 있으며, 따라서 자폐 영유 아들의 발달 촉진에 큰 기여를 할 수 있을 것이다. 특히 검사절차가 간편하여 검사자가 약간의 훈련만 받으면 검사를 실시할 수 있고, 현장에서 바로 결과를 검토하여 후속 면접의 필요성 여부를 판단하고 필요한 문항에 대한 재검사를 실시할 수 있기 때문에 비용, 노력, 시간을 최소화할 수 있는 매우 경제적인 검사가 될 수 있다. 본 연구는 KM-CHAT의 적용에 앞서 검사의 유용성을 검증하고, 타 당도와 신뢰도를 높일 수 있는 기초적 정보를 제공했다는 점에서 의의가 있다. 추후 본 연구에서 제기된 문제점들을 최대한 보완한 KM-CHAT의 개발과 함께 이에 대한 보다 심층적인 타당도와 신뢰도 연구가 필요하겠다.

Notes

CONFLICT OF INTEREST

No potential conflict of interest relevant to this article was reported.

Acknowledgements

This study was partially supported by the Fulbright senior research scholar award to the 2nd author. Special thanks to Park, Eun-Young for collecting data.

References

American Psychiatric Association. (1994). Diagnostic and Statistical Manual of Mental Disorders: DSM-IV (4th ed.). Washington, DC: American Psychiatric Association.
Baron-Cohen, S., Allen, J., & Gillberg, C. (1992). Can autism be detected at 18 months? The needle, the haystack, and the CHAT. British Journal of Psychiatry, 161, 839–843.
Canal-Bedia, R., Garcia-Primo, P., Martin-Cilleros, M.V., Santos-Borbujo, J., Guisuraga-Fernandez, Z., Herraez-Garcia, L., Herraez-Garcia, M.M., Boada- Munoz, L., Fuentes-Biggi, J., & Posada-de la Paz, M. (2011). The modified checklist for autism in toddlers: cross-cultural adaptation and validation in Spain. Journal of Autism and Developmental Disorders, 41, 1342–1351.
Dawson, G., Rogers, S., Munson, J., Smith, M., Winter, J., Greenson, J., Donaldson, A., & Varley, J. (2010). Randomized, controlled trial of an intervention for toddlers with autism: the Early Start Denver Model. Pediatrics, 125, e17–23.
Dietz, C., Swinkels, S., van Daalen, E., van Engeland, H., & Buitelaar, J.K. (2006). Screening for autistic spectrum disorder in children aged 14-15 months. II: population screening with the Early Screening of Autistic Traits Questionnaire (ESAT). Design and general findings. Journal of Autism and Developmental Disorders, 36, 713–722.
Filipek, P.A., Accardo, P.J., Baranek, G.T., Cook, EH Jr, Dawson, G., Gordon, B., Gravel, J.S., Johnson, C.P., Kallen, R.J., Levy, S.E., Minshew, N.J., Ozonoff, S., Prizant, B.M., Rapin, I., Rogers, S.J., Stone, W.L., Teplin, S., Tuchman, R.F., & Volkmar, F.R. (1999). The screening and diagnosis of autistic spectrum disorders. Journal of Autism and Developmental Disorders, 29, 439–484.
Hong, K., Lee, S., Jung, B., Kim, B., & An, Y. (1999). Prevalence of autism in a city (Gumi): population study in 3-6 years old children. Journal of the Korean Association for Persons with Autism, 1, 1–25.
Kim, A.Y., Kim, H.J., & Lee, S.H. (2002). Development of K-CHAT. Korean Journal of Developmental Psychology, 15, 17–32.
Kim, E.K. (2010). Early social communication features of children with autism spectrum disorder. Journal of the Korean Association for Persons with Autism, 10, 25–49.
Kim, Y.S., Leventhal, B.L., Koh, Y.J., Fombonne, E., Laska, E., Lim, E.C., Cheon, K.A., Kim, S.J., Kim, Y.K., Lee, H., Song, D.H., & Grinker, R.R. (2011). Prevalence of autism spectrum disorders in a total population sample. American Journal of Psychiatry, 168, 904–912.
Kleinman, J.M., Robbins, D.L., Ventola, P.E., Pandey, J., Boorstein, H.C., Esser, E.L., Wilson, L.B., Rosenthal, M.A., Sutera, S., Verbalis, A.D., Barton, M., Hodgson, S., Green, J., Dumont-Mathieu, T., Volkmar, F., Chawarska, K., Klin, A., & Fein, D. (2008). The modified checklist for autism in toddlers: a follow-up study investigating the early detection of autism spectrum disorders. Journal of Autism and Developmental Disorders, 38, 827–839.
Kogan, M.D., Blumberg, S.J., Schieve, L.A., Boyle, C.A., Perrin, J.M., Ghandour, R.M., Singh, G.K., Strickland, B.B., Travathan, E., & van Dyck, P.C. (2009). Prevalence of parent-reported diagnosis of autism spectrum disorder among children in the US, 2007. Pediatrics, 124, 1395–1403.
Lee, H.S. (2008). A study on development of checklist for autistic disorder in infant and toddler. Journal of Special Education & Rehabilitation Science, 47, 65–90.
Moeller, M.P. (2000). Early intervention improves language in deaf children. Brown University Child & Adolescent Behavior Letter, 16, 1–3.
Pandey, J., Verbalis, A., Robins, D.L., Boorstein, H., Klin, A.M., Babitz, T., Chawarska, K., Volkmar, F., Green, J., Barton, M., & Fein, D. (2008). Screening for autism in older and younger toddlers with the Modified Checklist for Autism in Toddlers. Autism, 12, 513–535.
Reznick, J.S., Baranek, J.T., Reavis, S., Watson, L.R., & Crais, E.R. (2007). A parent-report instrument for identifying one-year-olds at risk for an eventual diagnosis of autism: the first year inventory. Journal of Autism and Developmental Disorders, 37, 1691–1710.
Robins, D.L., Fein, D., Barton, M.L., & Green, J.A. (2001). The Modified Checklist for Autism in Toddlers: an initial study investigating the early detection of autism and pervasive developmental disorders. Journal of Autism and Developmental Disorders, 31, 131–144.
Rossetti, L.M. (2001). Communication intervention: birth to three. San Diego, CA: Singular Thomson Learning.
Sigman, M., Dijamco, A., Gratier, M., & Rozga, A. (2004). Early detection of core deficits in autism. Mental Retardation and Developmental Disabilities Research Reviews, 10, 221–233.
Wetherby, A.M., Brosnan-Maddox, S., Peace, V., & Newton, L. (2008). Validation of the Infant-Toddler Checklist as a broadband screener for autism spectrum disorders from 9 to 24 months of age. Autism, 12, 487–511.
Wong, V., Hui, L.H., Lee, W.C., Leung, L.S., Ho, P.K., Lau, W.L., Fung, C.W., & Chung, B. (2004). A modified screening tool for autism (Checklist for Autism in Toddlers [CHAT-23]) for Chinese children. Pediatrics, 114, e166–e176.
Yama, B., Freeman, T., Graves, E., Yuan, S., & Karen Campbell, M. (2012). Examination of the properties of the Modified Checklist for Autism in Toddlers (M-CHAT) in a population sample. Journal of Autism and Developmental Disorders, 42, 23–34.
Zaroff, C.M., & Uhm, S.Y. (2011). Prevalence of autism spectrum disorders and influence of country of measurement and ethnicity. Social Psychiatry and Psychiatric Epidemiology, 47, 395–398.

Appendix

Appendix 1. Korean Modified-Checklist of Autism in Toddlers ver. 2

아래 항목에 답해 주시기 바랍니다. 반드시 전체 문항에 응답해주십시오. 만약 아래 질문 중 그 행동의 횟수가 빈번하지 않으면(예: 한 두 번 본 경우) 그 문항은 ‘아니오’라고 답해 주십시오.

© Copyright by D. Robins, D. Fein, & M. Barton. Translated into Korean by Hyun Uk Kim, Fairfield University.

Article information Continued

Table 1.

Number of children who failed on six critical items (n= 208)

Score 0 Score 1 Score 2
Time 1 171 29 7
Time 2 (phone follow-up) 179 26 1

Table 2.

Number of children who failed on total items in each screening time (n= 208)

Score
0 1 2 3 4 5 6 7
Time 1 13 64 76 34 10 5 4 1
Time 2 (phone follow-up) 25 79 80 15 3 3 0 1

Table 3.

Number of children in each age group who failed each item (n= 208)

Group Item
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
I (n = 59) 1 2 0 0 1 1 5 6 1 0 32 0 3 0 0 0 3 20 3 0 3 2 4
II (n = 87) 4 3 1 1 2 3 3 2 2 1 58 0 0 0 0 0 6 17 4 1 0 8 11
III (n = 62) 6 4 4 0 5 1 2 1 1 0 39 0 2 1 1 0 2 23 3 2 1 3 4

Table 4.

Mean scores in each age group by gender on critical items and total items (n= 208)

Group Male (n= 106) Female (n= 102)
Critical item Total item Critical item Total item
I (n = 59) 0.14 1.57 0.24 1.48
II (n = 87) 0.10 1.52 0.09 1.40
III (n = 62) 0.26 1.68 0.07 1.71
Total 0.17 1.59 0.13 1.53

Table 5.

Percentage of children in each screening time who failed each item (n= 208)

Item
1 2* 3 4 5 6 7* 8 9* 10 11 12 13* 14* 15* 16 17 18 19 20 21 22 23
Time 1 8.1 4.3 2.9 1.0 6.7 4.8 5.7 6.2 2.9 0.5 73.2 0.0 6.2 0.5 1.4 0.0 7.7 34.4 6.7 3.3 2.4 9.6 11.5
Time 2 5.3 4.3 2.4 0.5 3.8 2.4 4.8 4.3 1.9 0.5 63.2 0.0 2.4 0.5 0.5 0.0 5.3 28.7 4.8 1.4 1.9 6.2 9.1
Difference 2.8 0 0.5 0.5 2.9 2.4 0.9 1.9 1.0 0 10.0 0 3.8 0 0.9 0 2.4 5.7 1.9 1.9 0.5 3.4 2.4

*Critical items.

Table 6.

Percentage of children who failed each item in screen positive and negative group

Group Item
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
Positive (n=22) 13 13 8.7 4.3 26.1 21.7 26.1 8.7 0 4.3 69.6 0 8.7 0 0 0 21.7 47.8 21.7 13 0 26.1 26.1
Negative (n = 196) 4.3 3.2 1.6 0 1.1 0.5 2.7 3.7 2.1 0 62.6 0 2.1 0.5 0.5 0 3.2 26.2 2.7 0 2.1 3.7 7
Total (n = 208) 5.2 4.3 2.4 0.5 3.8 2.9 5.2 4.3 1.9 0.5 63.3 0.0 2.9 0.5 0.5 0.0 5.2 28.6 4.8 1.4 1.9 6.2 9.0