평균발화길이 분석을 위한 발화 표본의 크기

Reliable Sample Size for Mean Length of Utterance Analysis in Preschooler

Article information

Commun Sci Disord Vol. 18, No. 4, 368-378, December, 2013

Publication date (electronic) : 2013 December 31

doi : https://doi.org/10.12963/csd.13064

Mi-Sun Yoon ^a, Soo-Jin Kim^,^a, Jung-Mee Kim ^a, Moon-Soo Chang ^b, Jae-Eun Cha ^c

^aDepartment of Communication Disorders, Korea Nazarene University, Cheonan, Korea

^bDepartment of Korean Linguistics, Kyonggi University, Seoul, Korea

^cDepartment of Computer Science, Seo Kyeong University, Seoul, Korea

윤미선^a, 김수진^,^a, 김정미^a, 장문수^b, 차재은^c

^a나사렛대학교 언어치료학과

^b경기대학교 국어국문학과

^c서경대학교 컴퓨터학과

Corresponding author: Soo-Jin Kim, PhD Department of Communication Disorders, Korea Nazarene University, 48 Wolbong-ro, Seobuk-gu, Cheonan 331-718, Korea E-mail: sjkim@kornu.ac.kr Tel: +82-41-570-7978 Fax: +82-41-570-7846

Received 2013 September 28; Revised 2013 October 21; Accepted 2013 November 8.

Abstract

Objectives:

The purpose of this study is to obtain a reliable minimum sample size for the mean length of utterances (MLU) analysis.

Methods:

The participants were 30 typically developing children of ages between 2-4 years. Conversations with their caregivers at homes were recorded and transcribed by trained transcribers. Four sets of speech samples of different length, 50-100-150-200 utterances, were selected successively from original transcriptions. The same procedure was repeated 3 days later and a total of 240 sets of speech samples were prepared. t-tests for comparing the MLU between 1st and 2nd speech samples were done. Correlation analysis of MLU in speech samples of different length was performed.

Results:

The MLUs were not significantly different between the 1st and 2nd samples. Pearson correlation coefficient scores for MLU-eojeol of 50 utterances were over .90 in 3 different age groups. Meanwhile these of MLU-word and MLU-morpheme were over .90 respectively when sample size was 100 utterances in the groups of 2 and 4 years old. In 3 years old group, they were over .90 in sample of 50 utterances.

Conclusion:

The result of this study suggests that the speech sample of 50 utterances should be considered as a reliable sample size for the analysis of MLU-e, excluding the 100 utterances for the analysis of MLU-w and MLU-m. It does not mean that this sample size is adequate to analyze other quantitative parameters regarding semantics. Further research is required for this issue.

Keywords: MLU; Speech sample; Sample size; Reliable size; Language development

아동의 자발적인 발화를 수집하여 이를 분석하는 방법은, 다양한 언어의 하위 영역에 대한 아동의 언어 능력을 실제 의사소통 상황에서 평가할 수 있으므로 일반 발달 아동과 언어장애 아동에게 모두 사용된다. 언어장애 아동의 자발화 분석 결과는 표준화된 공식 언어검사 결과로는 얻을 수 없는 다양한 정보를 제공하므로, 장애 진단과 중재 목표 설정 시 중요한 자료가 된다(Lund & Duchan, 1993; Price, Hendricks, & Cook, 2010). 특히 자발화는 일상에서 산출된 것이므로 자발화 분석은 실제 아동의 의사소통 환경 안에서의 언어 중재 목표와 활동을 선택하는 데에도 도움이 된다.

자발화 분석은 방법에 따라 언어의 하위 영역, 음운론, 의미론, 구문론, 형태론, 화용론 별로 의사소통 상황에서 아동의 언어 능력을 보여준다(Kim, 2002). 음소목록분석, 조음정확도, 음운변동 분석은 음운론, 총 단어 수(total number of words, TNW), 서로 다른 단어 수(number of different words, NDW)는 의미론, 평균발화길이(mean length of utterance, MLU), 평균구문길이(mean syntactic length, MSL)는 형태론과 구문론에 대한 정보를 제공한다.

이 중 MLU는 표현 언어 능력의 척도로서, 다른 언어 검사와의 비교에서 타당성을 검증 받았고(Rice, Redmond, & Hoffman, 2006), 임상과 언어 연구 영역에서 가장 많이 사용되고 있다(Pae, Kim, Sung, & Sung, 1998; Price et al., 2010). MLU는 학령전기 아동에서 발달과 밀접한 연관을 보여주고 있으며(Brown, 1973; Chapman, 1981; Conant, 1987; Kim, 1997; Scarborough, Wyckoff, & Davidson, 1986), 언어장애 아동의 평가(Johnston, 2001; Klee, Stokes, Wong, Fletcher, & Gavin, 2004; Lee & Kim, 1999; Rice, Redmond, & Hoffman, 2006; Rice et al., 2010)와 이중언어 아동의 언어 평가(Miller et al., 2006; Park & Seok, 2007)를 위한 지표로도 사용 된다.

MLU를 포함하여 아동이 산출하는 자연스러운 발화 표본에서 아동의 언어능력을 평가할 때는 언어표본의 크기가 결과에 영향을 주게 된다. 언어 표본의 크기가 작을수록 아동의 언어 능력을 저평가, 또는 과대평가할 위험성이 커지며, 결과의 신뢰도는 표본의 크기에 영향을 받는다(Gavin & Giles, 1996; Rice et al., 2010; Rowland & Fletcher, 2006). MLU 분석 시 많은 연구자들이 기본으로 사용 하는 것은 Brown (1973)의 원칙으로, 자발화 표본의 크기를 100발화로 제안하였다. Brown의 100발화는 불명료한 발화를 제외한 모든 발화를 포함하였다. Brown (1973)의 원칙을 발전시킨 후속 연구에서 Chapman (1981)은 모방 발화, 단 단어 발화, 질문에 대한 네/아니오 대답을 제외하고 50발화를 발화 표본으로 하였다. Gavin와 Giles (1996)은 신뢰할 수 있는 발화 표본의 크기를 찾기 위해, 아동 30명이 성인과 상호작용하는 상황에서 산출한 발화 표본으로 검사-재검사 신뢰도를 측정하였다. 이들은 발화 표본의 크기를 시간 단위(12-20분)와 발화 수 단위(25-50-75-100-125-150-175발화)의 두 가지 기준으로 나누어 신뢰도를 평가하였다. 시간 단위의 경우 20분 표본에서 최소 수준(r>.71)을 확인하였고, 발화 수 단위로 보면 50-100발화에서는 r값이 .61-.82, 100-150발화에서는 r값이 .78-.83으로 나타났다. 연구자들은 신뢰할 수 있는 수준인 .90 이상이 되려면 발화 표본의 크기가 175발화 이상은 되어야 한다고 보고하고, MLU 분석을 위한 발화 표본의 크기로 175발화 이상을 추천하였다.

Johnston (2001)은 그보다 많은 200-350발화의 언어 표본으로 MLU를 평가 하였다. 또한 Klee 등(2004)은 20분 동안 연구자와 아동이 상호작용 하는 것을 녹화하여 전사하였는데, 이들이 MLU평가에 사용한 발화 자료의 총 발화 수는 아동의 연령에 따라 차이가 있었으나, 평균 143발화로 나타났다. Rice 등(2010)은 2세 6개월에서 8세까지 일반 아동과 언어장애 아동의 MLU 비교를 위해, 최소 200개의 완전하고 명료한 발화 표본을 만드는 것으로 상호작용 상황을 녹음하고 전사하였다. 이중 학령전기 2-4세 아동에 대해 실제로 이들이 분석한 발화 표본의 크기는 일반 아동은 219-232발화, 언어장애 아동은 155-213발화였다. 반면 Price 등(2010)은 교육 현장에서 아동의 자발화 분석을 활발히 할 것을 권장하며, 발화 표본의 크기가 커질 때 얻어지는 이득보다는 전사와 분석의 양이 늘어나는 데에 따른 현실적인 부담이 더 크므로, 35-50발화의 표본을 사용할 것을 제안했다. 또한 발화는 두 가지 다른 담화 문맥, 즉 대화와 나레이션을 통해 유도해야 하며, 대화상대자는 아동과의 의사소통에서 반응적 위치에 있도록 했다.

국내 연구를 보면 MLU 산출을 위한 발화 표본의 크기가 다양함을 알 수 있다. Kim (1997)은 아동과 성인의 상호작용을 전사한 100-200개의 발화에서 70개의 발화를 선정하여 MLU를 산출했다. 70발화의 선정 기준은 “부자연스럽거나 아동이 흥미를 잃어 대표성이 의심되는 부분을 제외시키고”로 되어있다(Kim, 1997, p. 8). 이후 Pae 등(1998)은 국내 최초로 컴퓨터를 이용한 자발화 분석 프로그램을 소개하며, 적절한 발화 표본의 크기로 100발화를 제시하였으나 구체적으로 근거를 제시하지는 않았다. 이후 MLU를 측정하는 후속 연구에서는 50발화(Jung & Kwon, 2000; Park & Seok, 2007)와 100발화(Lee & Kim, 1999) 등으로 다양한 크기의 발화 표본을 사용하였다.

자발화 분석을 통해 공식적인 검사에서는 구할 수 없는 많은 정보를 얻을 수 있고, 결과를 바로 치료 목표 설정과 활동에 응용할 수 있는 장점 등은 자발화 분석이 임상현장에서 사용하기에 적합한 방법임을 의미한다. 그러나 실제 임상가들은 현장에서 자발화 분석의 사용을 꺼리고 있으며, 그 원인은 무엇보다 자발화 분석에 드는 시간과 노력 때문인 것으로 나타났다(Price et al., 2010). 자발화 분석에 필요한 노력에는 발화 표본의 크기가 핵심적인 역할을 한다. 발화 표본의 크기가 클수록 대표성은 커지며, 오류의 가능성은 낮아진다. 그러나 연구와 임상 현장에서는 발화 표본의 크기가 커질수록 수집, 전사, 분석에 더 많은 시간과 노력을 투입해야 하는 현실적인 어려움이 따른다. 따라서 본 연구는 선행연구에서 사용하고 있는 최대 표본 크기(200 발화)에서 산출한 MLU 결과와 신뢰할 수 있는 결과를 보이는 최소 표본 크기를 찾는 것을 목적으로 하였다. 선행연구에서는 결과의 신뢰도를 확보하기 위한 이상적인 수치로 결과 간의 상관 계수 .90 이상을 제시하고 있다(Gavin & Giles, 1996; McCauley & Swisher, 1984). 따라서 본 연구에서는 .90 이상을 신뢰할 수 있는 최소 크기 발화 표본의 기준으로 하였다.

자발화 표본의 수집에서 본 연구와 같이 유도된 발화가 아니라 아동이 일상의 자연스러운 상호작용에서 산출한 발화 자료일 경우, 발화 상황이 아동의 언어에 미치는 영향에 대한 우려가 제기될 수 있다. 따라서 이를 확인하기 위하여 1차 발화 표본의 수집 후 3일 이내에 2차 발화 표본을 수집하여 두 자료 간의 결과를 비교하였다. 또한 분석에 필요한 발화를 선정하기 위해 필요한 총 발화 수를 연령 별로 비교하였다. 연령이 어릴수록 불명료한 발화(Kim, Kim, & Yoon, 2013)와 미완결 발화의 비율이 높아지는데(Kim, Yoon, Kim, Chang, & Cha, 2012), 이는 MLU 측정 시 포함되지 않는 발화이다. 따라서 발화 선정 기준에 맞춘 발화 표본을 선정하기 위하여 실제로 수집해야 하는 발화 크기를 알아보기 위해 총 발화 수를 분석하였다.

연구 방법

연구 대상

연구 대상은 MLU 분석이 학령전기 아동에게 의미 있는 지표로 보고되고 있으므로(Kim, 1997), 2, 3, 4세 아동을 대상으로 하였다. 대상자는 서울, 경기, 충청 지역에 거주하는 총 30명으로, 2, 3, 4세의 각 연령 군에 10명씩, 남녀 성별이 동일하게 선정했다. 각 연령 군 안에서는 전반기와 후반기에 동일하게 5명씩 배정하였다. 연구대상자는 나사렛말뭉치 연구 과제의 대상자인 아동으로, 1) 주 양육자가 일반적 발달을 하고 있다고 보고하며, 2) 수용 및 표현어휘력 검사(REVT; Kim, Hong, Kim, Chang, & Lee, 2009)에서 수용 및 표현 어휘력이 -1 SD 이상에 해당되고, 3) Ling 6 sound test (Ling, 1976)에서 6개의 말소리를 다 감지하는 아동이었다. 2세 전반 아동의 경우에는 REVT 의 표준화 규준이 없으므로, M-B-CDE-K (Pae, Kwak, Chang, & Sung, 2006)에서 25%ile 이상인 아동으로 선정하였다.

자발화 수집 및 선정

자발화 수집 방법, 전사, 및 전사 시 발화 구분 원칙은 나사렛말뭉치 연구 과제의 지침을 따랐다(Kim et al., 2012). 발화 구분 및 선정 원칙의 요약은 Appendixs 1과 2에 수록하였다. 아동의 발화 녹음은 아동의 집에서 부모의 협조를 받아 1주일 동안 총 10시간 이루어졌고, 녹음자료는 전사 훈련을 받은 연구보조원이 연구자들이 개발 중인 전사 프로그램(Kwak & Chang, 2012)을 이용하여 전사하였다. 1차 전사는 학부생 연구보조원에 의해, 2차 전사는 대학원생 연구보조원에 의해 이루어졌다.

본 연구에서는 10시간의 녹음과 전사 자료 중에서 대학원생 연구보조원 5인이 3차 정련 작업을 통해 부모 1명과 아이의 상호작용 상황에서 연속하여 산출하는 200발화를 선정하였고, 제1연구자와 대학원생 연구보조원 1인이 4차 정련과 확인 과정을 수행했다. 발화 선정 원칙은 1) 불명료한 발화, 2) 미완성 발화, 3) 노래나 책읽기는 선정에서 제외하고, 4) 반복된 발화가 연속해서 나올 때는 첫 발화만을 선정하였다. 선정된 200발화에 대해, 50발화부터 50발화씩 늘여 50-100-150-200발화의 4개 세트를 만들었다(1차 발화 표본).

발화 자료의 대표성을 확인하기 위하여 1차 발화 표본 선정과 같은 방법으로, 1차 발화 표본 수집 일에서 3일 이내, 1차 발화 표본과 같은 대화 상대자이나 상호작용 상황은 차이가 있는 자료에서 200발화를 선정하여 4개 세트를 추가로 만들었다(2차 발화 표본).

자발화 분석을 통한 MLU산출

MLU 분석은 연구자들이 개발 중인 아동언어 분석을 위한 소프트웨어 KSTARS (Kim et al., 2013)를 사용하였다. KSTARS는 전사 자료의 띄어 쓰기 단위로 어절을 인식하고, 단어와 형태소는 내장된 형태소 분석기 프로그램에 의해 인식하여 MLU를 산출한다. MLU 분석 시 1) 발화 내 감탄사, 간투사, 2) 발화 내 반복, 3) 발화 내 자기 수정에 해당하는 부분은 분석에서 제외하였다(Appendix 3).

1차와 2차 발화 표본에서 각각 50-100-150-200발화의 네 개 세트에 대해 어절(eojeol), 단어(word), 형태소(morpheme) 단위인 MLU-e, MLU-w, MLU-m를 산출하였다.

통계분석

통계분석은 세 가지로 실시하였다: 1) 1차와 2차 발화 표본에서 50-100-150-200발화 세트를 선정하기 위해 필요한 총 발화 수의 대응표본 t-test, 2) 1차와 2차 발화 표본의 50-100-150-200발화 세트에서 산출한 MLU-e, MLU-w, MLU-m 값의 대응표본 t-test, 3) 각 연령 별로 50-100-150-200발화 세트에서 산출한 MLU-e, MLU-w, MLU-m 값의 Pearson상관분석.

연구 결과

발화 표본 선정을 위해 필요한 총 발화 수의 비교

자발화 분석을 위해서는 발화 선정 기준에 맞는 발화를 선정하여 발화 표본을 만든다. 따라서 일정한 수의 자발화 표본을 선정하기 위해서는 그보다 많은 발화 수의 자료가 필요하며 이를 총 발화 수라 한다. 총 발화 수의 분석은 MLU분석에 필요한 50-100-150-200발화 표본을 얻기 위해 실제로 수집해야 하는 발화 크기를 알아보기 위함이다. 본 연구의 발화 선정 원칙에 따라 50-100-150-200발화 세트를 만들기 위해 필요한 연령별 1차와 2차 발화 표본의 총 발화 수 기술통계는 Appendix 4에 수록하였다. 1차와 2차 발화 표본의 총 발화 수를 대응표본 t-test로 비교한 결과는 Table 1과 같다. 2, 3, 4세 연령 별로 1차/2차 발화 표본에서 50발화 선정에는 65/66, 67/67, 62/58발화가 필요하였으며, 100발화 선정에는 133/132, 135/131, 122/113, 150발화 선정에는 206/200, 202/208, 181/172, 200발화 선정에는 292/288, 274/277, 245/246발화가 필요했다. 2, 3, 4세 아동에서 모두 50-100-150-200발화 선정 시, 1차와 2차 발화 표본 간의 총 발화 수 차이는 유의하지 않았다. 또한 200발화를 선정하기 위해 필요한 총 발화 수의 연령 별 차이는 분산분석 결과, 통계적으로 유의하지 않았다(F_(2,27)=2.66, p>.05).

Table 1

Paired t-test results of total number of utterances between 1st and 2nd sampling (N=10)

1차와 2차 발화 표본의 MLU값 비교

발화 표본 크기 별로 1차 발화 표본과, 2차 발화 표본에서 산출한 MLU값을 비교하였다. 2차 발화 표본은 1차 발화 표본 녹음과 다른 날, 다른 상황에서 수집한 자료이다. 1차로 수집한 자발화 표본과 2차로 수집한 자발화 표본에서, 연령별, 표본 크기(50-100-150-200발화 세트)별로 산출한 평균발화길이의 기술통계는 Appendix 5에 수록하였다. 표본 크기에 따른 1차와 2차 MLU 결과 간의 차이를 보기 위하여, 대응표본 t-test를 실시한 결과는 Table 2와 같다. MLU-e, MLU-w, MLU-m의 세 조건 모두, 4가지 표본 크기(50-100-150-200)에서 1차와 2차 평가 결과의 차이는 통계적으로 유의하지 않았다.

Table 2

Paired t-test results of MLU-e, MLU-w, and MLU-m between 1st and 2nd sampling (N=30)

표본 크기에 따른 MLU-e, MLU-w, MLU-m의 상관 분석

1차와 2차 표본 수집 시의 MLU 평가 결과가 유의한 차이가 없음이 확인되었으므로, 표본 크기에 따른 평균발화길이의 상관분석은 1차 평가 결과 만으로 실시하였다. 상관분석은 2, 3, 4세 각 연령 별로 실시하였다.

2세 아동의 상관 분석 결과는 Table 3과 같다. MLU-e는 50발화 표본으로도 100-150-200발화 표본과 r>.90의 결과가 나타났으나, MLU-w와 MLU-m은 100발화 이상의 표본에서 r>.90이었다.

Table 3

Correlation of MLU regarding speech sample size in 2 years old

3세 아동의 상관 분석 결과는 Table 4와 같다. MLU-e, MLU-w, MLU-m 모두 50발화 표본으로도 100-150-200발화 표본과 r>.90 의 상관계수를 보여주었다.

Table 4

Correlation of MLU regarding speech sample size in 3 years old

4세 아동의 상관 분석 결과는 Table 5와 같다. MLU-e는 50발화 표본에서 200 발화 표본과 r>.90 의 결과가 나타났으나, MLU-w와 MLU-m은 100발화 이상의 표본에서 r>.90으로 나타났다.

Table 5

Correlation of MLU regarding speech sample size in 4 years old

논의 및 결론

자발화 분석을 통해 산출한 MLU는 Brown (1973)의 연구 이래 아동의 언어 능력을 평가하는 지표로 잘 알려졌으나, 표준화 검사에 비하여 시간과 노력이 상대적으로 많이 필요한 것이 사용을 어렵게 하는 요인 중 하나였다. 이후 MacWhinney (2000)의 CHILD 프로젝트, Miller와 Chapman (1991), Miller (2003)의 systematic analysis of language transcripts (SALT)와 같이 컴퓨터를 이용하여 전사와 분석이 가능하게 되면서, MLU를 연구와 임상에서 사용하는 빈도가 높아졌다(Price et al., 2010). 그러나 컴퓨터 프로그램을 이용하는 것으로 해결되지 않는 문제는 신뢰할 수 있는 발화 표본의 크기를 선택하는 것이다. 자발화 분석과 같은 자연적인 평가 결과가 대표성을 갖게 하기 위하여서는 분석 대상 발화, 즉 발화 표본의 크기를 늘리는 것이 유리하나, 이는 전사와 분석에 더 많은 시간이 소요됨을 의미한다. 따라서 자발화 분석 결과가 대표성을 가지려면 어느 정도의 발화 표본을 분석 대상으로 해야 하는 가는 연구자와 임상가의 현실적인 고민이다. 본 연구는 2-4세 일반 발달 아동을 대상으로, 1차와 2차 발화 표본의 총 발화 수와 평균발화길이를 비교하여 발화 표본의 대표성을 확인하였다. 그리고 50-100-150-200발화로 만들어진 발화 표본에서 평균발화길이의 측정 시 신뢰할 수 있는 최소 발화 표본의 크기를 추정하였다.

연구 결과, 첫째, 발화 세트의 선정 시, 1차와 2차 수집 간의 총 발화 수의 차이는 유의하지 않았고, 총 발화 수의 연령 별 차이도 통계적으로 유의하지 않았다. 둘째, 1차와 2차 수집 발화 표본의 MLU-e, MLU-w, MLU-m은 50-100-150-200발화 표본 세트에서 모두 유의한 차이가 없었다. 셋째, MLU-e는 모든 연령에서 50발화 표본이 신뢰할 수 있는 발화 표본의 크기로 나타났으나, MLU-w와 MLU-m은 2세와 4세 아동은 100발화 표본, 3세 아동은 50발화 표본에서 최적의 신뢰도를 확보할 수 있는 것으로 나타났다(r>.90).

총 발화 수와 평균발화길이가 1차와 2차 수집 표본에서 유의한 차이가 없는 것은 자발화 분석을 위한 표본 수집 시 적절한 조건에 따라 발화를 수집한다면 1회 표본 수집으로도 아동 언어 수준 평가에 대한 대표성을 확보 할 수 있음을 의미한다. 총 발화 수는 발화 표본의 선정 조건에 좌우된다. 본 연구에서는 임상에서의 적용 등을 고려하여 발화 표본 선정 조건을 단순화, 명료화 하였다. 발화 상황을 성인 1인과 아동의 상호작용 상황으로 하고 발화 표본의 선정 조건은 불명료한 발화, 미완성발화, 자동화 발화를 제외하고, 반복된 발화의 연속 산출 시 처음 발화만 인정하는 조건이었다. 본 연구와 같이 상황과 문맥을 일정하게 통제하지 않은 자연스러운 조건에서 자발화를 수집한 발화 표본의 경우에도 1차와 2차 발화 표본에서MLU-e, MLU-w, MLU-m이 유의한 차이가 없었다.

본 연구에서는 신뢰할 수 있는 발화 표본의 크기를 추정하는 데에 선행 연구를 바탕으로 두 가지 가설에 따랐다. 첫째, 발화 표본의 크기가 클수록 대표성이 있다는 것과(Gavin & Giles, 1996; Rice et al., 2010; Rowland & Fletcher, 2006), 둘째, 상관계수가 .90 이상인 경우를 신뢰할 수 있는 적절한 수준으로 받아들이는 것이다(Gavin & Giles, 1996; McCauley & Swisher, 1984). 이에 따른 결과를 보면 연령별로 평균발화길이의 단위에 따라 차이를 보였다. 2세의 경우 MLU-e는 50 발화 표본으로도 100-150-200발화 표본의 결과와 상관계수 .90 이상을 보였으나, MLU-w와 MLU-m은 .90 이상에 이르지 못했다. 한국어 아동의 경우 2세 후반에서 다양한 문법형태소를 탐색하기 시작하고 연결어미의 사용이 나타나기 시작하는 것으로 알려져 있다(Pae, 2001). 2세 아동의 경우 조사나 문법형태소와 같은 요소들의 사용을 발화 전체에서 안정적으로 사용하는 단계에 이르지 못했을 수 있다. 따라서 어절 수준에서는 상대적으로 작은 발화 표본(50 발화)에서 얻은 MLU가 큰 발화 표본(200 발화)의 결과와 높은 상관을 보였으나, 단어와 형태소 단위에서는 안정적인 결과를 위해 더 큰 발화 표본(100발화)이 필요했던 것으로 추정된다. 반면 3세 아동의 경우에는 문법적인 발달이 탐색 시기를 지나 어느 정도 안정기에 이르러, 이를 발화 전체 중 고르게 사용하고 있는 것으로 보인다. 그것은 50발화 표본에서 산출한 MLU-e, MLU-w, MLU-m이 모두 100-150-200발화 표본에서 산출한 값들과 매우 높은 상관 r>.93)을 보이는 결과로 확인할 수 있다. 4세에서는 50발화의 MLU-e는 200발화 표본과 .90 이상의 상관계수를 보였으나 MLU-w와 MLU-m은 .90을 넘지 못했으나 매우 근접한 수치를 보였다(.89). 그러나 연령 별로 신뢰할 수 있는 발화 표본의 크기가 차이가 난 것에 대한 원인 추정은 본 연구 결과 만으로는 확인하기 어려우므로 후속 연구가 필요하다.

분석 단위로 보면, 어절 단위의 평균발화길이인 MLU-e는 2,3,4 세 전 연령에서 일관되게 50발화의 표본으로도 높은 신뢰도를 보여주었다. MLU-e는 한국어의 고유한 언어학적 단위인 어절, 띄어쓰기 단위를 분석 단위로 하므로 MLU-m이나 MLU-w에 비해 상대적으로 분석이 용이하여 현장의 언어치료사가 쉽게 사용할 수 있다. 또한 MLU-e는 Kim (1997), Jung과 Yoon (2013)에서 의미있는 발달 지표로 확인이 되었다. 그러나 MLU-e와 MLU-w 및 MLU-m을 통해 볼 수 있는 언어 능력은 차이가 있는 만큼 평가 목적에 따라 신중한 고려가 필요하다.

결론적으로 본 연구 결과에 따라 임상과 교육 현장에서 언어 발달 수준을 평가하는 지표로 MLU-e를 사용하고자 한다면 50발화 크기의 발화 표본을 추천한다. 반면 보다 문법적인 사용 능력까지 보고자 MLU-w나 MLU-m을 평가할 때는 100발화 크기의 발화 표본을 추천한다. 또한 아동에 따라 개인차가 있을 수 있으나 일반적으로 MLU 분석을 위한 50-100발화 표본을 위해, 실제 수집해야 하는 총 발화 수는 그보다 30% 내외가 더 필요한 것으로 나타났다.

본 연구의 제한점 및 향후 과제는 다음과 같다. 첫째, 본 연구에서는 각 연령별로 발화 표본의 크기에 따라 산출한 MLU를 부록에 제시하고 그에 대한 직접적인 논의를 전개하지는 않았다. 그 이유는 본 연구의 목적이 안정적으로 신뢰할 수 있는 수준으로 산출되는 표본 크기를 구하는 것이지, 학령전기 아동의 MLU 평균 제시에 있지 않았기 때문이다. 향후 연구에서는 선행 연구에서 제시된 평균값과 비교하여 본 연구와 같은 자연스러운 상황에서의 자발화 수집과 구어 중심의 발화 구분 등에 대한 기준 변경에 따른 평균값의 비교가 필요할 것이다. 둘째, 자발화 분석을 통해 아동의 언어를 평가 할 때는 MLU외에도 서로 다른 단어 수(NDW)나 총 단어 수(TNW)와 같은 의미론적인 지표 들도 많이 사용한다. 이러한 지표의 경우 TNW는 발화 표본의 크기가 직접적인 영향을 주는 지표이고, NDW의 경우에도 의미론적인 다양성을 나타내는 지표이므로, 발화 표본의 크기는 MLU보다 영향력이 커질 것으로 추정된다. 따라서 아동의 어휘 발달 특성을 고려하여 연령 별로 확인을 할 필요가 있으므로 의미론적 지표 분석 시 자발화 표본의 크기에 대한 후속 연구를 기대한다. 셋째, 본 연구의 출발은 자발화 분석 시 신뢰할 수 있는 최소 발화표본의 크기를 추정하여, 임상 현장에서 자발화 분석 시 수반되는 노력을 줄이고 자발화 분석을 보다 활성화 하고자 하는 데에 있었다. 이러한 목적에 보다 충실하려면 본 연구의 자발화 수집 방법과 같은 자연스러운 상황에서 부모와 아동 간의 발화 자료를 수집하는 방법보다, 임상 현장에서 구조화된 상황에서 임상가와의 상호작용으로 짧은 시간에 발화 표본을 수집하는 방법(Heilmann, Nockerts, & Miller, 2010)이 적절했을 수도 있을 것이다. 연구자들은 구조화된 상황이나 임상가와 아동의 상호작용 보다 가정에서 부모와의 상호작용에서 수집한 발화 표본이 아동의 언어 능력을 대표한다고 판단하였으나 현실적으로 임상에서 진행하기 어려운 발화 수집 방법일 수 있다. 따라서 이에 대한 고려가 필요할 것으로 보인다. 넷째, 본 연구를 진행하며 제기된 또 다른 과제는 발화의 구분 기준, MLU의 산출 기준 등에 대해 언어치료 영역뿐 아니라 국어, 언어 분야의 관련 전문가 들이 모여 보다 폭 넓고 깊이 있는 논의를 통해 한국어에 적합한 공통 기준을 만드는 작업이 무엇보다 시급하다는 점이다. 연구자들이 본 연구에서 제시한 기준 역시 논란의 여지가 있는 불완전한 기준이다. 따라서 본 연구가 이러한 논의의 출발이 되기를 기대한다.

Notes

CONFLICT OF INTEREST

No potential conflict of interest relevant to this article was reported.

References

Brown, R. (1973). A first language. Cambridge, MA: Harvard University Press.

Chapman, R. (1981). Computing mean length of utterance in morphemes. In J. F. Miller, Assessing language production in children: experimental procedures. Baltimore, MD: University Press Park.

Conant, S. (1987). The relationship between age and MLU in young children: a second look at Klee and Fitzgerald’s data. Journal of Child Language, 14, 169–173.

Gavin, W.J., & Giles, L. (1996). Sample size effects on temporal reliability of language sample measures of preschool children. Journal of Speech, Language and Hearing Research, 39, 1258–1262.

Heilmann, J., Nockerts, A., & Miller, J.F. (2010). Language sampling: does the length of the transcript matter. Language, Speech, and Hearing Services in Schools, 41, 393–404.

Jeong, B.S., & Kwon, D.H. (2000). A comparative study among the language sampling methods in the mean length of utterance and type-token ratio. Journal of Speech and Hearing Disorders, 9, 1–25.

Johnston, J.R. (2001). An alternate MLU calculation: magnitude and variability of effects. Journal of Speech, Language and Hearing Research, 44, 156–164.

Jung, Y.H., & Yoon, M.S. (2013). Mean length of utterance for typically developing children of 2 to 4 years. Korean Journal of Early Childhood Special Education, 13, 55–73.

Kim, J.M., Yoon, M.S., Kim, S.J., Chang, M.S., & Cha, J. (2012). Utterance types in typically developing preschoolers. Korean Journal of Communication Disorders, 17, 488–498.

Kim, J.M., Chang, M.S., Yoon, M.S., & Kim, S.J. (2013). Development of KSTARS: language analysis system combined with transcription for Korean. In Proceeding of the ASHA 2013, Chicago, IL.

Kim, S.J., Kim, J.M., & Yoon, M.S. (2013). Speech Intelligibility of spontaneous conversation in typically developing children between 2-4 years of age. Communication Sciences & Disorders, 18, 311–317.

Kim, Y.T. (1997). Study on utterance length in 2-4 years old Korean children. Korean Journal of Communication Disorders, 2, 5–25.

Kim, Y.T. (2002). Child language disorders: assessment and treatment. Seoul: Hakjisa.

Kim, Y.T., Hong, K.H., Kim, K.H., Chang, H.S., & Lee, J.Y. (2009). Receptive-expressive vocabulary test (REVT). Seoul: Seoul Community Rehabilitation Center.

Klee, T., Stokes, S.F., Wong, A.M.Y., Fletcher, P., & Gavin, W.J. (2004). Utterance length and lexical diversity in Cantonese-speaking children with and without specific language impairment. Journal of Speech, Language and Hearing Research, 47, 1396–1410.

Kwak, S.D., & Chang, M.S. (2012). Development of transcription tools that improved safety and convenience. In : Proceedings of the International Conference on Hybrid Information Technology, Daejeon, Korea. 294–299.

Lee, H.J., & Kim, Y.T. (1999). Measures of utterance length of normal and language-delayed children. Korean Journal of Communication Disorders, 4, 153–166.

Ling, D. (1976). Speech and the hearing impaired child: theory and practice. Washington, DC: Alexander Graham Bell Association for the Deaf and Hard of Hearing.

Lund, N.J., & Duchan, J.F. (1993). Assessing children’s language in naturalistic contexts. Englewood Cliffs, NJ: Prentice-Hall.

MacWhinney, B. (2000). The childes project: tools for analyzing talk (3rd ed.). Mahwah, NJ: Erlbaum.

McCauley, R.J., & Swisher, L. (1984). Psychometric review of language and articulation tests for preschool children. Journal of Speech and Hearing Disorders, 49, 34–42.

Miller, J.F., & Chapman, R.S. (1991). Systematic analysis of language transcripts. Madison, WI: University of Wisconsin-Madison, Waisman Center, Language Analysis Laboratory.

Miller, J.F. (2003). Systematic analysis of language transcripts (SALT, version 8). Madison, WI: University of Wisconsin-Madison, Waisman Center, Language Analysis Laboratory.

Miller, J.F., Heilmann, J., Nockerts, A., Iglesias, A., Fabiano, L., & Francis, D.J. (2006). Oral language and reading in bilingual children. Learning Disabilities Research & Practice, 21, 30–43.

Pae, S. (2001). Language development. In Lee, S. (Ed.), Introduction to communication disorders. Seoul: Hanauihaksa.

Pae, S.Y., Kim, K.S., Sung, K.H., & Sung, J.A. (1998). Computer and language assessment: Korean Computerized Language Analysis-1.0. Korean Journal of Communication Disorders, 3, 123–137.

Pae, S.Y., Kwak, K.J., Chang, Y.K., & Sung, H.R. (2006). M-B-CDE-K. Chuncheon: Hanlim University.

Park, J.Y., & Seok, D.I. (2007). A study of language age and MLU-m characteristics of bilingual environment children. Journal of Special Education: Theory and Practice, 8, 445–463.

Price, L.H., Hendricks, S., & Cook, C. (2010). Incorporating computer-aided language sample analysis into clinical practice. Language, Speech, and Hearing Services in Schools, 41, 206–222.

Rice, M.L., Redmond, S.M., & Hoffman, L. (2006). Mean length of utterance in children with specific language impairment and in younger control children shows concurrent validity and stable and parallel growth trajectories. Journal of Speech, Language and Hearing Research, 49, 793–808.

Rice, M.L., Smolik, F., Perpich, D., Thompson, T., Rytting, N., & Blossom, M. (2010). Mean length of utterance levels in 6-month intervals for children 3 to 9 years with and without language impairments. Journal of Speech, Language and Hearing Research, 53, 333–349.

Rowland, C.F., & Fletcher, S.L. (2006). The effect of sampling on estimates of lexical specificity and error rates. Journal of Child Language, 33, 859–877.

Scarborough, H., Wyckoff, J., & Davidson, R. (1986). A reconsideration of the relation between age and mean utterance length. Journal of Speech, Language and Hearing Research, 29, 394–399.

Appendix

Appendix 1. 발화 구분 기준(Kim et al., 2012 에서 수정)

Appendix 2. 평균발화길이(mean length of utterance) 산출을 위한 분석 기준

Appendix 3. 평균발화길이(mean length of utterance) 분석을 위한 어절, 단어, 형태소 구분 기준

Appendix 4. Total number of utterances regarding age and sample size (N=10)

MLU=mean length of utterance; e=eojeol; w=word; m=morpheme.

Appendix 5. MLU-e, MLU-w, and MLU-m regarding age, sample size, and sampling time

Article information Continued

This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

Age (yr)	Sample size	Paired diff.		t
Age (yr)	Sample size	M	SD	t
2	50	-.70	9.73	-.22
	100	.10	23.30	.01
	150	5.40	33.58	.50
	200	4.70	52.85	.28
3	50	.80	11.11	.22
	100	4.50	16.90	.84
	150	-5.60	30.63	-.57
	200	-3.00	43.47	-.21
4	50	4.30	10.03	1.35
	100	8.60	9.60	2.83
	150	8.30	15.53	1.69
	200	-.50	16.45	-.09

MLU	Sample size	Paired diff.		t
MLU	Sample size	M	SD	t
MLU-e	50	-.12	.43	-1.55
	100	-.17	.58	-1.61
	150	-.23	.87	-1.47
	200	-.08	.49	-.93
MLU-w	50	-.08	.64	-.69
	100	-.13	.91	-.80
	150	-.06	.45	-.75
	200	-.08	.60	-.72
MLU-m	50	-.13	.87	-.84
	100	-.02	.43	-.28
	150	-.04	.59	-.37
	200	-.08	.85	-.52

MLU	Sample size	MLU-e				MLU-w				MLU-m
MLU	Sample size	50	100	150	200	50	100	150	200	50	100	150
MLU-e	100	.94**	-	-	-	-	-	-	-	-	-	-
	150	.91**	.98**	-	-	-	-	-	-	-	-	-
	200	.90**	.96**	.97**	-	-	-	-	-	-	-	-
MLU-w	50	.91**	.80**	.81**	.84**	-	-	-	-	-	-	-
	100	.93**	.93**	.92**	.93**	.91**	-	-	-	-	-	-
	150	.87**	.86**	.91**	.89**	.86**	.94**	-	-	-	-	-
	200	.85**	.81**	.86**	.90**	.88**	.92**	.97**	-	-	-	-
MLU-m	50	.90**	.78**	.81**	.86**	.96**	.90**	.88**	.93**	-	-	-
	100	.89**	.89**	.91**	.93**	.86**	.96**	.98**	.97**	.91**	-	-
	150	.76*	.77**	.84**	.83**	.74*	.83**	.97**	.94**	.81**	.95**	-
	200	.78**	.77**	.83**	.85**	.76*	.86**	.96**	.97**	.85***	.97**	.98**

MLU	Sample size	MLU-e				MLU-w				MLU-m
MLU	Sample size	50	100	150	200	50	100	150	200	50	100	150
MLU-e	100	.96**	-	-	-	-	-	-	-	-	-	-
	150	.94**	.98**	-	-	-	-	-	-	-	-	-
	200	.93**	.97**	.99**	-	-	-	-	-	-	-	-
MLU-w	50	.98**	.98**	.98**	.97**	-	-	-	-	-	-	-
	100	.95**	.98**	.99**	.99**	.99**	-	-	-	-	-	-
	150	.91**	.96**	.99**	.99**	.97**	.99**	-	-	-	-	-
	200	.90**	.95**	.98**	.99**	.96**	.98**	.99**	-	-	-	-
MLU-m	50	.98**	.99**	.97**	.97**	.99**	.99**	.96**	.95**	-	-	-
	100	.95**	.99**	.99**	.99**	.98**	.99**	.98**	.98**	.98**	-	-
	150	.90**	.95**	.99**	.99**	.96**	.99**	.99**	.99**	.95**	.98**	-
	200	.89**	.94**	.98**	.99**	.95**	.98**	.98**	.99**	.94**	.98**	.99**

MLU	Sample size	MLU-e				MLU-w				MLU-m
MLU	Sample size	50	100	150	200	50	100	150	200	50	100	150
MLU-e	100	.84**	-	-	-	-	-	-	-	-	-	-
	150	.84**	.93**	-	-	-	-	-	-	-	-	-
	200	.91**	.93**	.97**	-	-	-	-	-	-	-	-
MLU-w	50	.94**	.83**	.76*	.83**	-	-	-	-	-	-	-
	100	.85**	.97**	.90**	.91**	.89**	-	-	-	-	-	-
	150	.87**	.91**	.98**	.96**	.84**	.93**	-	-	-	-	-
	200	.93**	.90**	.95**	.98**	.89**	.92**	.97**	-	-	-	-
MLU-m	50	.94**	.81**	.75*	.84**	.96**	.89**	.79**	.88**	-	-	-
	100	.87**	.98**	.89**	.92**	.88**	.97**	.89**	.91**	.89**	-	-
	150	.88**	.94**	.99**	.98**	.82**	.92**	.98**	.97**	.82**	.92**	-
	200	.93**	.92**	.95**	.98**	.87**	.91**	.94**	.98**	.89**	.94***	.98**