말소리장애 아동의 기저결함 감별진단을 위한 무의미음절 따라말하기 과제(nSRT)의 타당성 검증

Validation of the Nonsense Syllable Repetition Test for Differential Diagnosis of Underlying Deficits in Children with Speech Sound Disorders

Article information

Commun Sci Disord Vol. 30, No. 4, 751-760, December, 2025
Publication date (electronic) : 2025 December 31
doi : https://doi.org/10.12963/csd.250163
aInternational Institute of Rehabilitation Science, Daegu University, Gyeongsan, Korea
bDepartment of Speech and Language Pathology, Daegu University, Gyeongsan, Korea
류은주a, 하지완,b
a대구대학교 국제재활과학연구소
b대구대학교 언어치료학과
Correspondence: Ji-Wan Ha, PhD Department of Speech and Language Pathology, Deagu University, 201 Daegudea-ro, Jillyang-eup, Gyeongsan 38453, Korea Tel: +82-53-850-4327 Fax: +82-53-850-4329 E-mail: jw-ha@daegu.ac.kr
This paper was based in part on the first author’s doctoral dissertation.
Received 2025 October 12; Revised 2025 December 2; Accepted 2025 December 2.

Abstract

배경 및 목적:

본 연구는 말소리장애 집단의 말소리 처리와 관련된 기저결함 요인을 음운부호화, 음운기억, 조음전환 결함의 세 범주로 구분하고, 무의미 음절 따라말하기 과제를 활용하여 각 결함 요인에 대응하는 분석 방식을 개발함으로써 기저결함을 정량적으로 감별할 수 있는 체계를 구축하고자 하였다.

방법:

비단어 따라말하기 과제인 nSRT (nonsense Syllable Repetition Test)를 개발하고 채점 체계를 확립하고, 일반(TD) 아동 63명, 순수 말소리장애(pure SSD) 아동 49명, 언어장애를 동반한 말소리장애(SSD+LD) 아동 12명을 대상으로 무의미음절 따라말하기 과제를 실시하였다. 이를 통해 공인타당도를 검증하였고, 연령 및 집단 간 수행 차이를 분석하였다.

결과:

세 영역 모두에서 모두 긍정적인 공인타당도가 확보되었다. 연령 비교에서는 연령이 증가할수록 수행력이 향상되는 것으로 나타났으며, 집단 비교에서는 pure SSD 집단이 음운부호화와 조음전환에서 취약하였고, SSD+LD 집단은 음운기억 영역에서 가장 심각한 결함을 보였다.

논의 및 결론:

본 연구결과는 제안된 nSRT 분석이 기존 평가 도구의 표면적 오류 분석의 한계를 보완하며 기저 말소리 처리 능력의 발달적 변화와 임상적 이질성을 민감하게 변별할 수 있음을 시사한다.

Trans Abstract

Objectives

This study aimed to categorize the underlying deficits related to speech processing in the speech sound disorder group into three categories: phonological encoding deficit, phonological memory deficit, and articulation transition deficit. By developing analytical methods corresponding to each factor using a non-word repetition task, we aimed to establish a system capable of quantitatively differentiating these underlying deficits.

Methods

We developed the Nonsense Syllable Repetition Test (nSRT) as a non-word repetition task and established its scoring systzem. It was administered to 63 typically developing (TD) children, 49 children with pure speech sound disorder (SSD), and 12 SSD children with language disorder (SSD+LD). Concurrent validity was verified, and performance differences by age and group were analyzed.

Results

Positive concurrent validity was established for all three underlying deficit scores. Age comparison showed improved performance with age, while group comparison revealed that the pure SSD group demonstrated weakness in phonological encoding and articulatory transition, and the SSD+LD group showed the most severe deficits in phonological memory.

Conclusion

These findings suggest that the proposed nSRT analysis complements the limitations of conventional surface error analysis in existing assessment tools and indicates that it can sensitively differentiate developmental changes and clinical heterogeneity in underlying speech processing abilities.

말소리장애(Speech Sound Disorders, SSD)는 아동기에서 가장 흔히 관찰되는 의사소통장애 중 하나로, 취학 전 아동의 최대 약 25%에 영향을 미치는 것으로 보고된다(ASHA, 2007). 일부 아동의 경우 신경학적 손상, 청각 손실, 구강구조 이상과 같은 뚜렷한 의학적 요인을 동반하지만, 다수의 아동에서는 명확한 원인 없이 발현된다(Broomfiled & Dodd, 2004). 여기서 ‘원인을 알 수 없다’는 것은 단순히 발병 요인을 특정할 수 없다는 차원을 넘어선다. 즉, 이들의 오류 양상은 하나의 원인으로 설명될 수 없으며, 동일한 집단 내에서도 인지적 특성이나 말처리(speech processing) 결함 정도가 서로 다르게 나타난다. 이는 곧 원인을 알 수 없는 SSD 집단이 동질적이지 않고, 오히려 이질적인 특성을 지닌 아동들로 구성되어 있음을 시사한다. 실제로 Stackhouse와 Wells (1997)의 말처리 모형이나 Dodd (2005)의 분류 체계 등 기존의 이론적 틀에서도, 말소리 오류가 발생하는 기제를 밝히기 위해 다양한 분석적 접근이 제안되어 왔다. 이러한 접근은 곧 임상과 연구 현장에서 원인을 알 수 없는 SSD 집단을 오류의 양상, 인지적 특성, 말처리 결함 수준에 따라 보다 정교하게 분류하려는 시도가 꾸준히 이어지고 있음을 보여준다. 따라서 이들을 하나의 단일한 집단으로 간주하기보다 하위 유형들로 세분화하여 이해할 필요성이 제기된다(Pi & Ha, 2020).

그런 의미에서 최근 비단어 따라말하기(nonword repetition) 과제가 주목받고 있다. 비단어를 성공적으로 따라말하기 위해서는 일련의 새로운 말소리조합에 대한 청각적 입력, 음소지각, 음운기억, 음운인출, 말운동계획, 말운동실행 등 기저 말·언어처리 단계의 여러 과정들을 모두 거쳐야 하는 만큼, 이 중 어떤 단계에서 어려움이 있더라도 과제 수행력은 떨어질 수밖에 없다. 이 같은 이유로 비단어 따라말하기 과제는 말소리장애뿐 아니라 기타 의사소통장애의 선별에도 유용한 방법으로 알려져 있다(Dollaghan & Campbell, 1998; Gathercole & Baddeley, 1990). 비단어라는 특성상 기존의 언어적 지식과 경험의 영향을 최소화할 수 있어, 전 연령층의 평가에 활용할 수 있고 다문화 화자와 외국인에도 적용 가능하다는 점에서 보편적인 의사소통장애 선별검사로의 확장성 또한 입증된 바 있다(Campbell, Dollaghan, Needleman, & Janosky, 1997). 아울러 더 이상 장애로 진단되지 않는, 의사소통장애 이력만을 갖고 있는 대상자의 경우도 비단어 따라말하기에서는 여전히 수행력이 떨어지는 것으로 보고되었는데(Kim & Ha, 2025; Thal, Miller, Carlson, & Vega, 2005), 이는 표면적으로는 문제가 해결되었더라도 이들이 가진 기저결함은 여전히 존재함을 시사한다. 이런 맥락에서 몇몇 연구자들은 비단어 따라말하기를 선별검사 이상의 도구로 활용하려는 다양한 시도를 하고 있다. 그 중 하나가 SSD 아동에서 비단어 따라말하기 수행 시 나타난 오류를 분석하여 기저 말처리과정의 취약점, 즉 SSD를 초래한 기저결함을 파악하고자 하는 것이다. 대표적 학자인 Shriberg와 동료들은 ‘The Syllable Repetition Task (SRT)’라는 비단어 따라말하기 과제를 개발하여, SSD의 선별 뿐 아니라 기저결함 감별진단도구로서의 SRT의 가능성을 다수의 연구에서 보고한 바 있다(Shriberg et al., 2009; Shriberg & Lohmeier, 2008; Shriberg, Lohmeier, Stand, & Jakielski, 2012).

언어심리학적 관점에서 SSD의 기저결함은 음운부호화(phonological encoding), 음운기억(phonological memory), 조음전환(articulatory transition)의 세 영역의 결함으로 개념화할 수 있다(Ryu & Ha, 2024; Shiriberg et al., 2012). 이 구분은 말소리 산출이 ‘표상의 형성’, ‘일시적 저장/순서 유지’, ‘연속적 운동전환’이라는 일련의 처리 단계를 통해 이루어진다는 이론에 기반하며(Stackhouse & Wells, 1997), 각 단계의 취약성은 과제 수행에서 상이한 오류 양상으로 드러날 수 있다. 오류는 익숙한 단어에서보다 새로운 말소리 조합을 듣고 낯선 운동조합을 생성해내야 할 때 더 쉽게 드러나기 때문에, 비단어 따라말하기는 오류 분석에 유용한 과제이다. 관련하여 음운부호화, 음운기억, 조음전환 결함에 대해 메타분석을 실시한 Ryu와 Ha (2024)의 연구에서는 세 기저결함을 반영하는 오류를 다음과 같이 정리하였다. 첫째, 청지각적으로 음성적 차이가 두드러지지 않는 공명음과 파열음 내에서 동일 자질을 공유하는 음소 간 대치가 반복적으로 관찰되면, 이는 입력 과정에서의 음소 선택의 불안정, 즉, 음운부호화 결함을 시사한다. 둘째, 음소 생략, 항목길이에 따른 정확도 저하, 동일 음소의 반복(perseveration)과 같은 오류가 빈번하게 나타나면, 이는 음운단위를 일시적으로 저장하고 유지하는 과정의 어려움, 즉, 음운기억 결함을 의미한다. 셋째, 음소 첨가, 유 · 무성 대치, 경계부 동화, 조음연쇄 실패와 같은 오류가 특징적으로 관찰되면, 이는 분절음 간 연속적 전이와 섬세한 운동계획의 취약성, 즉, 조음전환의 결함을 반영하는 것이다. 이 같은 분석은 영어권 SSD 아동을 대상으로 음운부호화, 음운기억, 조음전환 결함을 다루었던 Shriberg 등(2012)의 연구에서도 유사하였다.

지금까지의 SSD 평가는 대부분 음소나 음절 수준에서 산출정확도를 측정하는 방식에 국한되어 있다. 이러한 평가는 발화의 표면적 정확성을 확인하는 데는 유용하지만, 말소리 산출에 이르는 복잡한 처리과정을 반영하지 못한다. ‘얼마나 정확하게 발음할 수 있는가’만을 보여줄 뿐 왜 그러한 오류가 발생했는지에 대한 기저원인을 설명해주는 데에는 한계가 있다. 결국 다양한 특성을 지닌 아동들을 ‘말소리장애’라는 하나의 동질적 집단으로 묶을 뿐, 이들의 기저결함 차이에 대해서는 어떠한 답도 제시해주지 않는다. SSD 아동을 보다 정밀하게 이해하기 위해서는 단순한 산출정확도를 넘어, 말처리과정을 전반적으로 탐색할 수 있는 새로운 평가 방식이 필요하다. 표면적 정확도만으로는 오류의 근본적 원인을 규명하기는 어려우며, 결과적으로 잘못된 해석이나 부적절한 중재 전략이 제시될 위험이 있다. 따라서 아동 개개인의 기저결함을 구체적으로 파악하고 조기 개입이 필요한 특성을 식별하기 위해서는 민감하고 정교한 평가가 요구된다(Kim & Ha, 2024). 본 연구자들은 비단어 따라말하기 과제의 오류 분석이 이러한 평가적 요구에 부응할 것으로 기대하였다.

이에, 본 연구에서는 무의미음절 따라말하기 검사(nonsense Syllable Repetition Test, nSRT)를 개발하여 SSD와 관련된 기저결함 지표들을 특정하고 각 지표의 분석방법을 정립하고자 한다. 그리고 정립된 분석방법을 SSD 아동의 발화에 직접 적용하여 말소리 산출과 관련된 기저결함 감별진단도구로서의 nSRT의 타당성과 유용성을 입증해보고자 한다. 이때 기저결함 영역 중 음운부호화와 음운기억은 언어처리와도 밀접한 연관이 있는 바, 언어장애(Language Disorder, LD)를 동반한 SSD 아동 또한 연구대상에 포함하여 동반장애 없이 말소리에만 문제를 보이는 순수 SSD 집단과의 수행력을 비교해본다면, nSRT의 타당성에 대해 더욱 시사하는 바가 있을 것이다. 이 같은 연구목적을 위한 구체적인 연구질문을 정리하면 다음과 같다. 첫째, nSRT 세부 점수들은 각 기저결함을 반영하는 지표로서 타당성을 지니는가? 둘째, nSRT 세부 점수들은 기저결함 여부를 감별하는 진단도구로서 유용성을 지니는가?

연구방법

연구대상

본 연구의 대상자는 4세, 5세, 6세 아동 총 124명으로, 일반 아동(typically developing, TD) 63명, 순수 말소리장애 아동(pure speech sound disorders, pure SSD) 49명, 언어장애를 동반한 말소리장애 아동(speech sound disorder with comorbid language disorder, SSD+LD) 12명으로 구성되었다. 모든 대상자는 부모 및 교사 보고를 통해 인지, 정서, 시각 및 청각 등의 감각장애, 자폐스펙트럼 장애나 ADHD를 포함한 신경학적 질환의 병력이 없는 것으로 확인되었다.

집단 구분은 수용 ·표현 어휘력 검사(Receptive and Expressive Vocabulary Test, REVT; Kim, Hong, Kim, Jang, & Lee, 2009), 한국 레이븐 지능발달검사(Korean Coloured Progressive Matrices, K-CPM; Lim, 2004), 우리말 조음 ·음운 평가2 (Urimal Test of Articulation and Phonation, UTAP2; Kim, Shin, Kim, & Ha, 2020)를 활용하여 선별되었다. TD 집단은 모든 검사에서 정상 범위에 속한 아동으로 구성되었으며, pure SSD 집단은 REVT 점수가 –1 SD 이상, K-CPM 점수가 85점 이상(정상범위), UAP2 단어 수준 전체 자음 정확도가 –1 SD 미만에 속하는 아동으로 선별되었다. SSD+LD 집단은 REVT 점수가 –1 SD 이하이고, K-CPM 정상 범위에 속하며, UTAP2 단어 수준 전체 자음 정확도 –1 SD 미만인 아동으로 분류되었다.

연구에 참여한 총 124명 중 남아 78명, 여아 46명이었으며, 집단별로는 TD 집단이 남아 39명, 여아 24명, pure SSD 집단이 남아 32명, 여아 17명, SSD+LD 집단이 남아 7명, 여아 5명으로 구성되었다. 세 집단 간 성별 분포의 차이를 확인하기 위해 교차분석을 실시한 결과, 집단 간 성별은 유의한 차이를 보이지 않았다(p>.05). 또한 각 집단별 대상자의 생활연령, K-CPM 점수, REVT, 전체 자음정확도(total PCC)에 대한 집단 간 동질성 검정을 위해 일원분산분석(One-way ANOVA)을 실시하였으며, 세 집단의 기본 정보 및 동질성 검정 결과는 Table 1에 제시하였다.

Characteristics of participants

연구과제

nSRT 항목 선정

nSRT 항목 개발을 위해 다음의 두 가지 원칙을 기본 전제로 하였다. 첫째, 의미를 갖지 않은 일음절들을 조합하여 비단어 항목을 제작한다. 이는 언어적 지식과 경험에 따른 하향적 처리의 영향을 배제함으로써 발달적 성숙, 중재, 빈번한 사용 등으로 인해 기저결함이 드러나지 않을 가능성을 최대한 통제하기 위함이다. 둘째, 조음 실행이 최대한 어렵지 않도록 비단어 항목을 구성한다. 이는 nSRT의 목적이 조음능력 자체를 평가하고자 하는 것이 아니라, 음운부 호화, 음운기억, 조음전환이라는 기저 처리능력을 파악하고자 하는 것이기 때문이다. 이를 위해 음절구조는 종성이 없는 구조로 한정하고, 마찰음, 유음 등 조음방법적으로 발음하기 어려운 음소는 최소한으로 제한한다. 이러한 원칙에 기반하여 다음과 같은 절차를 걸쳐 최종 nSRT 자극어를 도출하였다.

첫째, 한글 맞춤법 규정을 준용하여 19개의 자음과 21개의 모음(단모음 10개, 이중모음 11개)을 배열하여 조합 가능한 일음절 형태를 모두 나열하였다. 맞춤법 규정에 따라 종성에 겹받침이 오는 경우도 허용하여, 11,172개의 일음절이 우선 확보되었다. 둘째, 표준국어대사전을 참고하여 단어로 등재된 일음절어를 제외하였다. 동음이의어 224개와 비동음어 310개, 총 534개의 일음절어가 제외되어, 단어로 인정받지 않는 일음절 10,638개가 남았다. 셋째, 언어학 박사 2인의 자문을 받아 우리말에서 사용되지 않는 비사용 일음절 형태 8,867개를 제외하여, 단어로는 인정되지 않지만 음절로는 사용 가능한 1,771개의 일음절이 남았다. 넷째, 1,771 일음절을 음가(말소리)로 전사한 후, 이에 대해 연구자들의 합의를 통해 실질적 의미를 담고 있는 어근으로 판단되거나 청각적으로 제시되었을 때 실질형태소로 인식될 가능성이 있는 음절들을 모두 제외하였다. 이 과정에서 다수의 형태가 제외되어, 결국 70개의 일음절이 남았다. 다섯째, 추출된 70개의 일음절 각각에 대해 언어재활사 25명과 일반 성인 25명을 대상으로 떠오르는 의미를 모두 적도록 요청하는 설문조사를 실시하였다. 이 조사에서 설문대상자 10% 이상이 의미를 작성한 일음절을 제외하였고, 더불어 발화 시 조음운동적 부담감을 최소화하고 경음화 비율을 측정하는 조음전환 지표와의 혼동을 피하기 위해 [+긴장성]이 있는 경음, 격음 음절을 제외하였다. 이 과정을 거쳐 최종적으로 19개의 일음절만이 남았다. 여섯째, 이 19개의 일음절에 대해 난수표를 활용한 반복적 무선조합을 실시하여 2음절, 3음절, 4음절 비단어를 생성하였다. 그 결과 2음절어 11개, 3음절어 10개, 4음절어 9개의 예비 nSRT 항목 30개가 구성되었다. 일곱째, 30개의 예비 항목에 대해 1급과 2급 언어재활사 33명을 대상으로 해당 자극어가 단어처럼 들리는 정도를 물어보는 5점 척도의 ‘단어유사성’ 평가를 실시하였다. 평가 결과, 평균 점수가 2점 이하(어떤 단어와도 유사하지 않음, 어떤 단어와도 전혀 유사하지 않음)인 항목만을 남기고 그 이외 항목은 모두 제외하였다. 여덟 째, 일반 아동 대상의 예비연구를 통해 목표 자극어가 정확하게 전달되지 않아 청지각적으로 오류를 유발할 수 있는 항목, 조음동작 자체가 어렵다고 판단되는 항목 등을 제외하였고, 추가적으로 요인 분석을 실시하여 공통성 값이 .40 미만인 항목을 제거하였다. 이상과 같은 전 과정을 통해 최종적으로 2음절어 9개, 3음절어 7개, 4음절어 7개만이 남아, 총 23개의 nSRT 항목이 도출되었다. 최종 선정된 nSRT 항목은 Appendix 1에 제시하였다.

기저결함별 분석방식 정립

본 연구에서 고안한 nSRT 기저결함 분석은 음운부호화, 음운기억, 조음전환의 세 영역으로 구분하여 수행되었으며, 각 영역에서 나타날 수 있는 오류 특성을 규정한 선행연구(Ryu & Ha, 2024; Shiriberg et al., 2012)를 토대로 각 지표별 분석 체계를 확립하였다. 모든 점수는 부적 수치(negative score)로 점수가 높을수록 각 기저 결함의 가능성이 높음을 의미한다.

우선, 음운부호화 점수는 2음절과 3음절 자극어의 모음, 비음, 파열음을 동일 자질의 다른 음소로 대치한 비율을 의미한다. 즉, 2, 3음절 전체 모음, 비음, 파열음을 다른 모음, 비음, 파열음으로 대치한 수의 비율을 백분율로 구한 것이다. 예를 들어 /그머/를 [드너]로 발음한 경우 목표 파열음 /ㄱ/를 다른 파열음 /ㄷ/로, 목표 공명음 /ㅁ/를 다른 공명음 /ㄴ/로 대치하였으므로, 음운부호화 오류는 합하여 총 2회가 된다. 마찰음, 파찰음, 유음의 경우 조음운동의 부담으로 인해, 4음절어의 경우 기억폭의 제한으로 인해 오류가 발생할 가능성이 있으므로, 음운부호화 점수 산정에서 제외하였다(Shiriberg et al., 2012). 또한 Shriberg 등(2012)의 연구에서는 공명음과 파열음 내에서의 대치를 음운부호화 오류로 보았으나, 우리말의 공명음 중 유음은 대치될 수 있는 동일 자질의 음소가 존재하지 않으므로 본 분석에서 제외하였다.

둘째, 음운기억 점수는 전체 4음절 자극어에서 목표 음소를 자극어 내 다른 음소로 대치한 항목 수의 비율을 백분율로 구한 것이다. 이때 대치된 음소는 비발달적(비전형적) 오류이면서 동시에 동일 자극어 내에 포함된 음소이어야 하는데, 이는 청지각적 혹은 조음운동적 결함으로 인한 오류 가능성을 배제하기 위한 장치이다(Shiriberg et al., 2012). 즉, 오류의 발생 원인을 음운기억의 방해로 밖에 해석할 수 없는 경우에 한해 음운기억 점수에 산정하였다. 예컨대, /히브지머/를 [히브미머]라고 산출한 경우, /ㅈ/를 /ㅁ/로 대치한 것은 비발달적 오류이면서 자극어에 포함된 다른 음소 /ㅁ/를 반복한 것이므로, 이는 음운기억 오류 항목에 해당한다.

마지막으로 조음전환 점수는 음소 첨가와 경음화 오류의 두 가지 지표값을 합산하여 산정한다. 이는 조음전환에 어려움이 있거나 조음이동 시간이 오래 걸리는 말소리장애 사례에서 첨가 오류와 평음의 경음화 오류가 빈번하게 나타난다는 선행연구에 근거한 것이다(Ryu & Ha, 2024; Shiriberg et al., 2012). 구체적으로 살펴보면, 음소 첨가는 전체 목표 자음 수에서 첨가된 음소 수의 비율을 백분율로 구한 것이고, 경음화 오류는 전체 목표 평음 수에서 평음을 경음으로 대치한 오류의 비율을 백분율로 산정한 것이다. 예를 들어 /그머/를 [글머] 혹은 [뜨머]로 발음한 경우, 전자는 음소 첨가에, 후자는 경음화 오류에 해당한다. nSRT 항목은 모든 음절에 초성은 존재하고 종성은 없으므로, 음소 첨가는 종성 첨가를 의미한다. 경음 대치는 애초에 발성유형의 대립이 존재하는 목표자음에 한해 측정 가능하므로, 파열음, 파찰음, 마찰음이 자극어에 포함되어 있는 항목에 대해 점수화할 수 있다.

실험절차

본 연구의 모든 절차는 대구대학교 생명윤리위원회 승인(IRB No.1040621-202001-HR-015-02) 후 진행되었다. nSRT 자극어는 전문 아나운서가 방음실에서 녹음하여 각각의 오디오 파일로 제작되었다. 참여자에게 노트북 화면에 주의 집중을 위한 ‘+’표시가 500 ms 동안 나타나고, 500 ms 후 nSRT 항목이 청각적으로 제시되었다. 모든 데이터는 녹음 및 저장되었으며, 정확한 전사를 위해 현장에서 아동의 반응 직후 즉각적으로 1차 전사를 실시하였고, 실험 종료 후 녹음된 발화를 재생하여 들으며 전사 결과를 점검하였다. 자극어는 한 차례만 들려주는 것을 원칙으로 하되, 주변 소음 혹은 아동의 부주의로 인해 제대로 듣지 못한 경우 한 번의 기회를 더 제공하였다.

자료분석 및 통계처리

자료의 통계처리를 위해 SPSS ver. 18.0 (IBM, Armonk, NY, USA)을 사용하였다. 각 연구질문에 대한 자료분석 및 통계처리 방법은 다음과 같다. 먼저, nSRT 세 지표의 타당성 검증을 위해 공인된 평가나 출판된 논문의 과제 또는 검증된 분석방법을 활용하여 공인타당도 분석을 실시하였다. 구체적으로는, 음운부호화 점수는 비단어 변별하기 과제(Lee, 2020) 점수와, 음운기억 점수는 K-WISCIV (Kwak, Oh, & Kim, 2011)의 숫자 따라하기 점수와, 조음전환 점수는 Praat 음성분석 프로그램으로 측정한 조음 실행시간과의 상관성을 비교하였다. 이때 조음실행시간은 비단어의 첫 음소부터 마지막 음소까지 발화하는데 소요된 총 시간을 의미한다. 통계적 분석을 위해 전체 124명 대상 아동의 각 지표별 결과값들에 대해 Pearson 적률 상관관계 분석을 실시하였다.

nSRT의 진단도구로서의 유용성을 검증하기 위해 연령집단 간, 그리고 말소리장애 여부에 따라 nSRT의 지표별 측정치에 차이가 있는지 알아보았다. 첫째, nSRT 세 지표가 일반 아동의 발달적 차이를 반영하는지를 알아보기 위해, 4세, 5세, 6세의 세 연령집단 간 기저결함 지표별 점수 차이를 비교하였다. 둘째, nSRT 세 지표가 말소리장애 여부에 따른 집단 차이를 반영하는지 알아보기 위해, TD, pure SSD, SSD+LD의 세 집단 간 기저결함 지표별 점수 차이를 비교하였다. 이 과정에서 연령 집단 및 세 집단 간 비교 분석에 앞서 Levene의 분산 동질성 검정을 실시하였으며, 등분산 가정이 충족된 경우(p>.05)에 한해 집단 간 차이에 대한 검정을 수행하였다.

통계적 분석을 위해서는 1피험자 간-1피험자 내 혼합분산분석(mixed ANOVA)을 실시하였고, 주효과에 대한 사후분석은 Bonferroni 검정을, 상호작용효과에 대한 사후분석은 Compare syntax 를 입력하여 다중비교분석을 실시하였다.

신뢰도

nSRT 검사를 통한 감별진단에 대해 평가자 간 신뢰도를 산출하였다. 제1평가자는 본 연구자였고, 제2평가자는 병원에서 근무하는 임상 경력 10년 이상의 1급 언어재활사 자격증 소지자였다. 제1평가자는 제2평가자에게 분석에 대한 지침을 설명하였다. 여러 차례의 연습과 논의를 통하여 대상자 2명에 대한 두 평가자 간 일치도가 98% 이상인 것을 확인한 후, 신뢰도 평가를 실시하였다. 전체 아동 125명 중 약 20%에 해당하는 25명 아동의 자료를 무작위로 선정하였다. 신뢰도는 두 평가자 간 분석한 값이 일치한 항목 수와 불일치한 항목 수를 합하여 일치한 항목 수로 나눈 후 100을 곱하여 산출하였다. 평가자 간 신뢰도는 음운부호화 영역 95.2%, 음운기억 영역 97.3% 조음전환 영역 90.8%였다.

연구결과

nSRT의 세 기저결함 지표의 타당성 검증

공인타당도 검증 결과, 음운부호화 점수와 비단어 변별하기 과제 점수 간 상관계수는 .600으로, 두 변인 간 유의한 정적 상관을 보였다(p<.001). 음운기억 점수에서도 숫자 따라하기 점수와의 상관계수가 .589로 유의한 정적 상관을 나타내었고(p<.001), 조음전환 점수에서도 조음 실행시간과의 상관계수가 .595로 유의한 정적 상관이 확인되었다(p<.001).

nSRT의 기저결함 진단도구로서의 유용성 검증

4세, 5세, 6세 연령집단 간 기저결함 지표별 점수 비교

연령집단 간 기저결함 지표별 점수를 비교한 결과, 음운부호화 점수에서는 4세 11.51점, 5세 6.92점, 6세 6.20점으로 나타났다. 음운기억 점수는 4세 6.21점, 5세 1.42점, 6세 0.71점이었으며, 조음전환 점수는 4세 4.05점, 5세 2.66점, 6세 1.99점이었다(Table 2).

Descriptive statistics for scores on each underlying deficit indicator of nSRT by age group

통계적 유의성을 검증한 결과, 연령집단 간 주효과(F(2,60)=11.764, p<.001)와 기저결함별 집단 내 주효과(F(1,60)=80.671, p<.001)가 유의하였다. 또한 집단과 기저결함 간 상호작용효과 역시 통계적으로 유의하였다(F(2,60)=3.467, p<.05). 집단 간 주효과에 대한 사후 분석 결과, 4세와 5세 간, 4세와 6세 간에는 유의한 차이가 있었으나(p<.001), 5세와 6세 간 차이는 유의하지 않았다(p>.05). 집단 내 주효과에 대한 사후분석 결과, 음운부호화, 음운기억, 조음전환 각각의 지표 간 점수 차이가 모두 유의하였다(p<.05). 연령집단과 기저결함 간 상호작용효과에 대한 사후분석 결과, 음운부호화 점수와 음운기억 점수에서는 4세와 5세 간, 4세와 6세 간 유의한 차이가 확인되었으나(p<.05), 5세와 6세 간 차이는 유의하지 않았다(p>.05). 반면, 조음전환 점수에서는 모든 연령집단 간에서 유의한 차이가 확인되지 않았다(p>.05).

TD, pure SSD, SSD+LD 집단 간 기저결함 지표별 점수 비교

세 집단 간 기저결함 지표별 점수를 비교한 결과는 다음과 같다. 먼저 TD 집단은 음운부호화 점수 8.37점, 음운기억 점수 2.94점, 조음전환 점수 2.95점으로 나타나, 음운부호화에서 평균적으로 가장 높은 오류율을 보였다. pure SSD 집단은 음운부호화 점수 11.67점, 음운기억 점수 13.99점, 조음전환 점수 8.15점으로, 음운기억에서 평균적으로 가장 높은 오류율이 확인되었다. 마지막으로 SSD+LD 집단은 음운부호화 점수에서 14.81점, 음운기억 점수에서 29.76점, 조음전환 점수에서 6.83점을 보며, 음운기억에서 가장 두드러진 오류율을 보였다(Table 3).

Descriptive statistics for scores on each underlying deficit indicator of nSRT across TD, pure SSD, and SSD+LD groups

통계적으로 유의한 차이가 있는지 알아본 결과, 집단 간 주효과가 유의하였고(F(2,121)=24.116, p<.001), 기저결함에 따른 집단 내 주효과도 유의하였다(F(1,121)=65.843, p<.001). 또한 집단과 기저결함 간 상호작용효과가 통계적으로 유의하였다(F(2,121)=3.077, p<.05). 집단 간 주효과에 대한 사후분석 결과, TD 집단과 pure SSD 간(p<.001), TD 집단과 SSD+LD 집단 간(p<.001), pure SSD 집단과 SSD+LD 간(p<.05) 차이가 모두 유의하였다. 집단 내 주효과에 대한 사후분석 결과, 음운부호화, 음운기억, 조음전환 각각의 지표 간 점수 차이가 모두 유의하였다(p<.05). 집단과 기저결함 간 상호작용효과에 대한 사후분석 결과, 음운부호화에서는 TD 집단이 pure SSD 집단(p<.01)과 SSD+LD 집단(p<.001)에 비해 유의하게 낮은 점수를 보였다. 그러나 pure SSD 집단과 SSD+LD 집단 간에는 유의한 차이가 없었다(p>.05). 조음전환에서도 TD 집단은 pure SSD 집단(p<.001)과 SSD+LD 집단(p<.05)보다 점수가 유의하게 낮았으나, pure SSD 집단과 SSD+LD 집단 간 유의한 차이는 나타나지 않았다(p>.05). 반면, 음운기억에서는 TD 집단이 pure SSD 집단(p<.001)과 SSD+LD 집단(p<.001)에 비해 유의하게 낮은 점수를 보였을 뿐 아니라, SSD+LD 집단과 pure SSD 집단 간 차이도 유의하였다(p<.01).

종합하면, 음운부호화와 조음전환에서는 두 SSD 집단(pure SSD, SSD+LD)이 TD 집단보다 유의하게 기저결함 점수가 높았으나, 서로 간 차이는 유의하지 않았다. 반면 음운기억에서는 두 SSD 집단(pure SSD, SSD+LD)이 TD 집단보다 유의하게 높은 기저결함 점수를 보였을 뿐 아니라, 서로 간 차이도 유의하여 SSD+LD 집단의 음운기억력이 가장 취약하다는 것을 알 수 있다(Figure 1).

Figure 1.

The scores on nSRT underlying deficit indicators of TD, pure SSD, and SSD+LD groups.

Values are expressed as percentages relative to the maximum score of each indicator.

TD= typically developing group; pure SSD= pure speech sound disorder group; SSD+LD= speech sound disorders with comorbid language disorder group. *p < .05, **p < .01, ***p < .001.

논의 및 결론

본 연구에서는 말소리장애 아동의 기저결함을 음운부호화, 음운기억, 조음전환의 세 영역으로 구분하여 각 영역별 분석방식을 정립하였다. 이후 이러한 분석이 세 영역의 기저결함을 감별하는 데 타당한지 검증하였다. 그 결과, 세 기저결함의 지표 모두에서 공인타당도가 확보되었으며, 더 나아가 연령별 차이와 TD, pure SSD, SSD+LD의 세 집단 간 비교를 통해 nSRT의 임상적 유용성 또한 입증되었다.

먼저, 음운부호화 점수와 비단어 변별 과제 점수와의 유의한 정적 상관은 음운부호화 분석방식의 타당성을 뒷받침하며, 이는 음운부호화가 실제 음소변별에서 핵심적 역할을 수행함을 보여준다. 또한 음운기억 점수와 숫자 따라하기 점수 간 유의한 정적 상관을 보였다. 두 과제 간에는 음소 반복, 순서 바뀜, 생략과 같이 관찰된 오류 양상도 유사하였는데, 이는 단기기억의 용량 한계로 인한 정보 손실과 혼동을 반영하는 것으로 이처럼 두 과제에서 오류 양상이 일관되게 나타났다는 것은 nSRT의 음운기억 분석방식이 언어적 정보를 저장하고 재현하는 능력을 유효하게 측정하는 지표임을 의미한다. 조음전환 점수도 조음실행시간과 유의한 상관을 보였는 데, 특히 SSD 집단에서 비음 첨가와 평음의 경음화 오류를 많이 보이는 아동일수록 음소와 음소 간 쉼 구간이 길었고, 이는 결과적으로 조음실행시간의 연장으로 연결되었다. 이러한 결과는 조음전환 점수가 조음이동의 민첩성을 평가하는 타당한 지표로 기능할 수 있음을 의미한다.

연령별 비교에서는 음운부호화와 음운기억 영역에서 4세 아동이 5세와 6세 아동보다 높은 오류율을 보였으나, 5세와 6세 사이에서는 차이가 나타나지 않았다. 이는 발달 초기에 음운표상과 음운 기억 능력이 급격히 발달하다가 일정 수준 이후 안정화되는 경향을 반영한다. 반면, 조음전환 영역은 연령에 따른 차이가 뚜렷하지 않았는데, 이는 조음운동전환 능력이 비교적 이른 시기에 발달하고 이후에는 연령보다는 개인의 운동계획 및 실행 능력에 의해 더 크게 영향을 받기 때문인 것으로 사료된다. 본 연구에서 조음전환 지표로 제시한 음소 첨가와 평음의 경음화 오류는 TD 집단에서는 거의 나타나지 않았다. 즉, 조음전환 영역에서 오류율이 높게 관찰될 경우 이는 비발달적 양상으로 해석될 수 있다.

집단 간 비교에서는 세 지표 모두에서 pure SSD 집단과 SSD+LD 집단의 오류율이 TD 집단보다 유의하게 높아 두 SSD 집단에서 음운부호화, 음운기억, 조음전환의 결함을 확인할 수 있었다. 나아가 음운기억의 경우 SSD+LD 집단의 오류율이 pure SSD 집단보다도 유의하게 높아 두 집단 간 이질성이 확인되었다는 것이다(Figure 1). 음운기억은 입력된 언어적 정보를 임시로 저장하고 처리하는 핵심 능력으로, 이 영역의 결함은 음운부호화의 정확성을 약화시키고 전반적인 언어발달지연 또는 장애로 이어질 수 있다. 이는 기존 연구(Alloway, Gathercole, & Pikering, 2006; Archibald & Gathercole, 2007)에서도 보고된 바 있으며, 심각한 음운기억 결함이 언어 장애의 주요 예측 요인임을 시사한다.

집단 내 오류 양상을 살펴보면, pure SSD와 SSD+LD 집단은 음운기억, 음운부호화, 조음전환 순으로 오류를 많이 보인 반면, TD 집단은 음운기억과 조음전환에 비해 음운부호화 오류를 상대적으로 많이 보였다(Table 3). 음운부호화 오류는 목표 모음, 비음, 파열음을 다른 모음, 비음, 파열음으로 대치한 경우로, 이들은 모두 조음방법이 어렵지 않은 말소리에 속해 말소리장애 분야에서는 그리 비중 있게 다루어지지 않았던 음소들이다. 그러나 새로운 말소리 정보를 처음 받아들일 때에는 동일 자질 내 다른 음소들과 청지각적 혼란을 야기할 수 있는 음소들이며, 이러한 경향이 TD 아동에서도 나타날 수 있다는 점이 흥미롭다. 그러나 또 한편 친숙한 단어에서는 대부분의 아동들이 이 음소들을 비교적 쉽게 발음을 하는 것으로 미루어 볼 때, 반복적 노출을 통해 이 혼란은 충분히 극복가능한 것임을 짐작할 수 있다. 따라서 음운부호화 또는 청지각적 평가를 위해서는 본 연구에서와 같이 비단어 혹은 친숙하지 않은 단어에서 해당 음소들의 오류가 나타나는지를 주의 깊게 관찰해볼 것을 제안한다.

이상과 같이 살펴보았듯이, 연령 및 집단 비교에서 나타난 유의미한 차이는 nSRT의 오류 분석이 발달적 변화와 더불어 말소리장애 집단 내 이질성을 세밀하게 살펴볼 수 있는 진단방법임을 시사한다. 이는 말소리장애 아동들을 기저결함에 따른 하위 유형들로 분류하고 이를 토대로 맞춤 중재전략을 수립하는 데에 중요한 근거가 될 것이다. 더 나아가 장애를 초래한 기저요인에 대한 분석을 실시함으로써 표면적 산출정확도에 기반하여 장애를 기술하는 것에 그쳤던 기존 평가방식의 한계를 보완할 수 있을 것이다. 다만, 본 연구에서는 연령 또는 세 집단 간 차이를 비교하는 것에 초점을 두었으나, 추후 연구에서는 말소리장애 아동별 기저결함 프로파일을 분석하여 개인별 양상을 비교해볼 필요가 있다. 조음전환에서만 결함을 보이는 아동, 음운기억과 음운부호화에서 결함을 보이는 아동, 세 영역 모두에서 결함을 보이는 아동 등 다양한 경우가 예상되며, 이를 통해 개인별 취약점뿐 아니라 상대적으로 양호한 영역 또한 파악할 수 있을 것이다. 이와 같은 개인 내에서의 강·약점 파악은 중재방향 설정과 중재활동 구성에 의미 있는 정보를 제공할 것이다.

끝으로, 본 연구에서 제안한 분석방법은 오류의 발생 원인이 해당 결함으로밖에 해석할 수 없는 경우에 한해 각 기저결함으로 간주하였기 때문에, 다소 보수적인 측면이 있음을 덧붙인다. 이를 테면 음운부호화 점수는 2음절과 3음절에 대해서만 측정하는 반면, 음운기억 점수는 4음절에 대해서만 분석한다. 만일 4음절에서 비음, 모음 또는 파열음의 오류가 일어난다면, 이것이 음운정보 보유의 과부화(음운기억 결함)로 인한 것인지 아니면 음운정보 입력의 혼란(음운부호화 결함)으로 인한 것인지 판단이 어렵기 때문이다. 즉, nSRT의 기저결함은 복합적 해석이 가능한 경우는 모두 배제하였다는 것을 간과하면 안 되며, 이러한 분석방식이 아동의 기저결함을 과대 혹은 과소평가할 가능성은 없는지에 대해서도 후속연구에서 지속적으로 검증해볼 필요가 있다.

또한, 상향적 접근을 기반에 둔 무의미음절 항목 도출이라는 연구의 타당성을 유지하기 위해 어휘지식을 엄격하게 통제함에 따라 추출된 일음절 수가 다소 제한적이었다. 이러한 제한은 의도한 목표를 위한 필수적인 조치이지만, 제한된 음절의 조합으로 인해 무의미음절 항목에 대한 청지각적 난이도를 고려하지 못하였다는 제한점을 갖는다. 따라서 이에 대한 추가적인 탐구가 필요한 것으로 생각된다.

References

1. Alloway, T. P., Gathercole, S. E., & Pikering, S. J. (2006). Verbal and visuospatial short-term and working memory in children: are they separable. Society for Research in Child Development, 77, (6)1698–1716.
2. American Speech-Language-Hearing Association. (2007). Childhood Apraxia of Speech. Rockville, MD: ASHA.
3. Archibald, L. M. D., & Gathercole, S. E. (2007). The complexities of complex memory span: storage and processing deficits in specific language impairment. Journal of Memory and Language, 57, (2)177–194.
4. Broomfield, J., & Dodd, B. (2004). The nature of referred subtypes of primary speech disability. Child Language Teaching & Therapy, 20, (2)135–151.
5. Campbell, T., Dollaghan, C., Needleman, H., & Janosky, J. (1997). Reducingbias in language assessment: processing-dependent measures. Journal of Speech, Language, & Hearing Research, 40, (3)519–525.
6. Dodd, B. (2005). Differential Diagnosis and Treatment of Children with Speech Disorders, Second Edition. London: Whurr.
7. Dollaghan, C., & Campbell, T. F. (1998). Nonword repetition and child language impairment. Journal of Speech, Language, and Hearing Research, 41, (5)1136–1146.
8. Gathercole, S. E., & Baddeley, A. D. (1990). The role of phonological memory in vocabulary acquisition: a study of young children learning arbitrary names of toys. British Journal of Psychology, 81, (4)449–454.
9. Kim, J. Y., & Ha, J. W. (2024). Pilot study for the development of Korean and English speech processing task system. Phonetics and Speech Sciences, 16, (2)29–36.
10. Kim, J. Y., & Ha, J. W. (2025). Evaluating the diagnostic utility of a nonword repetition task for identifying children with a history of speech sound disorders. Communication Sciences & Disorders, 30, (2)312–321.
11. Kim, Y. T., Hong, G. H., Kim, K. H., Jang, H. S., & Lee, J. Y. (2009). Receptive & Expressive Vocabulary Test (REVT). Seoul, Korea: Seoul Community Rehabilitation Center.
12. Kim, Y. T., Shin, M. J., Kim, S. J., & Ha, J. W. (2020). Urimal Test of Articulation and Phonology2 (UTAP2). Seoul, Korea: Hakjisa.
13. Kwak, K. C., Oh, S. W., & Kim, C. T. (2011). Korean-Wechsler Intelligence Scale for Children-IV (K-WISC-IV). Seoul: Hakjisa.
14. Lee, Y. J. (2020). The effect of top-down processing on speech sound discrimination in children with and without speech sound disorders, (Master’s thesis). Daegu University; Gyeongbuk, Korea.
15. Lim, H. C. (2004). Korean-Raven colored progressive matrices (K-CPM). Seoul: Korean Guidance.
16. Pi, M. K., & Ha, S. H. (2020). Classification of subgroups of children with speech sound disorders: a preliminary study. Communication Sciences & Disorders, 25, (1)113–125.
17. Ryu, E. J., & Ha, J. W. (2024). Meta-analysis of the effectiveness of speech processing analysis methods: focus in phonological encoding, phonological short-term memory, articulation transcoding. Phonetics and Speech Sciences, 16, (3)71–78.
18. Stackhouse, J., & Wells, B. (1997). Children’s speech and literacy difficulties: a psycholinguistic framework. London: Whurr.
19. Shriberg, L. D., & Lohmeier, H. L. (2008). The Syllable Repetition Task. Phonology Project (Tech. Rep. No. 14), Waisman Center, University of Wisconsin- Madison.
20. Shriberg, L. D., Lohmeier, H. L., Campbell, T. F., Dollaghan, C. A., Green, J. R., & Moore, C. A. (2009). A nonword repetition task for speakers with misarticulations: the Syllable Repetition Task (SRT). Journal of Speech, Language, and Hearing Research, 52, 1189–1212.
21. Shriberg, L. D., Lohmeier, H. L., Stand, E. A., & Jakielski, K. J. (2012). Encoding, memory, and transcoding deficits Childhood Apraxia of speech. Clinical Linguistics and Phonetics, 26, (5)445–482.
22. Thal, D. J., Miller, S., Carlson, J., & Vega, M. M. (2005). Nonword repetition and language development in 4-year-old children with and without a history of early language delay. Journal of Speech, Language, & Hearing Research, 48, (6)1481–1495.

Appendix

Appendix 1. Items of the nonsense syllable repetition test (nSRT)

Article information Continued

Figure 1.

The scores on nSRT underlying deficit indicators of TD, pure SSD, and SSD+LD groups.

Values are expressed as percentages relative to the maximum score of each indicator.

TD= typically developing group; pure SSD= pure speech sound disorder group; SSD+LD= speech sound disorders with comorbid language disorder group. *p < .05, **p < .01, ***p < .001.

Table 1.

Characteristics of participants

TD (N = 63) pure SSD (N = 49) SSD+LD (N = 12) F p
Months of age 65.52 (9.44) 64.18 (11.60) 63.25 (11.05) .364 .695
K-CPM 99.23 (6.07) 97.32 (15.82) 93.16 (8.97) 1.584 .209
REVT 66.25 (12.81) 59.42 (15.35) 41 (18.97) 15.829 .000
Total PCC 98.20 (3.63) 80.98 (12.24) 69.58 (21.49) 60.041 .000

Values are presented as mean (SD).

K-CPM Values are presented as standard scores.

REVT values are presented as raw scores.

TD= typically developing group; pure SSD= pure speech sound disorder group; SSD+LD= speech sound disorders with comorbid language disorder group; K-CPM= Korean coloured progressive matrices (Lim, 2004); REVT= Receptive and expressive vocabulary test (Kim et al., 2009); Total PCC= total percent consonants correct.

Table 2.

Descriptive statistics for scores on each underlying deficit indicator of nSRT by age group

4 years (N = 23) 5 years (N = 20) 6 years (N = 20)
Phonological encoding 11.51 (4.46) 6.92 (3.62) 6.20 (3.76)
Phonological memory 6.21 (11.25) 1.42 (4.39) .71 (3.19)
Articulatory transition 4.05 (3.84) 2.66 (3.03) 1.99 (3.54)

Values are presented as mean (SD).

Table 3.

Descriptive statistics for scores on each underlying deficit indicator of nSRT across TD, pure SSD, and SSD+LD groups

TD (N = 63) pure SSD (N = 49) SSD+LD (N = 12)
Phonological encoding 8.37 (4.61) 11.67 (6.64) 14.81 (5.52)
Phonological memory 2.94 (7.76) 13.99 (17.61) 29.76 (27.55)
Articulatory transition 2.95 (3.56) 8.15 (7.99) 6.83 (8.04)

Values are presented as mean (SD).

TD= typically developing group; pure SSD= pure speech sound disorder group; SSD+LD= speech sound disorders with comorbid language disorder group.

문항 2음절 3음절 4음절
1 호저 허즈루 스지므버
2 지그 하러지 머즈래브
3 하므 호브거 하거즈머
4 흐버 므래거 히브지머
5 브루 즈버므 허지버루
6 거르 히저그 거스저므
7 히즈 지스거 흐저브러
8 그머
9 허스