구체적인 단서와 추상적인 단서가 마비말장애 발화의 명료도에 미치는 영향

Speech Intelligibility Improvement with Concrete and Abstract Auditory Cues

Article information

Commun Sci Disord Vol. 28, No. 3, 536-553, September, 2023
Publication date (electronic) : 2023 September 30
doi : https://doi.org/10.12963/csd.23992
Department of Speech-Language Pathology, Wonkwang Digital University, Seoul, Korea
김현승
원광디지털대학교 언어치료학과
Correspondence: Hyun Seung Kim, PhD Department of Speech-Language Pathology, Wonkwang Digital University, 437 Dorimcheon-ro, Yeongdeungpo-gu, Seoul 07448, Korea Tel: +82-70-5227-3560 Fax: +82-2-897-2865 E-mail: kim.hslinda@gmail.com
Received 2023 July 5; Revised 2023 August 25; Accepted 2023 September 2.

Abstract

배경 및 목적

본 연구는 8명의 정상 성인 남성들과 8명의 마비말장애 성인 남성들이 청각적인 단서 환경에 따라 10가지 음향학적인 변수들을 어떻게 변화시키는지 밝히는 것을 목적으로 하였다.

방법

명료도에 영향을 받는 음향학적인 변수들의 분석을 위해 한국어 9가지 파열음이 무의미 이음절 단어 수준에서 산출되었다. 무단서 환경의 지시어로는 “가능한 한 편안한 속도와 크기로 말하세요.”가, 구체단서 지시어로는 “가능한 한 크고 느리게 말하세요.”가, 추상단서 지시어로는 “가능한 한 명료하고 정확하게 말하세요.”가 사용되었다.

결과

연구결과 그룹 간 차이는 단서 없는 환경보다 단서 환경, 특히 추상단서 환경에서 줄어들었다. 단서 환경에 따라, 정상군은 음도나 길이를 조절하는 반면, 마비말장애군은 모음 및 음절 길이나 폐쇄구간 비율을 조절하고, 기식구간 길이는 변경하지 않는 것으로 나타났다.

논의 및 결론

마비말장애군이 단서 없는 환경에서 이미 음도 증가를 명료화 전략의 하나로 사용하고 있다고 추측되었다. 마비말장애군은 단서 환경에 따라 음향학적인 측정치의 길이 변화 외에는 다른 변화를 유의미하게 가지지 못하지만, 추상단서 환경에서 정상군과 차이가 사라지는 결과는 무단서 환경에서 마비말장애군이 이미 명료화 전략을 사용한다는 것과 분절적인 정보, 특히 음향 정보의 상대적인 관계성을 마비말장애군도 유지하려 노력함을 시사하였다. 구체단서와 비교하여 추상단서가 더 자연스러운 발화를 유도할 가능성이 제기되었다.

Trans Abstract

Objectives

The present study investigated several acoustic parameters to determine intelligibility strategies implemented by eight normal healthy individuals (NHI) and eight individuals with dysarthria (IWD) following concrete and abstract auditory speech cues.

Methods

Ten acoustic parameters reportedly sensitive to intelligibility changes were selected and analyzed. Those included fundamental frequency (f0), vowel duration, vowel-consonant-vowel syllable duration, closure duration, aspiration duration, the ratio of closure duration to closure and aspiration combined duration, the 1st & 2nd formant (F1, F2) consonant-to-vowel (C/V) ratio, and the F2 slope. They were compared in three different auditory speech cue conditions: No cue (NC), Concrete cue (CC), and Abstract cue (AC) conditions.

Results

IWD showed higher values in most of the measurements compared to the NHI group. Group differences appeared in seven out of ten measurements in the NC condition. Such group differences only appeared in the closure duration and the closure duration ratio in the CC condition. Group difference disappeared in the AC condition. The results suggested that while NHI manipulated pitch and durational aspects of speech to increase intelligibility, IWD manipulated only the durational aspect in the cue conditions.

Conclusion

The pitch might already be heightened while IWD implement clear speech strategy regardless of the cue condition. The aspiration duration was unaffected by cue or group condition. Participants reduced group differences on the relational measurements (F2 C/V ratio or F2 slope) after cues suggesting that IWD maintained the ability to control relational aspects of speech because they are critical for distinctive stop production. Abstract cues appeared to make IWD’s speech closer to NHI.

마비말장애의 말 특성

마비말장애는 중추신경이나 말초신경의 손상으로 인해 말 산출 관련 호흡, 발성, 조음, 공명, 운율을 조절하는 운동 기관들의 힘, 긴장성, 운동범위, 운동 속도, 안정성, 정확성 등에 문제가 생겨 말운동 관련 근육에 약화, 경직, 불협응, 불수의적인 운동, 근긴장의 이상이 나타나는 말운동장애라고 정의되고, 이로 인해 말 명료도가 저하될 수 있다(Duffy, 2005, 2013, 2020).

말 명료도를 측정하는 방법 중 음향 분석 도구의 유용성

말 명료도(Speech Intelligibility)는 말 산출 영역들(호흡, 발성, 조음, 공명, 운율)이 종합적으로 작용한 결과를 반영한 측정치로써 청자가 화자의 말을 얼마나 알아들을 수 있는지를 측정한 것이다. 말 명료도는 1) 화자의 발화 가운데 청자가 이해할 수 있는 단어의 비율, 2) 산출한 총 단어나 구와 비교하여 청자가 정확하게 전사한 단어나 구의 비율, 3) 발화의 명료한 정도를 리커트 척도를 이용하여 표시(Schiavetti, 1992)하는 것과 같은 방법으로 측정할 수 있다. 그러나 이러한 측정치들은 청자의 청지각에 기반한 주관적인 판단에 의존하기 때문에 그 결과의 신뢰성이 문제가 될 수 있고, 장애의 중증도만 보여주고 조음 기관의 생리학적인 문제를 설명하는데 한계가 있을 수 있다(Kent et al., 1989). 이를 보완할 수 있는 방법으로 보다 객관적인 말 명료도 측정을 위해 음향학적인 분석을 활용할 수 있다.

명료도의 측정은 말운동장애의 영향을 받은 화자의 장애의 특성과 중증도를 파악하는데 유용하다(Yorkston, Beukelman, & Bell, 1988). 말 명료도는 다른 말 산출 결과를 나타내는 측정치들인 조음 정확도(Yoon & Lee, 1998)나 길항반복운동속도(Diadochokinetic rate task, DDK)와도 높은 상관을 보이는 것으로 보고되어 왔다(Platt, Andrews, Young, & Neilson, 1978). 발화의 명료도를 음향학적으로 측정하는 것은 화자가 보여주는 말 명료도의 변화에 대한 통찰력을 제공해주므로(Goberman & Elmer, 2005), 본 연구는 별도의 청지각적인 말 명료도의 평가 없이 정상인과 마비말장애 화자의 말 명료도를 음향학적으로 측정하여 두 그룹 간 음향학적인 측정치의 유사성을 비교하며 말 명료도를 평가하기로 하였다.

명료한 발화의 음향학적인 특성

발화를 명료하게 산출하는 것은 지각 문제가 있는 청자나 발화가 명료하지 않은 말장애가 있는 화자에게 중요한 관심사이다. 많은 연구자들이 명료한 발화가 일반적인 대화체 발화와 어떠한 음향학적인 차이를 보이는지와 어떠한 발화 환경이 말을 더 명료하게 만드는지에 대해 연구해 왔다.

이러한 연구의 배경을 살펴보면, Picheny, Durlach와 Braida (1985)Uchanski 등(1996)은 청각장애가 있는 청자들에게 효과적으로 전달 가능한 명료한 발화의 특성을 연구하였다. 이러한 연구자들은 사람들이 평소 대화할 때는 특별히 명료도에 주의를 기울이지 않고 의사소통 하므로, 이처럼 명료도에 주의를 기울이지 않고 산출된 일상적인 대화 속의 발화를 ‘대화체 발화’로 규정하고, 명료한 발화의 대조 환경으로 종종 활용하였다. 반면, 소음 속에서 말하거나 청각장애인에게 말하는 것과 같이 청자에게 의미 전달이 어려운 경우 화자는 발화를 더 명료하게 산출하려고 노력하게 되는데, 이렇게 명료도를 향상시키기 위해 노력하면서 산출된 발화를 ‘명료한 발화’라고 명명하였다(Picheny et al., 1985; Uchanski et al., 1996).

명료한 발화의 음향학적인 특징에 대해 살펴본 이러한 연구자들은 대화체 발화에서보다 명료한 발화에서 휴지 구간이 더 길어지고 발화 속도가 더 느려졌다고 보고하였다(Bradlow et al., 2003; Picheny et al., 1986; Uchanski et al., 1996). 반면, Krause와 Braida (2002)는 그들의 연구에서 대상자들이 빠른 말속도 환경에서도 발화의 명료도를 유지할 수 있었다고 보고하였다. 이로써, 명료한 발화를 위해 느린 말속도가 결정적인 요인은 아닐 수 있다는 의문이 제기되었으나, Krause와 Braida (2002)의 발견이 훈련된 화자에게서 얻은 결과였고, 빠른 말속도 환경 내에서도 발화의 명료도 증진을 위해서는 여전히 상대적으로 말속도를 감소시켰다는 것 때문에, 명료도 증진과 말속도 감소의 관계성은 아직 제기되고 있으며, 계속 연구가 필요하다(Krause & Braida, 2002; Uchanski et al., 1996). 이와 유사하게 Moon과 Lindblom (1994)은 명료한 발화에서 더 긴 모음 길이를 관찰하였으나, 발화가 명료할수록 제2 포먼트 전이 속도가 빨라지고, 모음 길이에 대한 의존성이 줄어들었다고 보고하면서 명료도가 모음 길이 외 조음 기관의 강직성(stiffness)이나 제2 포먼트 전이 속도, 힘과 같은 다른 요소들의 영향도 받는다고 제안하였다.

한편, 장시간 스펙트럼과 명료도 변화 간의 관계를 측정한 말 명료도 인덱스(Speech intelligibility index, SII)에 관한 연구는 1,000 Hz에서 3,150 Hz 사이의 spectral energy의 증가를 보고하였고, 이것이 큰 정도는 아니지만 명료도 향상에 어느 정도 기여한다고 보았다(Krause & Braida, 2002; 2004). 또한 열악한 듣기 환경에서의 진폭 포락선 변조(modulations)의 정도를 측정한 말 전달 인덱스(Speech transmission index, STI) 값이 명료도와 강한 상관을 보인다고도 보고되었다(Houtgast & Steeneken, 1985; Krause & Braida, 2004). Bradlow 등(2003)Moon과 Lindblom (1994)도 명료한 발화에서의 강도 증가를 보고하였다.

그 외에도 명료한 발화에서 기본주파수의 상승 및 기본주파수 범위의 증가(Bradlow et al., 2003; Goberman & Elmer, 2005; Picheny et al., 1986; Summers, Pisoni, Bernacki, Pedlow, & Stokes, 1988), 자음 강도의 증가(Bradlow et al., 2003; Picheny et al., 1986; Krause & Braida, 2002)와 자음-모음 강도 비율의 증가(Picheny et al., 1986), 어말 종성에서 더 보존된 개방 파열(Stop bursts) (Bradlow et al., 2003; Picheny et al., 1986), 모음 길이 및 모음 공간(Vowel Space)의 증가(Bradlow et al., 2003; Ferguson & Kewley-Port, 2007; Kim & Choi, 2017; Kim, Kent, & Weismer, 2011; Smiljanic & Bradlow, 2009; Tjaden, Lam, & Wilding, 2013; Tjaden & Wilding, 2004; Weismer, Jeng, Laures, Kent, & Kent, 2001), 목표한 포먼트 주파수에 더 잘 도달(Moon & Lindblom, 1994; Picheny et al., 1986; Smiljanic & Bradlow, 2009), 모음 포먼트 변화의 증가(Ferguson & Kewley-Port, 2007; Smiljanic & Bradlow, 2009; Summers et al., 1988), 모음 범주 간 포먼트 주파수 차이의 증가(Bradlow et al. 2003; Ferguson & Kewley-Port 2002, 2007; Smiljanic & Bradlow, 2009), 제2 포먼트 전이 경사의 증가(Moon & Lindblom, 1994) 등을 보고하였다. 성대 진동 개시 시간(Voice Onset Time, VOT)에 대한 결과는 이분법적이었는데, 무성 파열음에서 명료한 발화의 VOT가 더 증가한 반면, 유성 파열음에서는 VOT가 명료도의 영향을 받지 않았다는 보고가 있었다(Krause & Braida, 2004; Summerfield, 1981). 또한 일부 실조형 마비말장애 화자들에서 파열음의 유무성성에 따른 변별적인 VOT 산출의 어려움이 보고되기도 하였고(Ackermann & Hertrich, 1997), 문장보다 단음절 수준에서 마비말장애의 특성에 따른 VOT가 더 민감하게 변화한다는 보고가 있었다(Ackermann, Gräber, Hertrich, & Daum, 1999).

Goberman과 Elmer (2005)는 파킨슨 병 화자의 발화 특성을 연구한 후 대다수의 화자가 명료한 발화 산출 시 쉼의 횟수를 증가시키지 않고 더 느린 발화를 산출하였다고 보고하였다. 대부분의 화자가 대부분의 말 자료에서 평균 기본주파수(f0)와 그 변이성을 증가시켰다. 명료한 발화에서 전반적인 모음 공간을 증가시킨 것이 통계적으로 유의미한 정도는 아니었지만, 12명 중 7명이 더 큰 모음 공간 값을 보여서 대화체 발화에서보다 명료한 발화에서 모음 범주별 구분이 더 명확해졌다는 것을 알 수 있었다. 발화 유형(대화체 vs. 명료한 발화)에 따른 효과가 그 크기는 더 작았지만 파킨슨병 화자의 경우에도 뇌손상 없는 정상인과 같은 방향의 변화를 보였다. 즉, 파킨슨병 화자들도 명료하게 말하라는 지시에 운율 감소나 모음 중앙화를 어느 정도 보완할 수 있었다. 따라서, 명료한 발화의 유도는 파킨슨병 화자의 명료도 증진을 위한 치료 전략으로 적절해 보인다고 보고하였다.

구체단서와 추상단서의 선정 배경

그렇다면 마비말장애 군에게서 명료한 발화의 유도를 위해 어떠한 지시가 적절한지 살펴볼 필요가 있다. 명료한 발화와 대화체 발화의 특성을 연구한 음향학적인 연구들에서 더 명료한 발화를 유도하기 위해 어떤 지시를 사용했는지 살펴보는 것은 이러한 지시나 말의 단서에 대한 통찰력을 제공해 준다. 우선, 명료한 발화와 대화체 발화의 특성을 연구한 음향학적인 연구들은 명료한 발화와 대화체의 발화를 유도하기 위해 다음과 같은 지시를 사용하였다: “가능한 명료하고 정확하게 말하세요.” 또는 “가능한 대화할 때처럼 편하게 말하세요.” 더 자세하게는 연구마다 사용한 지시가 다양해서 명료한 발화를 유도하는 환경에서는 청각 장애인 청자를 가정하거나(Bradlow et al., 2003, p. 85; Ferguson, 2004, p. 2366; Goberman & Elmer, 2005, p. 219; Picheny et al., 1985, p. 97), 소음 속 환경에서 말하는 것을 가정하거나(Picheny et al., 1985, p. 97), 다른 언어적 배경에서 온 외국인에게 말하듯이(Bradlow et al., 2003, p. 85), 가능한 한 더 명료하고 정확하게 말하라는 요구를 하였다. 반면, 대화체의 발화를 유도하는 환경에서는 친숙한 사람이 듣고 있다고 가정하거나 발화의 명료성(Clarity)에는 신경 쓰지 말고 보통의 말 속도로 인쇄된 문장들을 읽도록 요구하거나(Bradlow et al., 2003, p. 85), 가능한 한 평소 대화하듯이 자료를 소리 내어 읽어달라(Picheny et al., 1985, p. 97; Ferguson, 2004, p. 2366)고 지시를 내렸다.

화자들은 더 명료하게 말하라는 지시에 따라 소음이 있는 환경에서 말하거나, 마스크를 쓰고 말하는 것과 같이 듣기에 불리한 환경에서 말하거나, 특별한 훈련 없이 말을 할 때도 자연스럽게 더 명료한 발화를 산출할 수 있었다고 보고되었다(Bradlow et al., 2003; Knowles & Badh, 2022; Smiljanić & Bradlow, 2009). 때로는 공식적인 말 산출 훈련이 없이도 지각 확인 훈련만으로도 말 산출 수행력이 향상되는 것도 밝혀졌다(Bradlow, Akahane-Yamada, Pisoni, & Tohkura, 1999; Bradlow, Pisoni, Akahane-Yamada, & Tohkura, 1997). 따라서 연구 참가자들은 발화를 더 명료하게 만들기 위해 각자가 나름의 전략을 가지고 있음을 시사하였다(Ferguson & Kewley-Port, 2007).

이처럼 발화를 명료하게 만드는 능력은 정상인에게만 국한된 것은 아니었다. 위에서도 언급하였듯이 Goberman과 Elmer (2005)는 “마치 제가 잘 못 듣거나 못 알아듣는 것처럼 가능한 한 명료하게 말하세요.”라는 지시를 마비말장애 환자에게 내렸고 이 지시가 명료도 증진을 유도할 수 있는지 연구하였다. 그 결과, 파킨슨병 환자들이 명료한 발화를 요구하는 지시를 듣자마자 기본주파수, 기본주파수 변화량, 말속도와 같은 음향학적인 변수들 5개 중 3개를 의미 있게 증가시키는 것을 관찰하였다. 이러한 음향학적인 특성들은 정상 화자에서도 명료한 발화의 특성으로 알려진 것들이다. 이처럼 마비말장애가 있어도 말 명료도 증진을 위해 사용하는 전략이 정상인들과 다르지 않을 수 있으므로, 본 연구는 마비말장애군과 정상군이 활용하는 명료화 전략의 차이를 비교하고자 하였다.

명료한 발화 산출을 이끌어내는 원리에 대한 연구들은 지시나 환경에 따라서 발화의 결과가 달라진다고 보고하였다(Lam et al., 2012; Smiljanić & Bradlow, 2010; Uchanski, 2005). 즉, 원어민 또는 비원어민에게 말하기, 아동, 성인, 또는 컴퓨터에게 말하기, 조용한 환경 또는 소음 환경에서 말하기, 다른 지시에 따라 말하기 등 발화 환경에 따라 다른 음향학적인-음성적인 변화가 있다고 보고하였다(Lam et al., 2012; Uther et al., 2007; Wassink et al., 2007). 따라서 발화의 결과물에 영향을 줄 수 있는 지시문이 어떻게 명료한 발화 산출에 영향을 주는지 밝히는 것이 중요하다(Smiljanić & Bradlow, 2009; Uchanski, 2005).

앞서 말한 대화체 발화와 명료한 발화를 비교한 연구들에서는 명료한 발화를 유도하기 위해 발화의 어떠한 측면을 어떠한 방식으로 변화시켜야 한다고 특정하지 않고 “가능한 한 명료하게 말하세요.”와 같이 다소 추상적인 지시만을 활용하였다(Smiljanić & Bradlow, 2009). 이러한 추상적인 지시는 개인마다 다른 명료화 전략을 사용하도록 자율성을 허용하면서 명료한 발화를 유도한다. 위의 지시사항들은 명료도 증진을 위한 추상적인 청각 단서들로써 그 지시문의 자연스러운 결과로 종종 느린 말속도와 더 큰 말소리를 얻게 된다(Krause & Braida, 2002; Uchanski et al., 1996). Rosenthal 등(2014)은 명료하게 말하라고 요구받거나 열악한 듣기 환경에서 말할 때 화자의 음성적인 노력이 증진되었고, 공기역학과 음향학적인 부분에서 모두 변화가 관찰되었다고 보고하였다. 이러한 발견은 자연스럽게 산출한 명료한 발화가 단순히 소리 크기를 키우거나 말속도를 느리게 하는 전략의 결합 이상일 수 있음을 제안한다.

한편, 임상에서는 일반적으로 마비말장애 환자 치료에 명료한 발화의 특징이라고 알려진 특성들을 유도하는 더 구체적인 지시를 활용하는 편이다. 가령 “더 크게 말하라,” “더 느리게 말하라,” “입을 더 크게 벌리고 말하라” 등이 그러한 예이다. 따라서, 이러한 구체적인 지시가 명료도에 가져오는 효과에 대한 연구가 활발하게 진행되어 왔다(Tjaden & Wilding, 2004; Turner et al., 1995). 조음 속도의 감소는 오랫동안 마비말장애의 행동 치료 기법 중의 하나였다(Tjaden & Wilding, 2004). 또한 Lee Silverman Voice Treatment (LSVT)라는 치료 프로그램은 발화의 호흡 및 발성 지지를 증진시키기 위해 활용되어 왔고, 궁극적으로 이런 노력이 말 명료도 증진에 기여하는 것으로 보고되어 왔다(Spielman et al., 2007). 이러한 치료 접근법의 공통점은 마비말장애의 중요한 치료 전략의 하나로 말소리를 크기나 말속도, 조음 동작 등에 대해 구체적인 지시를 준다는 것이다.

마비말장애에게 제시하는 구체적인 단서의 효과를 살펴본 선행 연구로, Tjaden과 Wilding (2004)은 파킨슨 병 화자의 명료도가 단서 없는 환경, 느리게 말하는 환경보다 크게 말하는 환경에서 더 향상되었지만, 이들 화자의 말 명료도가 성문상 조음 행동의 결과로 나타나는 음향학적인 변화와 강한 상관이 있지는 않았다고 보고하였다. 또한 Uchanski 등(1996)은 청각장애가 있는 청자에게 제시하는 말 신호의 시간적인 측면과 자음과 후행 모음 사이의 강도라는 측면의 신호를 디지털하게 조작한 결과, 말 명료도는 증진되었지만, 그 증진의 정도가 자연스럽게 산출된 명료한 발화만큼 크지 않았다고 보고하였다.

지금까지 살펴본 것과 같이 명료한 발화를 연구한 선행 연구들이 명료한 발화를 유도하기 위해서는 “가능한 한 더 명료하고 정확하게 말하세요(Speak as clearly and precisely as possible).”와 같은 추상적인 지시를 활용하였고, Goberman과 Elmer (2005)는 이러한 지시를 파킨슨 환자에게 적용하기도 하였다. 이러한 추상적 지시는 화자 스스로가 명료한 발화를 산출하기 위해 어떠한 전략을 사용하는지 알려준다. 반면 “가능한 한 더 크고 느리게 말하세요(Speak as loudly and slowly as possible).”와 같은 구체적인 단서는 임상가가 마비말장애 대상자의 말 중재에서 자주 사용하는 지시어로서, 대상자의 말 명료도에 기여할 것으로 사료되는 요소들의 변화를 구체적으로 요구한다. 그러므로 본 연구는 “가능한 한 더 명료하고 정확하게 말하세요.”와 같은 추상적인 단서와 “가능한 한 더 크고 느리게 말하세요.”와 같은 구체적인 단서를 마비말장애 환자에게 적용하여 얻을 수 있는 명료화의 효과를 비교하고자 하였다. 또한 말 산출에 대한 별다른 요구를 하지 않는 “가능한 한 편안한 속도와 크기로 말하세요(Speak at your comfortable rate and loudness).”와 같은 무단서 환경을 추가하여 이 환경이 대조군 역할을 하게 하였다. 단서 전 두 대상군(정상군과 마비말장애군)의 명료도 차이를 음향학적인 변수를 이용하여 측정한 후, 추상적인 단서를 제공한 후 정상군과 마비말장애군이 스스로 변화시킬 수 있는 명료화의 범위와 구체적인 단서를 제공한 후 구체적인 중재 지시에 따라 변화시킬 수 있는 명료화의 범위를 비교하였다. 단서의 효과는 마비말장애군과 정상 대조군이 무의미 이음절 단어를 산출하는 동안 명료도에 민감하게 반응하는 지표로 알려진 음향학적인 측정치들을 통해 측정하였다. 여기에는 기본주파수(Fundamental frequency, f0), 모음 길이, ‘모음-자음-모음(VCV)’ 음절 길이, 폐쇄구간(Closure duration), 기식구간(Aspiration duration), 폐쇄구간 대 폐쇄구간과 기식구간 길이의 합의 비율(The ratio of closure duration to closure and aspiration combined durations), 제1포먼트와 제2 포먼트 자음-모음 비율, 제2 포먼트 전이 경사와 같은 10가지 변수들이 포함되었다. 본 연구의 연구문제는 다음과 같다.

1. 정상군과 마비말장애 환자군은 세 가지 단서 환경(무단서, 추상적인 단서, 구체적인 단서)에서 무의미 이음절 단어를 산출하는 동안 음향학적인 측정치들에서 유의미한 차이를 보이는가?

2. 각각의 대상군은 이러한 음향학적인 측정치들을 세 가지 단서 환경에 따라 유의미하게 변화시키는가?

연구방법

연구대상

본 연구의 대상은 마비말장애 증상을 보이는 8명의 남성 성인들(평균 연령 41;8)이다. 연구에 참여할 당시 모두 뇌졸중이나 외상성 뇌손상 이후 마비말장애 진단을 받고 서울 경기 지역 병원에서 관련 언어치료를 받고 있었으며, 담당 언어치료사의 보고를 참고로 말 실행증 증상을 보이지 않는 이들로 제한하였다. 모든 마비말장애 대상자들은 발병 이후 적어도 3개월의 시간이 경과한 상태였다. 이들 가운데 일부는 실어증을 동반하고 있었으나, 실험에 참석할 수 있는 대상을 경도 이하의 실어증 환자들로만 국한하여, 말 과제를 위해 지시가 주어졌을 때 이해가 어렵거나 말 산출에 영향을 줄 정도의 중증도는 아니었다. 한국판 웨스턴 실어증 검사(The Korean version of Western Aphasia Battery, K-WAB) 결과 실어증 지수가 60 이상이거나 한국판 미네소타 실어증 검사(the Korean version of the Minnesota Test for Differential Diagnosis of Aphasia, K-MTDDA) 결과 중증도가 70 이상인 대상자들만 실험에 참여하였다.

대조군에 해당하는 이들은 마비말장애군과 나이 및 성별을 일치시킨 8명의 정상 성인 남성들(평균 연령 41;1)로서 적어도 고졸 이상의 학력을 가진 이들이었다. 모든 참여자가 연구에 참여할 당시 신경학적인 질환을 경험한 병력이 없다고 보고하였고, 일상생활 의사소통에 문제가 없는 이들이었다. 연구에 참여한 모든 이들은 대한민국 서울 및 경기 지역에 거주하는 한국어가 모국어인 사람들이었다.

본 연구 참여자에 대한 정보는 Table 1에 제시하였다. 본 연구에서는 마비말장애군 참여자들을 마비말장애 유형별로 분류하지 않았는데, 그 근거는 다음과 같다. Duffy (2005, 2013, 2020)는 1980년대 이후 Mayo Clinic에서 시행한 수천 건의 말운동장애 평가 후 두 가지 이상의 마비말장애 유형이 혼합된 혼합형 마비말장애 유형을 전체 말운동장애의 24.8-28%로 보고하였고, 마비말장애 유형 결정이 어려운 경우를 3-4% 정도로 보고하였다. 이처럼 혼합형 마비말장애는 다른 어떤 단일한 유형의 마비말장애 보다 더 높은 비중으로 보고되었다(Duffy, 2005, 2020). 혼합형 마비말장애와 그 유형을 결정하기 어려운 마비말장애 환자가 전체 말운동장애 인구의 1/3에 육박한다는 사실은 청지각적인 판단을 통한 마비말장애 유형 분류가 그만큼 어렵다는 것을 의미한다. 또한 마비말장애군 안에서도 말 특성의 측면에서 다양성과 유사성(Homogeneity)이 함께 관찰된다(Kim et al., 2011). 즉, 운동저하형 마비말장애의 말속도에 대해 느리다고 보고하기도 하고 빠르다고 보고하기도 하고(Duffy, 2005, 2013, 2020), 말 특성 가운데에는 부정확한 자음과 같이 거의 모든 유형의 마비말장애에서 나타나는 특성도 있다. 따라서, Mayo Clinic에서 제안하는 말운동장애 유형 분류 방법에 대해 회의적인 시각도 있다(Kim et al., 2011). Kim 등(2011)은 Mayo Clinic에서 제안한 방법으로 마비말장애 유형을 분류하는 것이 마비말장애의 중증도나 병인, 음향학적인 측정치에 기반하여 마비말장애를 분류하는 것보다 더 나은 방법이라는 근거는 미비하다고 지적하였다. 이러한 이유로 본 연구에서는 데이터 수집에 앞서서 마비말장애의 세부 유형 분류를 하지 않았다.

Participant’s demographic information

연구절차

연구 참여자들은 두 개의 /아/ 모음 사이에 9개의 한국어 파열음 /ㅂ, ㅃ, ㅍ, ㄷ, ㄸ, ㅌ, ㄱ, ㄲ, ㅋ/([p, p*, ph, t, t*, th, k, k*, kh])이 포함된 무의미 이음절 목표 단어들을 산출하였다. 의미 단어를 선정하려는 의도는 없었으나, /아파/, /아빠/, /아가/는 한국어에서 “아프다,” “아버지,” “아기”라는 의미를 지니고 있다. 스펙트로그램상 폐쇄구간의 용이한 측정을 위해 목표 파열음들이 단어의 어중초성 위치에 놓였다. 파열음들은 각 조음 위치에서 세 쌍의 발성 방법을 가지고 있으며, 발성 방법의 구분을 위해 폐쇄구간과 기식구간의 측정이 필요하다. 16명의 연구 대상자들 각각이 세 가지 말 명료도 단서 환경(단서 없음, 구체단서, 추상단서)에서 아홉 개의 목표 단어(/아바, 아빠, 아파, 아다, 아따, 아타, 아가, 아까, 아카/)를 세 번씩 산출하여 총 1,296개의 발화가 연구 자료로 수집되었다. 9가지 파열음은 /아바/ → /아빠/ → /아파/ → /아다/ → /아따/ → /아타/ → /아가/ → /아까/ → /아카/의 순서로 세 번 반복하여 제시되었으며, 모든 참여 자가 같은 순서로 제공되는 자극어 목록을 소리 내어 읽었다.

무단서 환경에서는 “가능한 한 편안한 속도와 크기로 말하세요(Speak at your comfortable rate and loudness).”라는 지시문을 제공하였다. 구체단서 환경에서는 “가능한 한 더 크고 느리게 말하세요(Speak as loudly and slowly as possible).”라는 지시문을 제공하였다. 추상단서 환경에서는 “가능한 한 더 명료하고 정확하게 말하세요(Speak as clearly and precisely as possible).”라는 지시문을 제공하였다. 대상자들은 각각의 단서 환경에서 실험에 참여하기 전에 관련 단서를 지시문의 형태로 한번 들었으며, 기억을 상기시켜주기 위해 제공되는 같은 단서의 지시문을 실험 중에 두 번 정도 더 들었다. 연구 자료 수집은 언제나 무단서 환경에서 시작되었고, 참여자 가운데 절반은 구체단서 환경을 먼저, 나머지 절반은 추상단서 환경을 먼저 경험하였다. 단서 환경이 제공된 순서는 Table 2에 제시되어 있다.

Order of cue presentation

모든 발화 자료들은 조용한 환경에서 SONY ECM-MS907 마이크를 통해 수집되었고 SONY MZ-R91 미니디스크 녹음기를 이용하여 디지털 녹음되었다. 녹음 시 마이크와 입술 사이 거리를 10-15 cm로 일정하게 유지하였다. 녹음된 발화 자료들은 Multi-Speech model 3,700이라는 프로그램으로 44,100 Hz 표본화 속도로 2개의 입력 단자가 있는 Sound Blaster 사운드 카드를 통해 음성 파일(Phonetic file)로 변환되었다. 기본주파수(Fundamental frequency, f0), 모음 길이(Vowel duration), ‘모음-자음-모음’ 음절 길이(VCV syllable duration), 폐쇄구간(Closure duration), 기식구간(Aspiration duration), 폐쇄구간 대 폐쇄구간과 기식구간 길이의 합의 비율(The ratio of closure duration to closure and aspiration combined durations), 제1 포먼트와 제2 포먼트 자음-모음 비율(F1, F2 C/V ratio), 제2 포먼트 전이 경사(F2 slope)라는 모든 음향 측정치들은 Praat v. 6. 2. 18 (Paul & David, 2022, praat.org)을 통해 측정되었다.

자료분석(Data analysis)

본 연구는 별도의 생명 윤리 위원회(Institutional Review Board, IRB)의 심사를 거치지 않았다. 본 연구의 자료는 과거 저자가 학위 논문의 일환으로 수집한 것으로, 자료가 수집되었을 당시 인간을 대상으로 하는 논문 자료 수집을 위해 생명 윤리 위원회의 심사를 까다롭게 요구하지 않았다. 연구자는 병원 임상가들을 통해 대상자를 소개받았고, 대상자들에게 자료를 수집하기 전에 연구에 대한 설명을 제공한 후 구어로 동의를 얻었다. 본 연구는 불편이 발생하는 정도가 일상 생활에서 발생할 수 있는 수준보다 높지 않은 최소 위해(Minimal risk) 연구이며, 저자와 지도 교수 외 자료에 접근한 사람은 없었다. 자료의 보관 측면에서 개인 정보 보호에 위해한 일은 발생하지 않았다. 미국에서는 최소 위해(Minimal risk) 연구의 경우 IRB 제출 시 초기 신속 심의(Exempt study) 대상이 되고, 2019년 이후로는 개정된 공통 규칙(Final Common Rule Revision)에 따라 지속 심의(Continuing review)도 면제한다(Choi, 2020). 국내 IRB 규정에서는 최소 위해 연구에 대한 특별한 면제 규정은 없으나(Choi, 2020), 본 연구가 별도의 IRB의 심사를 거치지 않은 부분에 대한 이해의 근거로 외국에서 최소 위해 연구를 느슨하게 심의한다는 부분은 참고해 볼 수 있을 것이다.

통계 분석에서 3번 산출한 각 파열음의 평균값을 구하여 데이터로 활용하였다. 즉, 각 단서 환경에서 각 연구 참여자는 각각의 파열음을 3번씩 산출하였는데, 이 결과물에서 10개의 종속변수들을 측정하고, 3번씩 측정된 종속변수의 평균을 구하여 각 단서 환경에서 각 대상자가 산출한 파열음의 종속변수 자료들로 활용하였다. 각 종속변수의 정규성을 검토하는 Shapiro-Wilk Test를 시행한 결과 정규성 가설을 만족하는 종속변수가 정상군이 구체단서 환경에서 산출한 모음 길이(p=.103) 외에는 없었다. 따라서, 그룹 간 비교를 위해 Mann Whitney-U 비모수 검정과 집단 내 단서 효과 비교를 위해 Friedman 비모수 검정을 사용하였다. 독립 변수로는 단서 환경(단서 없음, 구체단서, 추상단서)과 그룹(마비말장애군, 정상군)이 사용되었다. 종속변수로는 기본주파수(Fundamental frequency, f0), 모음 길이(Vowel duration), ‘모음-자음-모음’ 음절 길이(VCV syllable duration), 폐쇄구간(Closure duration), 기식구간(Aspiration duration), 폐쇄구간 길이 비율(폐쇄구간 대 폐쇄구간과 기식구간 길이의 합의 비율, the ratio of closure duration to closure and aspiration combined duration), 제1 포먼트와 제2 포먼트의 자음-모음 비율(F1, F2 C/V ratio) 및 F2 전이 경사(F2 slope) 측정치들을 사용하였다. 세 가지 단서 환경 간 차이가 있을 때 그 차이가 어디에서 오는지 보기 위한 사후 검정 시 다중 비교에서 오는 오류를 줄이기 위해 α값을 .0167 (= 0.05/3)로 본페로니 조정(Bonferroni adjustment)을 하였으며, Wilcoxon 비모수 검정을 하였다. 기술통계량의 결과를 보고할 때는 비모수 검정을 하였기 때문에 평균과 표준편차 대신 중앙값(Median)과 사분위간 범위(Inter Quartile Range, 이하 IQR)를 보고하였다(Pappas & DePuy, 2004).

다음은 음향학적인 측정치들의 선정 배경에 대한 설명이다.

본 연구에서 변수로 선정한 열 가지 음향학적인 측정치들은 서론에서 명료도 변화에 따라 민감하게 변화한다고 제안한 음향학적인 측정치들 가운데 선정되었다. 그중에서 선행 연구의 연구자들(Krause & Braida, 2004; Picheny et al., 1986)은 기본주파수, 말속도, 장기 RMS 스펙트라를 명료한 발화의 전반적인 말 특성(Global phenomena/measurements)을 보여주는 측정치들로 규정하였다. 반면, 모음 길이나 말소리의 길이, 단기 RMS 스펙트라, 포먼트 주파수들, 폐쇄구간과 개방 파열 소음, 기식 구간이 합쳐진 파열음의 길이(Plosive duration) (Picheny et al., 1986) 또는 VOT (Krause & Braida, 2004) 등은 명료한 발화의 음성학적인 변화(Phonetic phenomena/measurements)를 보여주는 측정치들로 제안하였다.

이러한 제안에 따라, 본 연구에서도 우리말 ‘모음-자음-모음’ 무의미 이음절 단어에서 명료도 평가를 위해 측정할 수 있는 열 가지 변수들 가운데 기본주파수와 모음 길이, 음절 길이는 음도 및 발화 속도와 같은 전반적인(어떤 면에서는 초분절적인) 발화 특성에 민감하게 반응하는 변수들로 선정하였다. 반면, 폐쇄구간, 기식구간, 폐쇄구간 길이 비율, 제1 포먼트와 제2 포먼트의 자음-모음 비율, 제2 포먼트(F2) 전이 경사와 같은 측정치들은 분절음의 음성학적인 특성을 반영하는 측정치들로 명료도 변화에 민감하게 반응할 것(Krause & Braida, 2004; Picheny et al., 1986)으로 기대하여 선정하였다. 각각의 음향학적인 측정치들은 다음 기준을 따라 측정되었다.

기본주파수(Fundamental frequency, f0)

한 개인의 음도를 결정하는 측정치로서 주기적인 파형에서 초당 반복되는 주기가 나타나는 횟수를 의미한다. 명료한 발화에서 기본주파수나 기본주파수의 범위가 증가하였다는 보고가 있었으므로(Bradlow et al., 2003; Picheny et al., 1986), 기본주파수가 단서의 효과에 따라 민감하게 변화할 것으로 기대되어 측정되었다. 기본주파수는 복합음을 구성하는 주파수들 가운데 가장 낮은 주파수이며, 스펙트럼에 나타나는 배음 시리즈 가운데 첫 번째 배음으로도 알려져 있다(Raphael et al., 2011). 기본주파수는 선행 모음 구간(The first vowel fundamental frequency, f0)과 전체 음절 구간(Total syllable fundamental frequency, f0)에서 두 번 측정되었다.

모음 길이(Vowel duration)

파열음에 선행 및 후행하는 /a/모음 지속 시간의 합을 의미한다. 모음은 문맥의 영향을 받아서 무성 파열음 주변에서보다 유성 파열음 주변에서 길이가 길어진다(Allen & Miller, 1999; Krause & Braida, 2004; Summerfield, 1981). 그런데 우리말 파열음은 모두 무성음으로 알려져 있으므로(Sin & Cha, 2003) 파열음 주변의 모음은 길이가 짧을 것을 기대하기 쉽다. 그러나 무성 평파열음도 모음 사이 문맥에서는 유성음화 되어 주변 모음의 길이가 길어질 수 있다(Ji, 1993; Kim, 1965; Sin, 1997).

음절 길이(VCV syllable duration)

선행하는 /a/모음, 파열음, 후행하는 /a/모음의 지속 시간의 합을 의미한다.

마비말장애군은 성문 상하 조음 기관의 협응 및 조절의 어려움으로 인해 무성음으로 실현되어야 할 파열음을 유성음화 하거나 발성 유형을 혼동하여 산출할 수도 있기 때문에, 모음 및 음절 길이는 말속도라는 초분절적인 특성만 반영하지 않고, 조음 기관의 협응 및 운동 조절 능력까지 반영하며 분절적인 특성도 보여줄 수 있는 측정치로 보았다.

폐쇄구간(Closure duration)

선행 모음 이후 갑작스러운 성도의 개방으로 인해 발생하는 개방 파열(Stop burst)이나 기식성의 시작 전까지의 구간을 측정하였다. 우리 나라 파열음은 폐쇄구간 중 특별히 유성성이 관찰되지 않는 편이나(Sin & Cha, 2003), 폐쇄구간 동안 후두의 진동 운동이 관찰되어도 폐쇄구간으로 간주하였다.

폐쇄구간 동안 관찰되는 포먼트 주파수나 소음은 성도의 불완전한 폐쇄로 인한 기류의 유출 및 음향 에너지의 발산을 의미한다. 마비말장애 환자는 제한된 말 운동 조절 능력으로 인해 폐쇄구간을 조음하는 동안 불완전한 성도 폐쇄를 하며, 이로 인해 음향 신호가 새어 나오는 오류가 나타날 수 있으므로, 의도한 말소리와 폐쇄 또는 기식구간을 나타내는 확실한 표지들(예, 발성의 중지를 나타내는 파형이나 명확한 개방 파열)을 기준으로 구간 길이를 판정하였다. 파형 및 스펙트로그램상에 나타나는 포먼트, 음성막대(기본주파수), 소음의 위치와 정도, 청지각인 정보가 폐쇄구간, 기식구간, 선행 및 후행 모음의 길이 판정에 사용되었다. 또한 저자의 음향음성학적(Phonetics)인 지식과 경험, 타전문가의 조언 등이 활용되었다. 자세한 분석 기준 및 사례는 부록에 제시하였다.

기식구간(Aspiration duration)

기식구간은 개방 파열(Stop burst) 이후 열린 성문으로 기류가 새어 나오는 기식성이 소음 형태의 음향 신호로 나타나는 구간이다. 정의는 다르지만 성대 진동 개시 시간(Voice onset time)이라고도 불리는 구간과도 중복된다. 이 구간은 폐쇄를 이루고 있던 성도를 갑자기 개방하는 동작을 통해서 시작되고, 후행 모음의 성대 진동 개시까지의 시간을 의미한다. 개방 파열은 파형과 광대역 스펙트로그램상에 넓은 주파수 영역에 걸쳐 나타나는 수직의 소음선과 이후 뒤따르는 기식성 소음으로 나타나고, 성대 진동 개시는 후행 모음을 위한 주기적인 파형과 포먼트 주파수의 시작으로 인지된다.

폐쇄구간 길이 비율(The ratio of closure to closure and aspiration combined durations)

이 비율은 폐쇄구간 길이를 폐쇄구간과 기식구간 길이의 합으로 나누어 산출하는 비율을 의미한다.

모든 파열음이 무성음인 우리말 파열음에서는 평음-경음-격음이라는 삼지적 상관속 변별을 위해 긴장성(tenseness)과 기식성(aspiration)이라는 개념이 필요하다(Kim, 1965; Sin & Cha, 2003). 이러한 측면은 폐쇄구간과 기식구간이라는 음향학적인 측정치를 통해 측정된다. VOT나 기식구간 길이만 살펴보면, 격음> 평음>경음의 순서를 보이는 것으로 보고되지만, 이 가운데 우리말 평음과 경음의 기식구간 길이가 잘 구분되지 않는 측면이 있다(Kim, 1965). 연구에 따라서는 모음-자음-모음 위치에서 평파열음이 유성음화되므로 기식구간 또는 VOT를 측정하지 못한다고 보고 격음>경음의 관계만 보고하기도 한다(Bae, 1997; Sin, 1997). 따라서, 이러한 구분의 모호함을 보완하기 위해 긴장성 자질이 도입되었고, 평음이 긴장성 자질이 부족하여 경음이나 격음으로부터 구분된다고 제안되었다(Kim, 1965). Kim (1965)은 평음의 경우, 기식구간의 에너지 수준이 낮고 기식 구간 동안 흘러나오는 기류의 양이 적고, 구강 내 압력도 낮고, 조음 기관 접촉면이 더 작은 특징을 보이므로, 이러한 특성을 평음을 조음할 때 성대 및 성도 내 긴장성이 저하되어 있다고 보는 근거로 보았다. 폐쇄구간 길이나 치경 파열음의 입천장 접촉 면적은 경음 >격음 > 평음의 순서로 감소한다고 보고되었다(Bae, 1997, p.26; Sin, 1997).

그 외에도 조음 위치가 뒤로 이동할수록 폐쇄구간 길이가 짧아지고(Bae, 1997), 기식구간 또는 VOT값은 증가한다는 보고가 있었지만(Kim, 2000; Krause & Braida, 2004), 본 연구에서는 마비말장애군이 산출한 파열음의 폐쇄구간 및 기식구간이 정상군과 근접한지 여부와 이러한 측정치들이 단서의 영향에 따라 변화하는지를 측정하는 것만 초점을 두기 위해 파열음의 발성 유형 및 조음 위치에 따른 폐쇄구간과 기식구간의 개별적인 변화에는 관심을 두지 않기로 하였다. 또한 폐쇄구간, 기식구간, 폐쇄구간 길이 비율은 분절적인 음성학적인 특성을 반영하는 측정치로 선정하기는 하였으나, 분절적인 특성에 국한하지 않고 말속도와 같은 초분절적인 요소의 영향도 받을 것으로 예상했다.

제1, 2 포먼트 자음-모음 비율(F1, F2 C/V ratio)

이 비율 측정에 사용된 시간적인 위치가 이후 설명할 ‘자음-모음 간 제2 포먼트 전이 경사’의 측정 시점과 동일하다. 즉, 후행 모음의 시작점을 자음 산출의 끝으로 보고 자음 포먼트 값을 측정하였고, 후행 모음의 안정 구간에서 모음의 포먼트를 측정하여 두 포먼트 값들 간의 비율을 측정하였다. 선행 연구에서 보고한 자음-모음 비율(Picheny et al., 1986)은 대부분 강도의 비율을 구한 것인데, 본 연구에서 강도가 아닌 포먼트 비율을 비교한 이유는 다음 측정치인 포먼트 전이 경사라는 측정치의 보완적인 역할을 기대했기 때문이다. 본 연구는 자료 수집 시 강도 측정에 필요한 조율(calibration)을 하지 않았으므로 강도 비율을 산출하기에 적절하지 않았다. 또한, 선행 연구에서 자음-모음 강도 비율과 발화 명료도와의 관계성에 대해 비일관적인 관련성을 보고하였으므로(Krause & Braida, 2004; Picheny et al., 1986; Williams et al., 1966) 강도를 측정 대상으로 고려하지 않았다. Picheny 등(1986)에서 장시간 스펙트럼상의 변화가 명료한 발화에서 미비하다고 보고한 것 등이 그 예이다.

자음-모음 간 제2 포먼트(F2) 전이 경사(F2 slope)

Yaruss와 Conture (1993)는 포먼트 전이 구간의 끝을 후행 모음의 안정구간이 시작되는 지점이나 포먼트 밴드의 끝으로 지정하였고, 안정구간은 포먼트 선이 X축인 시간 축과 평행해지는 지점이라고 지정하였다. Yaruss와 Conture (1993)는 제2 포먼트 전이 구간의 시작과 끝 사이의 주파수 변화량이 성문상 조음 기관의 상대적인 위치를 보여준다고 하였고, F2 전이 구간은 조음 기관이 한 지점에서 다른 지점으로 이동하는 이동 시간을 반영한다고도 하였다.

이처럼 F2 전이 경사는 파열음의 조음 위치 확인에 유용한 지표이다(Raphael et al., 2011). Raphael 등(2011)은 양순 파열음 /p, b/의 개방 파열 에너지가 600 Hz나 그보다 낮은 주파수에 집중되어 있고, /아/ 모음이 후행하는 경우, 후행 모음으로의 F2 전이가 상승하는 모양을 보인다고 하였다. 치조 파열음 /t, d/의 개방 파열 에너지는 3 kHz 이상의 높은 주파수에 집중되어 있고, /아/ 모음이 후행하는 문맥에서 약간 하강하는 F2 전이 곡선을 보인다고 하였다. 개방 파열 에너지가 인접하는 모음의 F2 값에서 올라가는 방향으로 존재하는 연구개 파열음 /k, g/에서는 /아/ 모음이 후행하는 문맥에서 급격하게 하강하는 F2 전이 곡선을 보인다고 하였다.

따라서, F2 전이 경사(F2 Slope, movement, or trajectory)는 다양한 장애군의 말 특성을 보여주는데 유용한 지표로 제안되어 왔다(Chang et al., 2002; Kent et al., 1989; Weismer et al., 2001; Yaruss & Conture, 1993). 가령, Kent 등(1989)은 정상 노인 남녀와 Amyotrophic Lateral Sclerosis (ALS) 환자의 말 유창성(Proficiency)과 병세의 점진적인 악화의 지표로 F2 전이 경사가 유용하고, F1 전이 경사보다 F2 전이 경사가 말 명료도와 더 상관이 있었다고 보고하였다(p.349).

본 연구는 이처럼 유용한 F2 전이 경사를 측정함에 있어서, Subramanian 등(2003)가 제안한 방법을 따라 F2 전이 경사를 측정하였다. 전이 경사의 시작은 개방 파열 이후 따라오는 첫 성문 진동 시점이라고 정의하였고, 전이 경사의 끝은 후행 모음의 안정 구간이 시작되는 지점의 첫 성문 진동이라고 정의하였다. 이러한 정의는 Yaruss와 Conture (1993)가 포먼트 전이의 시작과 끝을 지정한 방법과 약간의 차이가 있긴 하지만, 전이 경사를 산출할 때는 다시 Yaruss와 Conture (1993)가 제시한 포먼트 전이 속도(Rate of frequency change (단위: Hz/sec)) 산출 방법에 따라서 포먼트 주파수 변화량을 전이 구간 길이로 나누어서 산출하였다.

연구결과

Table 3Figures 1-6에 나타난 연구결과와 같이, 마비말장애 환자군의 측정치의 절대값은 열 개의 측정치 가운데 여덟 개의 측정치에서 정상군보다 더 높았다. 기식 구간 길이나 구체단서 환경에서의 제1 포먼트(F1) 자음-모음 비율만이 예외적으로 마비말장애군의 측정치가 정상군보다 높지 않았다.

Group comparison: Mann Whitney-U nonparametric test results

Figure 1.

Group comparison results: the first vowel /a/ fundamental frequency (f0).

NC = No Cue Condition; CC = Concrete Cue Condition; AC = Abstract Cue Condition; NHI = Normal Healthy Individuals; IWD = Individuals with Dysarthria; f0 = Fundamental Frequency.

*p < .05.

Figure 2.

. Group comparison results: total syllable fundamental frequency (f0).

NC = No Cue Condition; CC = Concrete Cue Condition; AC = Abstract Cue Condition; NHI = Normal Healthy Individuals; IWD = Individuals with Dysarthria; f0 = Fundamental Frequency.

*p < .05.

Figure 3.

Group comparison results: vowel duration & VCV syllable duration.

Sec = seconds; NC = No Cue Condition; CC = Concrete Cue Condition; AC = Abstract Cue Condition; NHI = Normal Healthy Individuals; IWD = Individuals with Dysarthria; VCV = Vowel-Consonant-Vowel.

*p < .05.

Figure 4.

Group comparison results: closure duration & aspiration duration.

NC = No Cue Condition; CC = Concrete Cue Condition; AC = Abstract Cue Condition; NHI = Normal Healthy Individuals; IWD = Individuals with Dysarthria.

*p < .05.

Figure 5.

Group comparison results: ratio of closure duration to closure and aspiration combined duration.

NC = No Cue Condition; CC = Concrete Cue Condition; AC = Abstract Cue Condition; NHI = Normal Healthy Individuals; IWD = Individuals with Dysarthria.

*p < .05.

Figure 6.

Group comparison results: F1 & F2 consonant to vowel ratio, F2 slope.

NC = No Cue Condition; CC = Concrete Cue Condition; AC = Abstract Cue Condition; NHI = Normal Healthy Individuals; IWD = Individuals with Dysarthria; C/V = Consonant to Vowel Ratio; F1 = The First Formant; F2 = The Second Formant.

*p < .05.

그룹 간 비교 결과, 단서 없는 환경에서 마비말장애 환자군의 선행 모음의 기본주파수(p=.046), 음절 전체의 기본주파수(p=.016), 모음 길이(p=.009), 음절 길이(p=.002), 폐쇄 구간 길이(p=.002), 제2 포먼트 자음-모음 비율(p=.036), 제2 포먼트 전이 경사(p=.046) 값이 정상군보다 유의미하게 더 높게 나타났다. 구체단서 환경에서 마비말장애 환자군의 폐쇄 구간(p=.036) 길이나 폐쇄 구간 비율(p=.046)이 정상군보다 더 높게 나타났다. 추상단서 환경에서는 어떠한 측정치도 유의미한 그룹 간 차이를 보이지 않았다.

Table 4Figures 7-10에 나타난 연구 결과와 같이, 단서 환경 간 비교 결과, 정상군에서는 선행 모음의 기본주파수(p=.002), 음절 전체의 기본주파수(p=.044), 모음 길이(p=.002), 음절 길이(p=.002), 폐쇄 구간 길이(p=.044)에서 단서 간 차이가 있었다.

Cue condition comparison: Friedman nonparametric test results

Figure 7.

NHI: cue condition comparison results: the first vowel /a/ & total syllable fundamental frequency (f0).

NC = No Cue Condition; CC = Concrete Cue Condition; AC = Abstract Cue Condition; NHI = Normal Healthy Individuals; f0 = Fundamental Frequency.

*p < .05.

Figure 8.

NHI: cue condition comparison results: vowel duration, VCV syllable duration, closure duration, aspiration duration, ratio of closure duration/closure & aspiration combined duration, F1 & F2 Consonant to vowel ratio, F2 slope.

NC = No Cue Condition; CC = Concrete Cue Condition; AC = Abstract Cue Condition; NHI = Normal Healthy Individuals; VCV = Vowel-Consonant-Vowel; C/V = Consonant to Vowel Ratio; F1 = The First Formant; F2 = The Second Formant.

*p < .05.

Figure 9.

IWD: cue condition comparison results: the first vowel /a/ f0 & total syllable f0.

NC = No Cue Condition; CC = Concrete Cue Condition; AC = Abstract Cue Condition; IWD = Individuals with Dysarthria; f0 = Fundamental Frequency.

Figure 10.

IWD: cue condition comparison results: vowel duration, VCV syllable duration, closure duration, aspiration duration, ratio of closure duration/closure & aspiration combined duration, F1 & F2 consonant to vowel ratio, F2 slope.

NC = No Cue Condition; CC = Concrete Cue Condition; AC = Abstract Cue Condition; IWD = Individuals with Dysarthria; VCV = Vowel-Consonant-Vowel; C/V = Consonant to Vowel Ratio; F1 = The First Formant; F2 = The Second Formant.

*p < .05.

그 차이가 어디에서 오는지 보기 위해, α값을 .0167 (= .05/3)로 Bonferroni 조정한 후 Wilcoxon Test로 사후 검정을 한 결과, 정상군의 선행 모음의 기본주파수가 구체단서 환경에서 단서 없는 환경(p=.012)이나 추상단서 환경(p=.012)보다 유의미하게 높은 것으로 나타났다. 모음 길이의 경우, 구체단서 환경이 단서 없는 환경(p=.012)보다 유의미하게 길었고, 음절 길이의 경우, 구체단서 환경(p=.012)이나 추상단서 환경(p=.012)의 음절 길이가 단서 없는 무단서 환경보다 유의미하게 긴 것으로 나타났다. 사후 검정 결과, 음절 전체의 기본주파수(무단서-구체단서: p=.017, 무단서-추상단서: p=.123, 구체단서-추상단서: p=.093)와 폐쇄구간 길이(무단서-구체단서: p=.208, 무단서-추상단서: p=.036, 구체단서-추상단서: p=.208)에서는 유의미한 단서 환경 간 차이는 관찰되지 않았다.

마비말장애군에서는 모음 길이(p=.002), 음절 길이(p=.002), 폐쇄 구간 비율(p=.03)에서 단서 환경 간 차이가 관찰되었다. 그 차이가 어떤 단서 환경 간의 차이에서 비롯되는지 사후 검정을 한 결과, 모음 길이나 음절 길이의 경우, 모두 구체단서 환경에서의 모음 및 음절 길이가 단서 없는 환경(모음 길이: p=.012, 음절 길이: p=.012)이나 추상단서 환경(모음 길이: p=.012, 음절 길이: p=.012)보다 유의미하게 길어지면서 차이가 발생하는 것으로 나타났다. 폐쇄구간 비율에서는 사후 검정 결과에서 유의미한 단서 간 차이가 관찰되지 않았다(무단서-구체단서: p=.093, 무단서-추상단서: p=.401, 구체단서-추상단서: p=.017).

논의 및 결론

본 연구는 정상 성인 남성 8명과 마비말장애가 있는 성인 남성 8명이 9개의 한국어 파열음이 포함된 무의미 이음절어를 3가지 단서 환경에서 3번씩 산출한 후 여러가지 말 명료도의 지표가 될 수 있는 음향학적인 측정치들을 비교하여 각 그룹 내 단서 효과 및 그룹 간 차이를 살펴본 연구이다.

단서 환경에 따른 비교 결과, 정상군의 경우 단서 환경에서 모음이나 음절 전체를 발화하는 동안 주로 음도를 높이거나 모음 및 음절 길이를 더 늘리는 변화를 보였다. 폐쇄 구간의 길이도 단서 환경에서 유의미하게 더 길어지는 경향이 있었다. 이러한 변화는 이미 선행 연구에서도 보고된 명료화 전략과 일치하였다(Bradlow et al., 2003; Ferguson & Kewley-Port, 2007; Goberman & Elmer, 2005; Picheny et al., 1986; Summers et al., 1988; Uchanski et al., 1996). 그러나 자음의 지각에 영향을 줄 수 있는 기식 구간의 길이와 폐쇄구간의 비율, 제1 포먼트의 자음-모음 간 비율, 제2 포먼트의 자음-모음 간 비율, 제2 포먼트의 전이 경사에는 변화가 없었다. 이것은 더 명료한 발화를 위해 정상군이 음도나 발화 속도나 길이와 같은 운율적인 부분에 변화는 주는 반면, 이러한 변화 속에서도 제1 포먼트나 제2 포먼트의 전이 경사나 구간 길이 간의 상대적인 관계성이라는 음향학적인 정보는 유지하는 경향을 보여준다고 할 수 있다. 운율적인 정보가 명료도 향상에 기여한다는 주장은 Ellis Weismer와 Heshketh (1996, 1998)에서도 언급되었다. 또한 이러한 결과는 인간이 뇌에 저장하고 있는 조음 동작 관련 운동 명령 정보에서 분절음에 대한 정보와 초분절음에 대한 정보를 다르게 저장 및 통제하고 있으며, 분절적인 정보를 일반화된 운동 프로그램(Generalized Motor Program, GMP)의 형태로 저장하고 있다고 주장한 Maas 등(2008)의 주장과 일맥하고, 이러한 GMP에 저장된 정보는 상대적인 시간과 힘에 대한 정보라고 제안한 도식 이론(Schema theory; Schmit, 1975)과도 일치하는 결과였다. 또한 명료한 발화에서든 대화체의 발화에서든 이러한 음향학적인 측정치의 상대적인 관계성의 유지가 9개나 되는 파열음의 변별적인 지각에 중요하다는 것을 시사하기도 한다.

단서 없는 환경에서만 분석하여 정상군과 마비말장애 환자군이 산출한 파열음의 음향학적인 특성을 비교한 연구(Kim & Kim, 2019)에서도 산출한 파열음의 기식구간에서 유의미한 그룹 간 차이를 발견하지 못하였는데, 정상군과 마비말장애 환자군이 단서 환경에서도 기식구간을 거의 변경하지 않았고, 일관되게 그룹 간 차이를 보이지 않았다는 것은 흥미롭다. 이것은 과거 다른 연구에서 개인 차는 있으나, 실조형 마비말장애군에서 파열음의 유무성성에 따른 VOT 구분이 모호해졌다고 보고한 Ackermann과 Hertrich (1997)Ackermann 등(1999)의 연구결과와는 상반된 결과이고, 유성 파열음의 경우 명료화 전략에 VOT 길이가 영향을 받지 않았다고 보고한 Krause와 Braida (2004)의 연구결과와는 일치하는 결과였다. 그만큼 한국어를 구사하는 마비말장애군이 파열음의 변별적인 조음 및 지각을 위해 기식구간의 길이 조절을 중요하게 생각하므로, 말장애에도 불구하고 말 운동 조절 및 통제 시 가장 신경을 써서 음향학적인 특성을 유지했을 가능성을 시사한다.

마비말장애군이 몇 가지 음향학적인 측정치에서 단서에 따른 유의미한 차이를 거의 보이지 않았다는 것에도 주목할 필요가 있다. 본 연구에서 마비말장애군에서는 선행 모음이나 음절을 산출하는 동안 평균 음도를 의미하는 기본주파수를 측정한 결과, 단서 간 차이가 나타나지 않았다. 이러한 현상을 해석하기 위해 정상군은 단서 환경에서 비로소 음도를 높였는데, 마비말장애군의 경우 단서가 없는 환경에서도 정상군보다 이미 높은 음도를 사용하고 있었다는 점에 주목할 필요가 있다. 선행 연구에서 보고된 바 있는 명료화 전략의 하나인 음도의 높임을 마비말장애 환자군이 단서가 없는 환경에서 이미 사용하고 있었다고 볼 수 있다. 마비말장애군이 단서가 없는 환경에서도 명료한 발화를 위해 노력을 기울인 발성을 함에 따라 자연스럽게 기본주파수나 강도가 높아져서 이러한 결과를 낳았을 것으로 추측된다. 따라서, 단서 환경에서는 기본주파수 값에 별다른 변화를 가져오지 못한 것으로 보인다. 이와 같이 마비말장애군에서 전반적으로 높아진 음도(Goberman & Coelho, 2002; Goberman & Elmer, 2005)와 무단서 환경의 대화체 발화에서 이미 명료화 전략을 사용할 가능성(Goberman & Elmer, 2005)에 대해서는 선행연구들에서도 보고한 바 있다.

반면, 마비말장애군은 모음 길이나 음절 길이, 폐쇄구간 비율 측면에서 단서 환경에 따른 유의미한 변화를 가지는 것으로 관찰되었다. 마비말장애군은 구체단서 환경에서는 모음 및 음절 길이, 폐쇄구간 비율을 단서 없는 환경보다 길거나 높게 산출하였다. 그러나, 추상단서 환경에서는 이러한 측정치들이 단서 없는 환경과 큰 차이가 없거나 단서 없는 환경에서 보다 오히려 더 낮은 수치를 보이는 경우도 관찰할 수 있었다. 따라서, 유의미한 단서 효과라는 결과는 개별 단서 환경을 비교하기보다는 단서에 따른 변화 양상을 세 가지 단서 환경에서 한꺼번에 비교할 때 관찰되는 효과였다고도 볼 수 있다. 즉, 전체적인 단서 수준에서 비교하면 유의미한 단서 간 차이가 관찰되었으나, 사후 검정처럼 모음 및 음절 길이, 폐쇄구간 비율을 무단서-추상단서 환경 간에 개별적으로 비교하면, 단서 간 유의미한 차이가 관찰되지 않음을 의미한다.

단서 간 효과를 개별 단서 환경에서 비교한 사후 검정 결과, 정상군에서는 추상단서 환경의 음절 길이가 단서 없는 무단서 환경의 음절 길이보다 유의미하게 길었다. 그러나, 마비말장애군은 무단서 환경에서 모음 길이나 음절 길이, 폐쇄구간의 길이가 이미 정상인보다 유의미하게 길면서, 자발적인 명료화 전략을 사용하는 추상단서 환경에서는 이들 길이가 무단서 환경에서 보다 크게 늘어나지 않거나 오히려 무단서 환경에서 보다 짧아지는 양상을 볼 수 있었다. 따라서 마비말장애군은 이미 느린 말속도를 추상단서 환경에서 추가적으로 더 느리게 하기보다는 말속도에 변화를 주지 않거나 오히려 더 빠르게 하여 정상인에 더 가까워지려고 노력하였을 가능성을 시사하였다. 이것은 구체단서 환경에서 산출한 발화가 불필요하게 발화길이를 늘려서 자연스럽지는 않았을 수도 있음을 의미한다. 본 연구에서는 구체단서로 “더 크고 느리게”라는 지시어를 사용하였는데, 이것은 “as loudly and slowly as possible”이라는 지시어를 영어권 선행 연구에서 차용하여 직역한 결과였다. 그러나 단순히 ‘더 느리게’ 말하는 것이 명료도 향상에 큰 도움이 되지 않을 수 있다. 따라서 후속 연구는 더 자연스럽고 명료한 발화를 유도하기 위해서는 “느리게”보다는 “천천히”라는 표현을 사용해보아도 좋을 것이다. Ferguson과 Kewley-Port (2007) 역시 모음 길이의 증가가 명료도 증가로 이어지지 않는 경우를 보고하였다(p. 1250). 또한 파킨슨 환자의 발화 속도를 연구한 Goberman과 Elmer (2005)도 읽기와 독백 과제에서 모두 명료한 발화에서 대화체 발화보다 발화 속도가 유의미하게 빨라지는 것을 보고하였다. 따라서, 화자들에게 있어서 명료화 전략이 말속도를 느리게 하는 것만이 아닐 수 있음을 시사한다. 장애로 인해 말속도 조절이 어려워진 마비말장애 환자군에게 있어서 적절한 조음 속도를 달성하여 더 명료하고 자연스러운 발화에 도달하는 것이 더 궁극적인 목표가 될 수 있으며, 임상가들은 치료 단서를 선택함에 있어서 이러한 부분에 대한 고찰이 필요하다. 각 중재 대상자의 말 특성에 따라 적절한 말속도를 고민하고 그에 맞는 치료 단서를 활용해야 할 것이다.

연구결과, 마비말장애군에서 정상군보다 대부분의 음향측정치에서 더 길거나 큰 값들을 보인 것은 장애의 영향으로 보이며, 전반적으로 느려진 발화 속도나 더 노력을 기울인 발성 및 조음이 음향학적인 측정치들에 영향을 주었을 것으로 추측된다. 다른 한편, 이러한 결과는 마비말장애군이 단서 없는 환경에서 이미 명료화 전략을 사용하고 있음을 의미할 수도 있다.

단서 없는 환경에서 정상군과 마비말장애군 사이에 존재했던 많은 음향학적인 지표의 차이가 단서 환경에서 줄어들었고, 구체단서 보다는 추상단서 환경에서 그 차이가 더 사라졌다는 점도 주목할 만하다. 이것은 마비말장애군의 발화가 단서 환경 특히, 추상단서 환경에서 정상군의 명료화의 결과와 유사해짐을 의미한다. 즉, 단서 환경에서 정상군은 음도를 높이고, 단서에 따라 발화 속도를 느리게 하면서 모음 및 음절 길이, 폐쇄구간의 길이를 유의미하게 증가시켰다. 반면, 마비말장애군은 파열음을 포함한 무의미 이음절 단어 산출 시 무단서 환경에서 이미 음도가 높은 상황이어서 단서에 따라 음도를 더 높이지는 않았다. 또한 길이 측면에서 무단서 환경의 말속도를 거의 유지함에 따라서 정상군이 추상단서 환경에서 산출한 느려진 발화 속도와 유사해져서 이러한 음향 측정치들 간의 차이가 없어진 것으로 보인다.

지금까지 논의한 내용을 폐쇄구간 비율이라는 변수에서 조금 더 자세히 살펴보겠다. 정상군은 단서에 따라 폐쇄구간 길이를 적극적으로 증가시켜서 폐쇄구간 비율이 구체단서< 무단서< 추상단서의 순서로 증가하였다. 반면, 마비말장애군은 폐쇄구간 길이와 기식구간 길이를 반올림하기 이전 절대값 수준에서 비교해보았을 때 폐쇄구간은 무단서< 추상단서<구체단서와 같은 순서를 보였고, 기식구간은 무단서<구체단서< 추상단서 순서를 보였으며, 폐쇄구간 비율은 추상단서< 무단서<구체단서 순서로 증가하였다. 모든 단서 환경에서 마비말장애군의 폐쇄구간 길이가 정상군의 폐쇄구간 길이보다 길었다. 따라서, 추상단서 환경에서 정상군과 마비말장애군의 폐쇄구간 비율이 가장 근접해지면서 그룹 간 차이가 사라졌다. 두 그룹 모두 추상단서 환경에서 무단서 환경에서보다는 폐쇄구간 길이를 늘리는 전략을 사용하였으며, 무단서 환경에서 추상단서 환경으로 변화하면서 마비말장애군이 폐쇄구간 길이를 연장하되 그 변화량이 크지 않았고 기식구간 길이는 상대적으로 적극적으로 늘려서 ‘마비말장애군이 추상단서 상황에서 산출한 폐쇄구간 비율’이 ‘정상군이 추상단서 상황에서 산출한 폐쇄구간 비율’과 근접하게 된 것을 관찰할 수 있었다. 이러한 결과는 두 그룹 모두 명료한 발화에 대한 내적 표상, 즉 바람직하고 수용가능한 범위가 존재할 가능성을 시사한다. 이러한 내적 표상이 두 그룹의 명료화 전략을 이끌고 있는 것으로 판단되며, 추상단서 환경에서 폐쇄구간 비율의 그룹 간 차이가 사라진 것은 두 그룹에서 사용한 명료화 전략이 모두 작용한 결과로 해석해 볼 수 있겠다.

각 집단 구성원들 안에서도 개인차가 보고된 바 있고(Ackermann & Hertrich, 1997; Ferguson & Kewley-Port, 2007), 각 마비말장애 환자의 장애 특성에 따라서 때로는 불필요한 비강 공명이 나타나는 등의 음향학적인 소음들이 파열음 조음 시 동반하기도 하였지만, 마비말장애군이 단서 환경에서 종국에는 측정한 음향 측정치들에 한해서는 정상군과 음향학적인 차이가 없어졌다는 것은 마비말장애군의 명료화 전략 또는 명료화 후 도달하고자 하는 목표가 정상군과 유사하다는 것을 시사한다. 한편, 앞에서도 언급하였지만 마비말장애군이 단서에 따른 음향학적인 측정치들에서 유의미한 변화를 거의 경험하지 못하는 것은 단서 없는 환경에서도 마비말장애군이 이미 명료화 전략을 적용하고 있어서(Goberman & Elmer, 2005), 단서 환경에서 더 유의미한 변화를 이끌어내지 못한 것일 수도 있고, 다른 한편 마비말장애로 인해 발화 패턴의 유의미한 변화에 한계가 있어서일 수도 있다.

본 논문은 짧은 무의미 이음절 단어 환경에서의 청각적인 단서의 효과만을 살펴보았으나, 더 길고 다양한 발화 환경에서 다양한 음향 측정치를 활용한 연구 질문에 대한 추가 검증이 필요하고, 후행 연구에서는 청지각적인 명료도 평가도 병행하여 보완할 필요가 있다. 마지막으로 본 연구는 지시어 선정 시 선행 연구의 영어 표현을 직역(예, “slowly”→“느리게”)하여 활용하였는데, “느리게” 대신 “천천히”와 같은 표현이 우리말 체계에서는 명료도를 유도하고자 하는 목적에 더 부합하는 표현일 수 있어서 후속 연구에서는 이러한 부분을 고려하여 지시어를 선정해보기를 바란다.

Acknowledgements

논문을 지도하고 조언해 주신 김향희 교수님께 감사드립니다. 본 연구를 2021년 ASHA에서 발표할 때 자료 분석에 도움을 준 Saint Mary’s College의 학생들(Rielly Grooms, Katie Haseley, Frida Rodriguez, Caitlyn McKevitt, Alexandria Leonardo)에게 고마운 마음을 전합니다. 본 연구 자료는 이 발표 이후 저자에 의해 재분석되었습니다.

References

1. Ackermann, H., Gräber, S., Hertrich, I., & Daum, I. (1999). Phonemic vowel length contrasts in cerebellar disorders. Brain & Language, 67, (2)95–109.
2. Ackermann, H., & Hertrich, I. (1997). Voice onset time in ataxic dysarthria. Brain & Language, 56, (3)321–333.
3. Allen, J. S., & Miller, J. L. (1999). Effects of syllable-initial voicing and speaking rate on the temporal characteristics of monosyllabic words. The Journal of the Acoustic Society of America, 106, (4)2031–2039.
4. Bradlow, A. R., Akahane-Yamada, R., Pisoni, D. B., & Tohkura, Y. I. (1999). Training Japanese listeners to identify English/r/and/l/: long-term retention of learning in perception and production. Perception & Psychophysics, 61, 977–985.
5. Bradlow, A. R., Kraus, N., & Hayes, E. (2003). Speaking clearly for children with learning disabilities. Journal of Speech, Language, & Hearing Research, 46, (1)80–97.
6. Bradlow, A. R., Pisoni, D. B., Akahane-Yamada, R., & Tohkura, Y. I. (1997). Training Japanese listeners to identify English/r/and/l/: IV. Some effects of perceptual learning on speech production. The Journal of the Acoustical Society of America, 101, (4)2299–2310.
7. Chang, S. E., Ohde, R. N., & Conture, E. G. (2002). Coarticulation and formant transition rate in young children who stutter. Journal of Speech, Language, & Hearing Research, 45, (4)676–688.
8. Choe, B. I. (2020). Implementation of the Revised Common Rule in the United States and its implications for Human Research in Korea. Journal of KAIRB, 2, (1)1–5.
9. Duffy, J. (2005). Motor speech disorders: substrates, differential diagnosis, and management. 2nd ed. Elsevier.
10. Duffy, J. (2013). Motor speech disorders: substrates, differential diagnosis, and management. 3rd ed. Elsevier.
11. Duffy, J. (2020). Motor speech disorders: substrates, differential diagnosis, and management. 4th ed. Elsevier.
12. Ellis Weismer, S., & Hesketh, L. J. (1996). Lexical learning by children with specific language impairment: effects of linguistic input presented at varying speaking rates. Journal of Speech & Hearing Research, 39, (1)177–190.
13. Ellis Weismer, S., & Hesketh, L. J. (1998). The impact of emphatic stress on novel word learning by children with specific language impairment. Journal of Speech, Language, & Hearing Research, 41, (6)1444–1458.
14. Ferguson, S. H., & Kewley-Port, D. (2002). Vowel intelligibility in clear and conversational speech for normal-hearing and hearing-impaired listeners. The Journal of the Acoustical Society of America, 112, (1)259–271.
15. Ferguson, S. H. (2004). Talker differences in clear and conversational speech: vowel intelligibility for normal-hearing listeners. The Journal of the Acoustical Society of America, 116, (4)2365–2373.
16. Ferguson, S. H., & Kewley-Port, D. (2007). Talker differences in clear and conversational speech: acoustic characteristics of vowels. Journal of Speech, Language, & Hearing Research, 50, (5)1241–1255.
17. Goberman, A. M., & Coelho, C. (2002). Acoustic analysis of Parkinsonian speech I: speech characteristics and L-Dopa therapy. NeuroRehabilitation, 17, (3)237–246.
18. Goberman, A. M., & Elmer, L. W. (2005). Acoustic analysis of clear versus conversational speech in individuals with Parkinson disease. Journal of Communication Disorders, 38, (3)215–230.
19. Houtgast, T., & Steeneken, H. J. (1985). A review of the MTF concept in room acoustics and its use for estimating speech intelligibility in auditoria. The Journal of the Acoustical Society of America, 77, (3)1069–1077.
20. Kent, R. D., Kent, J. F., Weismer, G., Martin, R. E., Sufit, R. L., Brooks, B. R., & Rosenbek, J. C. (1989). Relationships between speech intelligibility and the slope of second-formant transitions in dysarthric subjects. Clinical Linguistics & Phonetics, 3, (4)347–358.
21. Kim, C. (1965). On the autonomy of the tensity feature in stop classification: with special reference to Korean stops. Word, 21, (3)339–359.
22. Kim, J. Y. (2001). Acoustic properties related to the plosive production of adults with spastic and athetoid cerebral palsy. Master’s thesis. Graduate Program in Speech-Language Pathology, Yonsei University.
23. Kim, Y., & Choi, Y. (2017). A cross-language study of acoustic predictors of speech intelligibility in individuals with Parkinson’s disease. Journal of Speech, Language, & Hearing Research, 60, (9)2506–2518.
24. Kim, Y., Kent, R. D., & Weismer, G. (2011). An acoustic study of the relationships among neurologic disease, dysarthria type, and severity of dysarthria. Journal of Speech, Language, & Hearing Research, 54, (2)417–429.
25. Kim, H. S., & Kim, H. H. (2019). Acoustic analysis of Korean stop sounds in patients with dysarthrias. Clinical Archives of Communication Disorders, 4, (3)201–213.
26. Knowles, T., & Badh, G. (2022). The impact of face masks on spectral acoustics of speech: effect of clear and loud speech styles. The Journal of the Acoustical Society of America, 151, (5)3359–3368.
27. Krause, J. C., & Braida, L. D. (2002). Investigating alternative forms of clear speech: the effects of speaking rate and speaking mode on intelligibility. The Journal of the Acoustical Society of America, 112, (5)2165–2172.
28. Krause, J. C., & Braida, L. D. (2004). Acoustic properties of naturally produced clear speech at normal speaking rates. The Journal of the Acoustical Society of America, 115, (1)362–378.
29. Lam, J., Tjaden, K., & Wilding, G. (2012). Acoustics of clear speech: effect of instruction. Journal of Speech, Language, & Hearing Research, 55, (6)1807–1821.
30. Maas, E., Robin, D. A., Hula, S. N. A., Freedman, S. E., Wulf, G., Ballard, K. J., & Schmidt, R. A. (2008). Principles of motor learning in treatment of motor speech disorders. American Journal of Speech-Language Pathology, 17, (3)277–298.
31. Moon, S. J., & Lindblom, B. (1994). Interaction between duration, context, and speaking style in English stressed vowels. The Journal of the Acoustical society of America, 96, (1)40–55.
32. Pappas, P. A., & DePuy, V. (2004). An overview of non-parametric tests in SAS: when, why, and how. Paper TU04. Duke Clinical Research Institute. Durham: (pp. 1–5.
33. Pae, J. Y. (1997). An acoustic study on coarticulation in Korean [Master’s thesis, Graduate School in Korean Language & Literature, Hallym University].
34. Paul, B., & Weenink, D. (1992-2022). Praat: doing phonetics by computer [Computer program] Version 6.2.18. Retrieved from https://www.praat.org.
35. Picheny, M. A., Durlach, N. I., & Braida, L. D. (1985). Speaking clearly for the hard of hearing I: intelligibility differences between clear and conversational speech. Journal of Speech, Language, & Hearing Research, 28, (1)96–103.
36. Picheny, M. A., Durlach, N. I., & Braida, L. D. (1986). Speaking clearly for the hard of hearing II: acoustic characteristics of clear and conversational speech. Journal of Speech, Language, & Hearing Research, 29, (4)434–446.
37. Platt, L. J., Andrews, G., Young, M., & Neilson, P. D. (1978). The measurement of speech impairment of adults with cerebral palsy. Folia Phoniatrica et Logopaedica, 30, (1)50–58.
38. Raphael, L. J., Borden, G. J., & Harris, K. S. (2011). Speech science primer: physiology, acoustics, and perception of speech. 6th ed. Lippincott Williams & Wilkins.
39. Rosenthal, A. L., Lowell, S. Y., & Colton, R. H. (2014). Aerodynamic and acoustic features of vocal effort. Journal of Voice, 28, (2)144–153.
40. Schiavetti, N. (1992). Scaling procedures for the measurement of speech intelligibility. Kent, R. D. Intelligibility in speech disorders: theory, measurement and management. (pp. 11–34). Amsterdam: John Benjamins.
41. Schmidt, R. A. (1975). A schema theory of discrete motor skill learning. Psychological Review, 82, (4)225–260.
42. Shin, J. Y. (1997). Consonantal Production and V-to-V Coarticulation in Korean VCV Sequences. Speech Science, 1, 55–81.
43. Shin, J. Y., & Cha, J. E. (2003). Urimal Soriui Chegye (Korean sound system). Seoul: Hankookmoonhwasa.
44. Smiljanic, R., & Bradlow, A. R. (2009). Speaking and hearing clearly: talker and listener factors in speaking style changes. Language & Linguistics Compass, 3, (1)236–264.
45. Smiljanic, R., & Bradlow, A. R. (2010). Teaching and learning guide for: speaking and hearing clearly: talker and listener factors in speaking style changes. Language & Linguistics Compass, 4, (3)182–186.
46. Spielman, J., Ramig, L. O., Mahler, L., Halpern, A., & Gavin, W. J. (2007). Effects of an extended version of the Lee Silverman Voice Treatment on voice and speech in Parkinson’s disease. American Journal of Speech-Language Pathology, 16, (2)95–107.
47. Subramanian, A., Yairi, E., & Amir, O. (2003). Second formant transitions in fluent speech of persistent and recovered preschool children who stutter. Journal of Communication Disorders, 36, (1)59–75.
48. Summerfield, Q. (1981). Articulatory rate and perceptual constancy in phonetic perception. Journal of Experimental Psychology: Human Perception and Performance, 7, (5)1074–1095.
49. Summers, W. V., Pisoni, D. B., Bernacki, R. H., Pedlow, R. I., & Stokes, M. A. (1988). Effects of noise on speech production: acoustic and perceptual analyses. The Journal of the Acoustical Society of America, 84, (3)917–928.
50. Tjaden, K., Lam, J., & Wilding, G. (2013). Vowel acoustics in Parkinson’s disease and multiple sclerosis: comparison of clear, loud, and slow speaking conditions. Journal of Speech, Language, & Hearing Research, 56, (5)1485–1502.
51. Tjaden, K., & Wilding, G. E. (2004). Rate and loudness manipulations in dysarthria. Journal of Speech, Language, & Hearing Research, 47, (4)766–783.
52. Turner, G. S., Tjaden, K., & Weismer, G. (1995). The influence of speaking rate on vowel space and speech intelligibility for individuals with amyotrophic lateral sclerosis. Journal of Speech and Hearing Research, 38, 1001–1013.
53. Uchanski, R. M. (2005). Clear speech. Pisoni, D. B., & Remez, T. The handbook of speech perception. (pp. 207–235). Malden, MA/Oxford, UK: Blackwell.
54. Uchanski, R. M., Choi, S. S., Braida, L. D., Reed, C. M., & Durlach, N. I. (1996). Speaking clearly for the hard of hearing IV: further studies of the role of speaking rate. Journal of Speech, Language, & Hearing Research, 39, (3)494–509.
55. Uther, M., Knoll, M. A., & Burnham, D. (2007). Do you speak E-NG-LI-SH? A comparison of foreigner-and infant-directed speech. Speech Communication, 49, (1)2–7.
56. Wassink, A. B., Wright, R. A., & Franklin, A. D. (2007). Intraspeaker variability in vowel production: an investigation of motherese, hyperspeech, and Lombard speech in Jamaican speakers. Journal of Phonetics, 35, (3)363–379.
57. Weismer, G., Jeng, J. Y., Laures, J. S., Kent, R. D., & Kent, J. F. (2001). Acoustic and intelligibility characteristics of sentence production in neurogenic speech disorders. Folia Phoniatrica et Logopaedica, 53, (1)1–18.
58. Williams, C. E., Hecker, M. H., Stevens, K. N., & Woods, B. (1966). Intelligibility test methods and procedures for evaluation of speech communication systems. National Technical Information Service AD. (pp. 646e781.
59. Yaruss, J. S., & Conture, E. G. (1993). F2 transitions during sound/syllable repetitions of children who stutter and predictions of stuttering chronicity. Journal of Speech, Language, & Hearing Research, 36, (5)883–896.
60. Yoon, M. S., & Lee, S. (1998). A comparative study on the measures of intelligibility and percentages of consonants correct between phonologically disordered and normal children. Korean Journal of Communication & Disorders, 3, (1)50–68.
61. Yorkston, K. M., Beukelman, D. R., & Bell, K. R. (1988). Clinical management of dysarthric speakers. Austin, TX: Pro-Ed.
62. Zhi, M. J. (1993). The length of sound. Saegugeosaenghwal, 3, (1)39–57.

Article information Continued

Figure 1.

Group comparison results: the first vowel /a/ fundamental frequency (f0).

NC = No Cue Condition; CC = Concrete Cue Condition; AC = Abstract Cue Condition; NHI = Normal Healthy Individuals; IWD = Individuals with Dysarthria; f0 = Fundamental Frequency.

*p < .05.

Figure 2.

. Group comparison results: total syllable fundamental frequency (f0).

NC = No Cue Condition; CC = Concrete Cue Condition; AC = Abstract Cue Condition; NHI = Normal Healthy Individuals; IWD = Individuals with Dysarthria; f0 = Fundamental Frequency.

*p < .05.

Figure 3.

Group comparison results: vowel duration & VCV syllable duration.

Sec = seconds; NC = No Cue Condition; CC = Concrete Cue Condition; AC = Abstract Cue Condition; NHI = Normal Healthy Individuals; IWD = Individuals with Dysarthria; VCV = Vowel-Consonant-Vowel.

*p < .05.

Figure 4.

Group comparison results: closure duration & aspiration duration.

NC = No Cue Condition; CC = Concrete Cue Condition; AC = Abstract Cue Condition; NHI = Normal Healthy Individuals; IWD = Individuals with Dysarthria.

*p < .05.

Figure 5.

Group comparison results: ratio of closure duration to closure and aspiration combined duration.

NC = No Cue Condition; CC = Concrete Cue Condition; AC = Abstract Cue Condition; NHI = Normal Healthy Individuals; IWD = Individuals with Dysarthria.

*p < .05.

Figure 6.

Group comparison results: F1 & F2 consonant to vowel ratio, F2 slope.

NC = No Cue Condition; CC = Concrete Cue Condition; AC = Abstract Cue Condition; NHI = Normal Healthy Individuals; IWD = Individuals with Dysarthria; C/V = Consonant to Vowel Ratio; F1 = The First Formant; F2 = The Second Formant.

*p < .05.

Figure 7.

NHI: cue condition comparison results: the first vowel /a/ & total syllable fundamental frequency (f0).

NC = No Cue Condition; CC = Concrete Cue Condition; AC = Abstract Cue Condition; NHI = Normal Healthy Individuals; f0 = Fundamental Frequency.

*p < .05.

Figure 8.

NHI: cue condition comparison results: vowel duration, VCV syllable duration, closure duration, aspiration duration, ratio of closure duration/closure & aspiration combined duration, F1 & F2 Consonant to vowel ratio, F2 slope.

NC = No Cue Condition; CC = Concrete Cue Condition; AC = Abstract Cue Condition; NHI = Normal Healthy Individuals; VCV = Vowel-Consonant-Vowel; C/V = Consonant to Vowel Ratio; F1 = The First Formant; F2 = The Second Formant.

*p < .05.

Figure 9.

IWD: cue condition comparison results: the first vowel /a/ f0 & total syllable f0.

NC = No Cue Condition; CC = Concrete Cue Condition; AC = Abstract Cue Condition; IWD = Individuals with Dysarthria; f0 = Fundamental Frequency.

Figure 10.

IWD: cue condition comparison results: vowel duration, VCV syllable duration, closure duration, aspiration duration, ratio of closure duration/closure & aspiration combined duration, F1 & F2 consonant to vowel ratio, F2 slope.

NC = No Cue Condition; CC = Concrete Cue Condition; AC = Abstract Cue Condition; IWD = Individuals with Dysarthria; VCV = Vowel-Consonant-Vowel; C/V = Consonant to Vowel Ratio; F1 = The First Formant; F2 = The Second Formant.

*p < .05.

Table 1.

Participant’s demographic information

Place of data collection Sex Age (year; months) POT4 (months) Etiology or diagnosis Speech characteristics Severity
P11 Hospital M3 20;0 21 TBI5 Short phrases, strained-strangled voice, harshness, vocal fry, mono-pitch, mono-loudness, imprecise consonant Moderate
P2 Hospital M 24;1 12 TBI (Traumatic SAH6) Strained-strangled voice, harshness, vocal fry, variable pitch & loudness, transient hypernsality, slow AMR14 & SMR15, imprecise consonant, distorted vowel Moderate to Severe
P3 Hospital M 42;2 10 Rt.7 Hemiplegia d/t8 TBI Short phrases, slow rate, imprecise consonant, harsh voice, mild hypernasality, paragraph reading intelligibility: 95% Mild
P4 Hospital M 61;9 5 Rt. Hemiplegia d/t Lt.9 Pontine ICH10 Impression Slow rate, short phrases, pitch break, hoarse & breathy voice, vocal flutter, diplophonia, slow AMR & SMR, rushes of speech with reduced ROM, imprecise consonant, intelligibility: < 43% (Start out with intelligible speech and turn to completely unintelligible speech) Severe
P5 Hospital M 55;4 44 Quadriparesis d/t Pontine Hemorrhage Short phrases, slow rate, strained-strangled voice, harsh & hoarse voice, reduced pitch variation, diplophonia, imprecise consonant, hypernasality, vocal tremor, fluctuating loudness, intermittent irregular AMR, intelligibility: 91.3% Moderate to Severe
P6 Hospital M 21;11 3 Rt. Hemiparalysis d/t Rt. Frontal & Lt. Basal Ganglia Hemorrhage (TBI d/t Fall) Naming aphasia (PK-WAB-R, AQ11: 83.2) Rt. lip & tongue weakness, reduced pitch variation, short phrases, audible inspiration, hypernsality, imprecise consonant, intelligibility: 81% (mainly problem of hypernsality) Mild to Moderate
P7 Hospital M 47;11 14 Quadriparesis d/t EDH12, SDH13 (TBI d/t Fall) Epilepsy Short phrases, imprecise consonant, hoarse & harsh voice, slow AMR & SMR, reduced loudness (asthenic voice), vocal fry, diplophonia Mild to Moderate
P8 Hospital M 60;5 17 Lt. Hemiplegia d/t Rt. Lateral Medullary Infarct Impression Imprecise consonant, slow rate, irregular AMR, excessive pitch & loudness variation, breathiness, mild hypernasality Mild to Moderate
C12 Church M 21;2
C2 Home M 23;1
C3 Church M 39;10
C4 Office M 64;8
C5 Church M 53;7
C6 Church M 21;9
C7 Church M 46;7
C8 Home M 57;10

P1 = Patient; C2 = Control; M3 = Male; POT4 = Post Onset Time; TBI5 = Traumatic Brain Injury; SAH6 = Subarachnoid Hemorrhage; Rt.7 = Right; d/t8 = due to; Lt.9 = Left; ICH10 = Intracranial Hemorrhage; PK-WAB-R, AQ11 = Paradise Korea-Western Aphasia Battery (Revised), Aphasia Quotient; EDH12 = Epidural Hemorrhage; SDH13 = Subdural Hemorrhage; AMR14 = Alternating Motion Rate; SMR15 = Sequential Motion Rate (The table adopted and modified from Kim & Kim, 2019).

Table 2.

Order of cue presentation

Participant number Order of cue presentation
P11 NC3→AC4→CC5
P2 NC→AC→CC
P3 NC→CC→AC
P4 NC→CC→AC
P5 NC→AC→CC
P6 NC→CC→AC
P7 NC→AC→CC
P8 NC→CC→AC
C12 NC→AC→CC
C2 NC→CC→AC
C3 NC→CC→AC
C4 NC→AC→CC
C5 NC→CC→AC
C6 NC→CC→AC
C7 NC→AC→CC
C8 NC→AC→CC

P1 = Patient; C2 = Control; NC3 = No Cue Condition; AC4 = Abstract Cue Condition; CC5 = Concrete Cue Condition.

Table 3.

Group comparison: Mann Whitney-U nonparametric test results

NHI (N = 8)
IWD (N = 8)
Statistics
Median IQR Median IQR p-value
The first vowel /a/ f0
 NC 110.69 9.96 123.04 34.47 .046*
 CC 115.96 18.47 123.54 36.80 .462
 AC 115.26 18.70 123.08 51.47 .248
Total syllable f0
 NC 110.20 12.08 132.60 29.88 .016*
 CC 115.55 23.84 132.34 30.94 .208
 AC 117.42 18.79 133.98 38.84 .115
Vowel duration
 NC .43 .16 .73 .46 .009*
 CC .74 .18 .87 .57 .345
 AC .60 .18 .76 .36 .248
Syllable duration
 NC .63 .17 1.06 .57 .002*
 CC .96 .22 1.23 .65 .172
 AC .78 .24 1.01 .54 .141
Closure duration
 NC .13 .10 .18 .12 .002*
 CC .14 .10 .22 .21 .036*
 AC .15 .11 .18 .16 .093
Aspiration duration
 NC .04 .06 .04 .06 .401
 CC .04 .07 .04 .07 .345
 AC .04 .07 .04 .06 .294
Closure duration ratio
 NC .71 .27 .82 .25 .345
 CC .70 .30 .83 .25 .046*
 AC .73 .28 .78 .23 .529
F1 C/V ratio
 NC .86 .17 .88 .42 .093
 CC .87 .14 .83 .27 .753
 AC .86 .15 .87 .35 .600
F2 C/V ratio
 NC 1.04 .20 1.20 .41 .036*
 CC 1.04 .21 1.14 .34 .141
 AC 1.06 .18 1.19 .45 .059
F2 slope
 NC -.74 3.60 -2.39 3.83 .046*
 CC -.60 2.81 -1.44 3.14 .172
 AC -.87 2.67 -2.25 3.84 .093

NC= No Cue Condition; CC= Concrete Cue Condition; AC= Abstract Cue Condition; IQR= Interquartile Range; NHI= Normal Healthy Individuals; IWD= Individuals with Dysarthria; f0 = Fundamental Frequency; C/V= Consonant to Vowel Ratio; F1= The First Formant; F2= The Second Formant.

*

p < .05.

Table 4.

Cue condition comparison: Friedman nonparametric test results

Cue conditions
NC
CC
AC
Statistics
Parameter names Median IQR Median IQR Median IQR p-value
NHI
The first vowel /a/ f0 110.69 9.96 115.96 18.47 115.26 18.7 .002*
Total syllable f0 110.2 12.08 115.55 23.84 117.42 18.79 .044*
Vowel duration .43 .16 .74 .18 .60 .18 .002*
Syllable duration .63 .17 .96 .22 .78 .24 .002*
Closure duration .13 .10 .14 .10 .15 .11 .044*
Aspiration duration .04 .06 .04 .07 .04 .07 .607
Closure duration ratio .71 .27 .70 .30 .73 .28 .882
F1 C/V ratio .86 .17 .87 .14 .86 .15 .417
F2 C/V ratio 1.04 .20 1.04 .21 1.06 .18 .882
F2 slope -.74 3.6 -.6 2.81 -.87 2.67 1
IWD
The first vowel /a/ f0 123.04 34.47 123.54 36.8 123.08 51.47 .882
Total syllable f0 132.6 29.88 132.34 30.94 133.98 38.84 .417
Vowel duration .73 .46 .87 .57 .76 .36 .002*
Syllable duration 1.06 .57 1.23 .65 1.01 .54 .002*
Closure duration .18 .12 .22 .21 .18 .16 .687
Aspiration duration .04 .06 .04 .07 .04 .06 .607
Closure duration ratio .82 .25 .83 .25 .78 .23 .03*
F1 C/V ratio .88 .42 .83 .27 .87 .35 .223
F2 C/V ratio 1.2 .41 1.14 .34 1.19 .45 .882
F2 slope -2.39 3.83 -1.44 3.14 -2.25 3.84 .417

NC= No Cue Condition; CC= Concrete Cue Condition; AC= Abstract Cue Condition; IQR= Interquartile Range; NHI= Normal Healthy Individuals; IWD= Individuals with Dysarthria; f0 = Fundamental Frequency; C/V= Consonant to Vowel Ratio; F1= The First Formant; F2= The Second Formant.

*

p < .05.