| Home | E-Submission | Sitemap | Contact Us |  
top_img
Commun Sci Disord > Volume 29(1); 2024 > Article
반폐쇄성도훈련법의 진동원과 수행시간이 정상 성인의 음성에 미치는 효과

초록

배경 및 목적

본 연구에서는 SOVTE의 진동원과 수행시간이 정상 성인의 음성에 미치는 효과를 알아보고자 하였다. 또한 새로 제안된 VHFO 중재의 안전성을 확인하고 VHFO 수행의 기초자료를 제공하고자 하였다.

방법

연구대상은 음성적 문제가 없는 정상 음성 사용자 34명(남 8, 여 26, 23.00±2.06세)이었다. VHFO, SP를 수행하는 동안 발성의 특성을 알아보기 위해 음성신호를 SOVTE 수행 전(M0), 1분간 수행 후(M1), 3분간 수행 후(M3)의 세 시점에서 기록하였다. 녹음된 음성샘플은 CSL의 MDVP과 ADSV, EGG, Praat 등을 이용하여 분석하였다. 대상자의 주관적 음성 중증도와 주관적 음성피로를 측정하는 문항을 통해 심리측정적 평가를 실시하였다.

결과

VHFO와 SP간 평균 발성 횟수와 회당 발성 지속시간에서 통계적으로 유의한 차이는 없었다. 음향학적 평가 결과, VHFO에서는 기초선에 비교하였을 때 1분 및 3분간 수행 후 CPPv가 유의하게 증가하였고 APSID가 유의하게 감소하였다. 심리측정적 평가와 전기성문파형 검사 측정치에서는 VHFO와 SP 모두 유의한 차이를 보인 변수는 없었다.

논의 및 결론

연구결과 VHFO 중재의 안전성을 객관적으로 확인하였다. 본 연구는 후속연구에서 음성장애 환자군을 위한 최적의 VHFO 치료 계획을 설정하고 프로그램을 구성하는 기초 데이터를 제시하였다는 데에 임상적인 의의가 있다.

Abstract

Objectives

This study aimed to explore the impact of semi-occluded vocal tract exercises (SOVTE) with varied vibration sources and durations on the vocal performance of healthy adults. In addition, we sought to confirm the safety of voiced high-frequency oscillation (VHFO) intervention and provide basic data for performances in relation to straw phonation (SP).

Methods

The study included 34 healthy adults with no vocal impairments, comprising 8 males and 26 females. The mean age of the participants was 23.00±2.06 years. To assess vocal characteristics during VHFO and SP, voice samples were recorded at three specific time points: prior to performing SOVTE (M0), after 1 minute of exercise (M1), and after 3 minutes of exercise (M3). Cepstral, perturbation, electroglottographic analyses were conducted on the recorded samples of vowel and sentences. Psychometric evaluation was conducted using questionnaires to gauge the self-reported severity of voice and vocal fatigue.

Results

No statistically significant differences were observed in the average number of performances or duration per phonation between the two methods. When compared to baseline, CPPV significantly increased after 1 minute and 3 minutes of performance and Acoustic Psychometric Severity Index of Dysphonia decreased after 3 minutes of performance in VHFO. Both methods exhibited no significant differences in terms of psychometric and electroglottographic measurements.

Conclusion

Results objectively confirmed the safety of VHFO intervention. This study is clinically significant as it lays the groundwork for future development of optimal treatment regimens and therapeutic programs for voice disorder patients, using foundational data on VHFO.

음성장애는 성대, 호흡기관, 성도의 구조적, 기능적 이상으로 인해 음도, 음량, 음질의 변화를 초래하는 말 장애의 한 유형이다. 이러한 음성장애의 중재를 위해서는 수술적 치료, 약물적 치료, 행동적 치료 등이 주로 사용된다. 그중 행동적 치료인 음성치료는 다른 치료법과 병행하여 사용되기도 하고 개별적으로 사용되기도 하는데, 특히 위의 다양한 병인들 중에서 기능적 음성문제를 가진 대상자의 경우 초기에 치료를 진행할 경우 예후가 좋으며 단기간의 음성치료로도 큰 개선을 보인다(Suh et al., 2006).
다양한 음성치료 중에서도 특히 호흡, 공명, 발성의 협응에 초점을 맞춘 총체적인 기법 중 하나인 반폐쇄성도훈련(semi-occluded vocal tract exercise, SOVTE)이 최근 임상에서 많이 사용된다. SOVTE는 음성장애 환자의 과긴장을 감소시키고 음질을 개선시키는 음성치료기법으로 최근 임상에서 효과적으로 사용되고 있다(Andrade et al., 2014; Balandat, 2017; Kim, 2019). SOVTE의 원리를 살펴보면, 성도의 일부분, 특히 앞부분을 일부 폐쇄하고 발성하게 되면 성문 상압이 높아지면서 배압(back pressure)이 높아져 양측 성대가 약간 외전되는데, 이로 인해 성문과 성문상부 튜브 간의 임피던스(impedance)의 매칭이 개선된다. 이로 인해 발성에 필요한 발성 역치압력(phonation threshold pressure, PTP)이 감소하며, 성문의 최대유량감소율(maximum flow declination rate, MFDR)이 비선형적으로 증가되어 음성강도가 증가하는 것이다. 이로 인해 성대의 과접촉을 방지하여 성대 조직 손상이 감소하고 적은 노력으로 보다 효율적인 발성이 가능한 상태가 된다(Titze, 2006; Hijleh & Pinto, 2021).
SOVTE는 진동원의 종류에 따라 크게 두 가지 유형으로 나누어 볼 수 있다. 성대 진동만을 유일한 진동원으로 가지는 단일진동원(single source)에는 손으로 입 가리고 발성하기, 빨대 발성(straw phonation, SP) 등이 해당하는 반면, 입술트릴, 물저항빨대발성(water resistance therapy, WRT) 등은 성대뿐만 아니라 다른 부분이 동시에 진동하는 이중진동원(double source)을 갖는다(Kim et al., 2017; Lim, Choi, Kim, & Choi, 2016; Titze, 2006). 단일진동원 치료로는 주로 SP가, 이중진동원 치료로는 주로 WRT 방법에 해당되는 Lax Vox를 중심으로 많은 국내외연구가 이루어졌다. SP는 빨대를 구하기 쉽고 비용이 저렴하나, 빨대의 규격에 많은 영향을 받는다. Lax Vox 또한 재료를 구하기는 비교적 쉽지만 물병의 크기와 물의 양에 따라 효과가 달라지고, 튜브를 집어넣는 깊이를 환자가 적절하게 모니터링하기 쉽지 않다. 또한 튜브를 통해 나온 기류가 물병에서 물방울을 튀게 만들어 감염관리에 어려움이 있을 수 있다(Köberlein et al., 2022).
최근에 소개되고 있는 발성 고주파 진동(수동식 흉벽진동기, Voiced High-frequency oscillation, VHFO)은 호기 흐름을 방해하여 진동을 일으키는 원뿔과 스테인리스 스틸 구체로 구성된 밸브를 가지고 있는 호기 양압 진동 장치(oscillatory positive expiratory pressure device, OPEP device)를 통하여 발성을 하도록 하는 것을 말하며, 이중진동원을 갖는 SOVTE의 하나라 할 수 있다. OPEP 장치는 본래는 기류의 진동을 사용하여 하부 기도 분비물 제거를 목적으로 흔히 사용되는 장치이다(Hardy & Andreson, 1996). 그러나 정상 성인과 발성장애를 대상으로 3분 동안 VHFO를 수행한 선행 연구(Saters et al., 2018)에서 3분간 이 장치를 이용한 음성치료를 하도록 하였을 때 음성에 긍정적인 영향을 미친다는 결과가 보고되었다. 다만 국내에서는 아직 정상인 혹은 음성장애 환자를 대상으로 이를 활용하여 기존의 SOVTE와 비교를 통해 음성에 미치는 효과성을 알아보거나, 음질이 오히려 악화될 가능성이 있는지 확인한 연구가 전무한 실정이다. 이러한 맥락에서 정상인이 임상에서 널리 활용되는 SP와 VHFO를 수행하였을 때 수행시간에 따라 음성에 어떠한 효과가 나타나는지를 객관적으로 확인할 필요가 있다.
반폐쇄성도훈련의 수행시간과 관련하여 어느 정도의 시간 동안 수행을 해야 적절한지에 대해서도 아직은 완전하게 통일된 견해가 없다(Tetik-Hacıtahiroğlu & Düzenli-Öztürk, 2023). 이것이 중요한 이유는 과다하게 긴 시간 동안 수행하였을 때 도리어 음성의 질에 악영향을 미치거나 음성피로를 유발할 가능성을 배제할 수 없기 때문이다. 또한 임상에서의 활발한 활용과 근거기반 중재를 위해서는 먼저 정상 음성을 가진 성인에게 이 치료법을 사용한 훈련을 실시할 때 발성하게 되는 평균 횟수, 1회 호흡으로 발성하게 되는 평균 시간, 발성 시 기본주파수, 음량 및 표준편차, 평균 성문폐쇄율(closed quotient, CQ) 등을 통해 기준이 되는 시행 방법이나 적절한 훈련량에 대한 기초정보를 제공하여 환자 치료 계획 마련에 기여할 필요가 있다. 해외 음성장애 분야 연구에서도 정상인들을 먼저 연구대상으로 삼아 SOVTE를 수행하였을 때 음성의 질이 악화되지 않는지, 즉 안전성을 갖추고 있는지를 검증하고 발성의 특성을 살펴 본 연구들이 다수 존재하나(Christmann & Cielo, 2017; da Silva Antonetti, Ribeiro, Moreira, Brasolotto, & Silverio, 2019; Fadel et al., 2016; Tetik-Hacıtahiroğlu & Düzenli-Öztürk, 2023), 국내외 음성치료기법들에 대한 선행연구들 중에는 실제 임상에서 의 사용과 치료프로그램 구축을 위한 이러한 기초정보를 제공한 연구는 찾아보기가 어려운 실정이다. 따라서 이 연구에서는 새로 제안된 VHFO와 기존 임상에서 자주 사용되는 SP를 수행시간에 따라 즉각적인 효과를 살펴봄으로써 정상 성인의 음성에 미치는 효과를 알아보고 VHFO의 안전성을 확인하고자 하였다.

연구방법

연구대상

본 연구는 음성적 문제가 없는 정상 음성 사용자 34명(남 8, 여 26, 연령 23.00±2.06세)을 대상으로 하였다. 본 연구에 참여한 대상자들은 대부분 대학생 또는 대학원생이었으며, 음성에 영향을 줄 수 있는 호르몬, 호흡기 등의 문제, 소화기 문제, 신경학적 및 질병 관련 문제가 없고, 최근 3개월간 흡연력이 보고되지 않은 자, 검사 시점을 기준으로 하여 최근 3개월간 음성문제를 주소로 이비인후과를 방문한 경험이 없다고 보고한 자, 청지각적 평가(GRBAS)에서 G척도가 0인 정상 범주의 측정치를 보이는 자를 대상으로 하였다(Hirano, 1981; Lee, Lee, Lim, & Choi, 2017). 평가 예약 후 평가 당일 상기도 감염 증상이 있는 자는 제외하였다. 청지각적 평가는 논문의 제1저자인 2급 언어재활사 1인과 언어병리학 전공 교수 1인(교신저자)이 GRBAS scale을 사용하여 대상자의 음성을 4점 척도(0: clear, 1: mild, 2: moderate, 3: severe)로 평가하였다.

연구절차

본 연구는 한림대학교 생명윤리위원회의 승인을 받았다(HIRB-2023-032-R). 각 대상자에 대하여 VHFO, SP를 수행하는 동안 발성의 특성을 알아보기 위해 각 진동원별 SOVTE 수행 전(M0), 1분간 수행 후(M1), 3분간 수행 후(M3)의 세 시점에서 음성신호를 기록하였다. 이전 효과의 간섭을 소거하기 위해 M1-M3 사이에 15분간 음성휴식을 진행하였다. 각 대상자에게 VHFO와 SP를 모두 시행하도록 하되, 이때 처음 실시한 SOVTE의 잔여효과를 최대한 배제하고자 대상자에게 일주일 이상의 휴지기(wash-out stage)를 거친 후 다른 SOVTE 방법을 실시하였다(da Silva Antonetti, Ribeiro, Brasolotto, & Silverio, 2022). 두 가지 방법의 SOVTE를 수행하는 순서는 무작위로 배치하였다.
본 연구의 핵심과제인 SOVTE의 수행 절차는 다음과 같다. SOVTE를 수행할 때 대상자들은 목과 어깨가 이완된 상태로 편안하게 앉아 정상적으로 호흡하되, 등받이에 기대지 않고 머리를 기울이지 않도록 지시하였다. VHFO 수행 시 ㈜제민이엔지 사의 ‘청폐88’ 수동식 흉벽진동기(https://청폐88.kr)를 사용하였다(Figure 1). 해당 기구는 본래 폐 내의 점액 침전물을 배출하고자 고안된 기구로서, 원통형 몸체에 입술을 대고 바람을 불어넣거나 발성을 할 수 있는 마우스 피스가 연결되어 있고, 몸체 내에는 원뿔 구조 위에 스테인리스 공이 얹혀져 있으며, 윗부분에 작은 구멍이 뚫린 덮개로 덮여있는 구조이다. 기류를 불어넣게 되면 기류가 스테인리스 공을 들어올려 덮개의 구멍으로 빠져나가고, 기류가 약해지면 다시 스테인리스 공이 원위치되며 원뿔을 덮는 과정이 반복되어 결국 기류의 변동(fluctuation)이 일어난다. 이와 같은 원리로 발성 시 성도 전반부의 구강내압의 변동이 유도되어 이중진동원을 가진 SOVTE의 시행이 가능해지는 것이다.
각 대상자에게는 장치를 지면과 평행하게 유지한 상태로 한 손으로 잡고 노즐을 입술에 댄 후, 우선적으로 소리를 내지 않고 뺨을 부풀리지 않도록 한 다음 장치에 공기만 불어넣어 스테인리스 볼의 진동을 느끼도록 하였다. 이후 노즐을 입술에 댄 후 뺨을 부풀리지 않고 습관적인 음높이와 크기로 /ㅜ/소리를 산출하여 스테인리스 공의 진동을 느끼도록 하였다. 이때 공이 진동하는 소리가 아닌 바람 새는 소리가 난 경우, 수행을 멈추고 볼을 부풀리지 않고 수행하도록 안내하였다. 또한 숨을 모두 내쉬기 전에 수행을 멈추고 흡기한 후 반복적으로 수행하게 하였다. 한편 SP 수행 시에는 지름이 3 mm, 길이 14 cm인 빨대를 입술로 물고 습관적 음도와 강도로 /ㅜ/ 모음 발성을 하되, 빨대를 통해서만 공기가 흐르도록 하였다(Manjunatha, Nayak, & Bhat, 2022). 피로감이 느껴질 경우 발성을 멈추고 편안하게 호흡하여 호흡이 안정된 뒤에 재수행하도록 하였다(Figure 2).
음성평가의 절차는 다음과 같다. 먼저 사전면담을 통해 대상자의 음성과 밀접한 관련이 있는 개인정보 수집을 위해 성명, 성별, 생년월, 전문적 음성사용 여부 등의 정보를 수집하였다. 음향학적 평가에 사용된 장치는 Computerized Speech Lab (CSL model 4150B; KayPENTAX, Lincoln Park, NJ, USA)이며 녹음에 사용된 마이크는 컨덴서 마이크(Perception 420, AKG Acoustics Inc., Vienna, Austria)였다. 음성샘플 수집을 위해 소음이 통제된 방음부스 환경에서 입과 마이크를 10 cm 정도 띄우고, 편안한 음도와 강도에서 모음 /ㅏ/연장발성과 ‘가을 문단’ 읽기(Kim, 2012)를 실시하도록 하였다. 매 대상자의 음성 검사 세션 이후에는 방음부스 내 감염 관리를 위해 환기 및 소독 방역을 철저히 시행하였다. 소음이 통제된 부스 내에서 녹음하였으므로 P420은 무지향성(omnidirectional) 으로 설정하고, 로우컷 필터(low-cut filter, LCF)는 off로 설정하였다. 전기성문파형검사(electroglottography, EGG)에 사용된 장치는 CSL의 Real-Time EGG Analysis (Model 5138 ver 3.4.1, Kay-PENTAX, USA)와 EGG 하드웨어(Model 5103, KayPENTAX, USA)이다. EGG 검사를 위해 벨크로를 이용하여 갑상연골이 위치한 목 주위 피부에 사전에 알코올솜으로 소독 후 건조시킨 EGG 전극을 부착시킨 후 검사를 진행하였다. 심리측정적 평가로는 한국판 음성 활동 및 참여 프로파일(Korean version of the Voice Activity and Participation Profile, K-VAPP)의 1번 문항에 해당되는 ‘목소리 문제의 심각한 정도(Severity)’를 시행하였고, Severity의 문항 내용에 준하여 ‘음성피로’의 정도를 묻는 문항을 1개 구성하여 함께 시행하였다. 두 문항 모두 K-VAPP의 시행방법에 따라 0-10점의 11점 척도를 이용하여 자기보고를 수행하도록 하였다. 이때 0점은 ‘정상이다’, 10점은 ‘심각하다’를 의미하였다(Lee et al., 2016).

자료분석

각 진동원별 수행 분석을 위해 SOVTE 수행 중 녹음된 샘플은 CSL의 Real-Time Pitch (RTP, Model 5121, KayPENTAX, USA)와 EGG, Praat 프로그램을 이용하여 분석하였다. RTP의 발성구간 선택과 분석을 통해 평균 수행횟수와 회당 지속시간, 1회 발성 지속시간, 구간 내 음도의 평균과 표준편차, 구간 내 음량의 평균과 표준편차를 분석하였다. Praat을 통해서는 음성 샘플의 스펙트로그램 상 배음 구조 변화 양상을 확인하였다. 스펙트로그램의 Window length는 0.05 sec, dynamic range는 70 dB로 설정하였다.
녹음된 음성샘플(모음 /ㅏ/ 4초 발성, 가을 문단의 두 번째 문장)은 Computerized Speech Lab (Model 4150B; KayPENTAX, Lincoln Park, NJ, USA)의 MDVP (Model 5105; KayPentax, NJ, USA)와 Analysis of Dysphonia in Speech and Voice (Model 5109; Kay-PENTAX, Montvale, NJ, USA)를 이용하여 분석하였다. 모음샘플은 MDVP와 ADSV, EGG 분석을, 문장 샘플은 ADSV, EGG 분석을 진행하였다. 각 시점에서의 발성이 평상시의 발성으로 이루어졌음을 확인하고 음질의 변화를 살펴보기 위하여 MDVP를 사용하여 기본주파수(average fundamental frequency, F0), 주파수변동률(jitter percent, Jitt), 진폭변동률(shimmer percent, Shim), 소음 대배음비(noise-to-harmonic ratio, NHR)를, ADSV를 사용하여 각 과제에 대해 켑스트럼 피크 현저성(cepstral peak prominence, CPP), L/H 스펙트럼 비율(L/H spectral ratio, SR), 그리고 각 표준편차를 분석하고, 분석치와 설문 점수 등을 이용하여 모음과 문장의 스펙트럼 켑스트럼 발성장애 지수(Cepstral Spectral Index of Dysphonia, CSID)와 음향학적 심리측정적 발성장애 중증도 지수(Acoustic Psychometric Severity Index of Dysphonia, APSID)를 계산하였다(Lee, Choi, & Kim, 2021). EGG를 통해서는 CQ와 CQ의 표준편차를 분석하였다.

통계분석

본 연구에서 수집된 자료는 통계분석 프로그램인 SPSS version 26.0 (IBM Co., New York, NY, USA)을 이용하여 반폐쇄성도훈련의 수행시간에 따른 음향학적 평가, 전기성문파형검사, 심리측정적 평가의 차이를 살펴보기 위해 각 진동원별로 반복측정 분산분석(repeated measures of ANOVA)을 실시하였다. 본 연구의 목적은 SP와 VHFO의 치료효과를 환자군에서 비교하는 것이 아니라 수행시간에 따른 효과성과 안전성 검증이었으므로, 두 방법 간의 비교를 위한 이원 반복측정 분산분석을 실시하지는 않았다. 다만 각 진동원별 수행횟수와 지속시간의 비교를 위해 대응표본 t검정(paired t-test)을 실시하였다.

연구결과

각 진동원별 수행 결과

수행시간에 따른 VHFO와 SP의 평균 수행횟수와 회당 지속시간을 분석한 결과가 Table 1에 제시되어 있다. 두 방법 간의 통계적 유의성을 검정한 결과, 통계적으로 유의한 차이는 없었다.
Praat에서 한 여성 대상자가 수행한 두 방법의 스펙트로그램 예시를 살펴보면, Figure 3과 같다. VHFO에서는 배음의 구조와 음도(파란색 선), 강도(노란색 선)가 비교적 큰 폭으로 변화하며 진동하는 반면, SP에서는 음도와 강도가 비교적 안정적으로 일정하게 유지되는 것을 관찰할 수 있다.

각 진동원별 수행시간에 따른 음향학적 측정치 비교

수행시간에 따른 VHFO의 음향학적 측정치를 비교한 표가 Table 2에 제시되어 있다. VHFO의 수행시간에 따른 음향학적 측정치에 대해 반복측정 분산분석을 실시한 결과, 수행 후 모음연장발성의 CPP와(F=3.621, p=.032), APSID 측정치에서 유의한 차이가 있었다(F=3.592, p=.033). 수행시간에 따른 CPPV와 APSID의 변화를 나타낸 그래프가 Figure 4Figure 5에 제시되어 있다. CPPV 의 사후검정 결과 M0와 M1 (p=.023), M0와 M3 간 차이는 유의하였으나(p=.030), M1과 M3 간 차이는 유의하지 않았다(p=.831). APSID의 경우에도 M0와 M1 (p=.045), M0와 M3 간 차이는 유의하였으나(p=.029), M1과 M3 간 차이는 유의하지 않았다(p=.428).
수행시간에 따른 SP의 음향학적 측정치를 비교한 표가 Table 3에 제시되어 있다. SP의 수행시간에 따른 음향학적 측정치에 대해 반복측정 분산분석을 실시한 결과, 모든 변수에서 유의한 차이가 없었다(p>.05).

각 진동원별 수행시간에 따른 심리측정적 측정치 비교

수행시간에 따른 VHFO의 심리측정적 측정치를 비교한 표가 Table 4에 제시되어 있다. 각 측정치는 0-10점으로 10점에 가까울수록 주관적인 음성 중증도와 음성피로도가 높음을 의미한다. VHFO의 수행시간에 따른 심리측정적 측정치에 대해 반복측정 분산분석을 실시한 결과, 모든 변수에서 유의한 차이가 없었다(p>.05).
수행시간에 따른 SP의 심리측정적 측정치를 비교한 표가 Table 5에 제시되어 있다. SP의 수행시간에 따른 심리측정적 측정치에 대해 반복측정 분산분석을 실시한 결과, 모든 변수에서 유의한 차이가 없었다(p>.05).

각 진동원별 수행시간에 따른 전기성문파형검사 측정치 비교

전기성문파형 측정치 분석 시 EGG signal의 유의미한 캡처에 어려움이 있는 경우 분석에서 제외하였다. 수행시간에 따른 VHFO의 전기성문파형 측정치를 비교한 표가 Table 6에 제시되어 있다. VHFO의 수행시간에 따른 전기성문파형 측정치에 대해 반복측정 분산분석을 실시한 결과, 모든 변수에서 유의한 차이가 없었다(p>.05).
수행시간에 따른 SP의 전기성문파형 측정치를 비교한 표가 Table 7에 제시되어 있다. SP의 수행시간에 따른 전기성문파형 측정치에 대해 반복측정 분산분석을 실시한 결과, 모든 변수에서 유의한 차이가 없었다(p>.05).

논의 및 결론

본 연구에서는 서로 다른 진동원과 지속시간의 반폐쇄성도훈련법이 건강한 성인의 음성에 미치는 효과를 살펴보았다. 이를 위해 정상 음성을 가진 성인을 대상으로 VHFO와 SP를 이용해 수행 전, 1분간 수행 후, 3분간 수행 후에 음향학적 평가, 심리측정적 평가, 전기성문파형 검사를 실시하여 효과를 비교하였다. 연구결과, VHFO를 실시하였을 때 음향학적 평가 중 모음연장 발성의 CPP 측정치가 유의하게 증가하였고, APSID가 유의하게 감소하였다. 이와 같은 결과를 종합해보면, 정상 음성을 가진 성인에서 VHFO 중 재의 안전성이 객관적으로 확인되었다고 할 수 있다.
먼저 각 진동원별 SOVTE 실시 전후 음향학적 평가를 실시한 결과, SP와 VHFO 모두 수행 시간에 따른 차이가 없는 변수들이 대부분을 차지하였다. 이는 대상자가 정상 음성 사용자임을 고려하였을 때 예측 가능한 결과였으며, 선행연구의 결과와도 일치한다. 정상 음성을 가진 대상자에게 VHFO와 Lax Vox를 이용하여 즉각적인 효과를 확인한 선행연구(da Silva Antonetti et al., 2019)에서도 여성의 vF0 (fundamental frequency variability)의 증가 외엔 음향학적 측정치의 유의한 차이는 나타나지 않았다. Piragibe 등(2019)에서도 정상 음성을 가진 여성 노인에게 3분간 VHFO를 실시하였을 때 음향학적 측정치의 유의한 차이는 나타나지 않았다. 이와 같은 결과는 두 가지 SOVTE 방법 모두 3분 동안 수행하여도 유의하게 음성의 질을 악화시키는 일은 발생하지 않는다는 점을 검증한 것이라 할 수 있다.
SP에서와는 달리 VHFO를 수행한 후 유의하게 개선된 변수들이 있었다. 이 변수들은 모음연장 발성 시의 CPP (CPPV)와 APSID였으며 각각 음성의 질을 나타내는 핵심 변수인 켑스트럼 피크 현저성과 음향학적 심리측정적 발성장애 중증도 지수를 뜻한다. 이는 변화가 없었던 다른 변수들과는 다르게 VHFO에서만 관찰된 결과이다. 더군다나 대상자들이 정상 음성을 가진 대상자들이었다는 점에서 음질관련 변수와 중증도 지수가 변화한 것은 더욱 흥미롭다. da Silva Antonetti 등(2022)의 연구에서는 VHFO를 3분간 수행한 후에 모음연장 발성의 평활화된 CPP (smoothed CPP)는 유의한 결과를 보이진 않았으나, 숫자세기의 평활화된 CPP가 증가하였다고 보고하여 본 연구의 결과를 일부 뒷받침해주었다. 본 연구에서는 가을문단의 CPP는 유의한 결과를 나타내지는 않았는데, 이러한 차이는 말자료에 기인했을 가능성이 있으나 정확한 원인규명을 위해서는 후속연구가 필요할 것으로 사료된다. 대부분의 선행 연구에서 기본적인 F0, Jitt, Shim, NHR 위주의 전통적인 음향변수에 대해서만 음성 분석만을 실시하였으며, CPP와 APSID의 분석 결과를 제공한 연구는 위에서 언급한 선행연구를 제외하고는 찾아보기가 어려웠다. 따라서 이에 대한 해석은 쉽지 않으나, 음질 관련 수치인 CPP가 증가하고 중증도 지수인 APSID가 감소한 것을 보아 VHFO가 음질 개선에 긍정적인 영향을 준 것으로 해석된다. 특히 주목할만한 것은 1분간만 VHFO를 수행해도 이 두 측정치의 개선이 나타났으며, 3분간 수행한 뒤에도 유지가 된 점이다. 이는 VHFO를 3분간 수행 후 결과는 1분간 수행 후 결과와 유지되거나 악화되었으므로 최적의 수행시간은 1분이라는 선행연구(da Silva Antonetti et al., 2022)의 결과와 일치하였다. 즉 1분간만 수행해도 3분간 수행한 것과 크게 다르지 않은 효과가 나타난다는 점에서 VFHO는 시간 대비 효율성이 뛰어나 일상에서도 활용하기 용이한 방법이라고 할 수 있다. 이러한 부분은 임상에서 환자의 치료 순응도에도 긍정적인 영향을 미치고, 나아가 치료 효과의 일반화에도 영향을 줄 수 있다.
각 진동원별 SOVTE를 수행할 때 평균 발성 횟수와 회당 발성 지속시간에서 통계적으로 유의한 차이는 없었다. 또한 각 진동원별 SOVTE를 수행할 때 평균 발성 횟수와 회당 발성 지속시간에서 유의한 차이는 없었다. 이는 동일한 사람이 두 가지 방법의 SOVTE를 수행할 때 진동원의 종류와 무관하게 평균적으로 1회의 호흡으로 수행하는 지속시간이나 특정 시간 동안 수행하는 횟수는 다르지 않다는 점을 시사하며, 이는 VHFO가 기존의 SOVTE와 비교했을 때 수행 시 과도한 호흡적 노력을 요구하지 않는다고 해석할 수 있다. 이러한 결과는 정상군에서 수행한 데이터를 제시함으로써 추후 후속연구에서 환자군에서의 최적의 치료 계획을 설정하고 프로그램을 구성할 때 참고할 수 있는 기초 데이터로 활용될 수 있을 것이다.
결론적으로 본 연구를 통하여 SP와 VHFO를 수행하였을 때 수행 시간에 따른 차이가 없는 변수들이 대부분이었으며 다른 한편으로 3분간 실시하였을 때에도 음향학적 측정치가 악화되지 않았으므로 SP와 VHFO 모두 3분간 수행 시 음성의 질이 유지된다는 점을 검증한 것이라 할 수 있다. VHFO에서 1분간 수행 후 CPP가 유의하게 증가하였고 APSID가 유의하게 감소하였으며, 3분 수행 후에도 유지되었는데, 이는 VHFO가 음질 개선에 긍정적인 영향을 준 것으로 여겨진다. 또한 SOVTE를 수행할 때의 기초 데이터를 제공함으로써 환자에게 적용가능한 규격화된 치료 프로그램 설정 시 활용 가능한 참고자료를 마련하였으며, 규격화된 치료 프로그램 설정을 통해 숙련도가 낮은 언어재활사도 비교적 쉽게 치료를 적용할 수 있는 토대를 일부 마련하였다는 점에서 본 연구의 의의를 찾을 수 있다. 연구를 진행하면서 일부 대상자들은 VHFO를 수행할 때에 규격화된 장치로 인해 SP보다 수행이 더 쉽고 스테인리스 볼이 진동하면서 시각적, 촉각적 피드백을 주어 셀프 모니터링에 도움이 되었다는 등의 의견을 제시하여 이와 같은 효용성을 뒷받침해주었다.
다만 본 연구는 정상 음성 사용자를 대상으로 진행하였음에도 그 수가 다소 적기 때문에 추후 연구에서는 더 많은 대상자를 대상으로 연구를 진행할 필요가 있다. 또한 본 연구의 대상자는 남성 8명, 여성 26명으로 여성의 비율이 약 3배 정도로 높았다. 남성과 여성의 음성 특성이 다르고 VHFO에 따른 변화 양상이 상이할 수 있으므로 추후 연구에서는 남녀 성비를 고려하여 연구를 진행할 필요가 있으며, 각 음성장애마다 성비 분포가 다르다는 점을 고려하여 각 성별에 따른 효과의 차이도 검증할 필요가 있다. 전기성문파형 검사의 결과 분석 시 일부 대상자에서 EGG 신호의 신뢰성 있는 감지가 어려워 대상에서 제외되었으므로, 보다 정확한 분석 결과를 확인하기 위해서는 이러한 요인들을 고려하여 조심스럽게 대상자를 선정하고 결과를 해석할 필요가 있다. 본 연구에서는 정상 음성 사용자를 대상으로 SOVTE의 수행시간을 1분간, 3분간으로 제한하여 수행하였는데, 음성장애군에서 SOVTE의 효과가 나타나기 위해서는 그 이상의 시간이 필요할 수 있으므로 추후 수행시간 설정 시 이를 고려해야 할 필요가 있다. 또한 1분간, 3분간 수행 시 이전효과의 간섭효과를 최대한 피하기 위해 15분간 음성휴식을 진행하였는데, 음성휴식만으로는 이전 효과의 간섭을 완벽하게 통제하였다고 볼 수 없기에 보다 정확한 분석 결과를 확인하기 위해서는 이러한 요인들을 고려하여야 할 필요가 있다.
마지막으로 본 연구에서는 정상 음성 사용자를 대상으로 연구를 진행하였는데, 추후 VHFO를 사용하여 음성피로 혹은 기능적 음성장애가 있는 환자를 대상으로 연구를 진행한다면 임상에서의 활발한 활용과 근거기반 중재를 위한 토대를 마련할 수 있을 것으로 판단된다. 아울러 이러한 VHFO 수행 시 나타나는 즉각적인 효과가 일반화로 이어질 수 있는지에 대한 연구를 함께 진행할 필요가 있다.

Figure 1.
Appearance and internal structure of the OPEP device for VHFO (https://청폐88.kr).
OPEP= oscillatory positive expiratory pressure device; VHFO= voiced high-frequency oscillation.
csd-29-1-160f1.jpg
Figure 2.
Examples of VHFO and SP performances.
VHFO= voiced high-frequency oscillation; SP= straw phonation.
csd-29-1-160f2.jpg
Figure 3.
Examples of the spectrographic analyses of a female participant’s VHFO (Lt.) and SP (Rt.) performances.
VHFO= voiced high-frequency oscillation; SP= straw phonation.
csd-29-1-160f3.jpg
Figure 4.
Comparison of CPPV according to performance time.
CPPV = CPP of vowel /a/; M0 (Moment 0)= before SOVTE; M1 (Moment 1)= SOVTE for 1 minute; M3 (Moment 3)= SOVTE for 3 minutes.
*p < .05.
csd-29-1-160f4.jpg
Figure 5.
Comparison of APSID according to performance time.
APSID= Acoustic Psychometric Severity Index of Dysphonia; M0 (Moment 0)= before SOVTE; M1 (Moment 1)= SOVTE for 1 minute; M3 (Moment 3)= SOVTE for 3 minutes.
*p < .05.
csd-29-1-160f5.jpg
Table 1.
Comparison between VHFO and SP according to performance time
Parameters Duration
t p
M1 M3
Mean number of performances
 VHFO 6.30 ± 2.18 18.64 ± 6.30 -1.348 .192
 SP 6.78 ± 1.97 17.73 ± 5.45
Duration of phonation per performance (sec)
 VHFO 8.82 ± 3.18 8.62 ± 2.83 1.483 .152
 SP 8.22 ± 2.52 9.19 ± 3.27

Values are presented as mean± SD.

VHFO= voiced high-frequency oscillation; SP= straw phonation; M1 (Moment 1)= performing SOVTE for 1 minute; M3 (Moment 3)= performing SOVTE for 3 minutes.

Table 2.
Comparison of acoustic measures of VHFO according to performance time
Parameters Duration
F p
M0 M1 M3
F0 (Hz) 199.46 ± 52.46 194.37 ± 50.20 197.95 ± 51.21 2.009 .142
Jitt (%) 1.26 ± 0.82 1.11 ± 0.67 0.95 ± 0.74 1.962 .149
Shim (%) 4.37 ± 1.63 3.99 ± 1.69 4.04 ± 1.77 1.744 .183
NHR 0.15 ± 0.03 0.15 ± 0.03 0.14 ± 0.03 2.844 .065
CPPV (dB) 10.20 ± 2.20 10.71 ± 1.95 10.76 ± 2.15 3.621 .032*
σCPPV (dB) 0.78 ± 0.53 0.69 ± 0.21 0.66 ± 0.26 1.622 .211
SRV (dB) 33.14 ± 5.14 33.48 ± 4.99 32.77 ± 4.99 .581 .562
σSRV (dB) 1.83 ± 1.28 1.77 ± 0.56 1.73 ± 0.55 .123 .801
CSIDV 18.60 ± 19.68 14.30 ± 9.12 14.40 ± 10.65 1.541 .226
CPPS (dB) 6.04 ± 0.74 6.080.64 6.15 ± 0.86 .578 .564
σCPPS (dB) 3.30 ± 0.38 3.26 ± 0.43 3.29 ± 0.53 .371 .651
SRS (dB) 31.33 ± 6.07 31.27 ± 5.78 32.38 ± 3.15 .613 .507
σSRS (dB) 8.68 ± 0.90 8.66 ± 0.84 8.75 ± 0.97 .370 .692
CSIDS 7.10 ± 10.85 7.40 ± 10.55 6.13 ± 13.28 .661 .520
APSID 22.91 ± 9.97 20.76 ± 7.81 19.87 ± 9.77 3.592 .033*

Values are presented as mean± SD.

VHFO= voiced high-frequency oscillation; F0 = average fundamental frequency; Jitt= jitter percent; Shim= shimmer percent; NHR= noise-to-harmonic ratio; CPP= cepstral peak prominence; CPPV = CPP of vowel /a/; CPPS = CPP of sentence; SR= L/H spectral ratio; SRV = SR of vowel /a/; SRS = SR of sentence; CSID= Cepstral Spectral Index of Dysphonia; CSIDV = CSID of vowel /a/; CSIDS = CSID of sentence; APSID = Acoustic Psychometric Severity Index of Dysphonia; M0 (Moment 0) = before SOVTE; M1 (Moment 1) = SOVTE for 1 minute; M3 (Moment 3)= SOVTE for 3 minutes.

Table 3.
Comparison of acoustic measures of SP according to performance time
Parameters Duration
F p
M0 M1 M3
F0 (Hz) 195.10 ± 50.92 194.17 ± 48.25 194.60 ± 49.15 .119 .888
Jitt (%) 1.12 ± 0.85 1.23 ± 1.02 1.15 ± 0.68 .365 .695
Shim (%) 4.27 ± 1.59 4.04 ± 1.77 3.93 ± 1.63 .717 .492
NHR 0.14 ± 0.26 0.14 ± 0.05 0.14 ± 0.03 .505 .577
CPPV (dB) 10.55 ± 2.05 10.55 ± 1.98 10.62 ± 1.92 .115 .891
σCPPV (dB) 0.69 ± 0.26 0.71 ± 0.38 0.68 ± 0.25 .218 .765
SRV (dB) 32.10 ± 4.79 33.00 ± 4.67 33.15 ± 3.86 2.136 .126
σSRV (dB) 1.65 ± 0.54 1.64 ± 0.50 1.86 ± 0.79 1.929 .161
CSIDV 15.80 ± 9.83 15.02 ± 11.10 18.68 ± 18.45 .974 .362
CPPS (dB) 6.00 ± 0.71 5.96 ± 0.64 6.02 ± 0.82 .193 .767
σCPPS (dB) 3.19 ± 0.46 3.19 ± 0.48 3.24 ± 0.45 1.225 .295
SRS (dB) 32.36 ± 3.38 32.53 ± 3.49 32.83 ± 3.11 1.896 .158
σSRS (dB) 8.51 ± 0.87 8.47 ± 1.59 8.71 ± 0.81 1.016 .339
CSIDS 8.95 ± 11.65 8.38 ± 10.79 6.96 ± 10.42 1.975 .158
APSID 21.92 ± 7.72 21.95 ± 7.90 21.37 ± 9.60 .163 .850

Values are presented as mean± SD.

SP= straw phonation; F0 = average fundamental frequency; Jitt = jitter percent; Shim = shimmer percent; NHR = noise-to-harmonic ratio; CPP = cepstral peak prominence; CPPV = CPP of vowel /a/; CPPS = CPP of sentence; SR= L/H spectral ratio; SRV = SR of vowel /a/; SRS = SR of sentence; CSID= Cepstral Spectral Index of Dysphonia; CSIDV = CSID of vowel /a/; CSIDS = CSID of sentence; APSID= Acoustic Psychometric Severity Index of Dysphonia; M0 (Moment 0)= before SOVTE; M1 (Moment 1)= SOVTE for 1 minute; M3 (Moment 3)= SOVTE for 3 minutes.

Table 4.
Comparison of psychometric measures of VHFO according to performance time
Parameters Duration
F p
M0 M1 M3
Severity 0.76 ± 1.67 0.68 ± 1.40 0.56 ± 1.26 .521 .513
VF 1.03 ± 0.68 0.76 ± 1.44 0.85 ± 1.64 .509 .526

Values are presented as mean± SD.

VHFO= voiced high-frequency oscillation; Severity = self-perceived severity score of the Korean version of the Voice Activity and Participation Profile (K-VAPP); VF= vocal fatigue; M0 (Moment 0)= before SOVTE; M1 (Moment 1)= SOVTE for 1 minute; M3 (Moment 3)= SOVTE for 3 minutes.

Table 5.
Comparison of psychometric measures of SP according to performance time
Parameters Duration
F p
M0 M1 M3
Severity 0.74 ± 1.36 0.56 ± 0.86 0.65 ± 0.86 .555 .502
VF 1.12 ± 1.68 0.97 ± 1.27 0.91 ± 1.48 .348 .623

Values are presented as mean± SD.

SP= straw phonaion; Severity= self-perceived severity score of the Korean version of the Voice Activity and Participation Profile (K-VAPP); VF= vocal fatigue; M0 (Moment 0)= before SOVTE; M1 (Moment 1)= SOVTE for 1 minute; M3 (Moment 3)= SOVTE for 3 minutes.

Table 6.
Comparison of electroglottography of VHFO according to performance time
Parameters Duration
F p
M0 M1 M3
CQV (%) 45.05 ± 4.46 44.92 ± 3.41 45.75 ± 4.00 .356 .423
σCQV (%) 1.61 ± 1.65 1.33 ± 0.76 1.37 ± 1.39 .510 .608
CQS (%) 45.74 ± 2.44 45.68 ± 2.68 45.60 ± 2.58 .255 .921
σCQS (%) 11.95 ± 41.87 3.81 ± 1.56 3.64 ± 1.77 .594 .338

Values are presented as mean± SD.

VHFO= voiced high-frequency oscillation; CQ= closed quotient; CQV = CQ of vowel /a/; CQS = CQ of sentence; M0 (Moment 0)= before SOVTE; M1 (Moment 1)= SOVTE for 1 minute; M3 (Moment 3)= SOVTE for 3 minutes.

Table 7.
Comparison of electroglottography of SP according to performance time
Parameters Duration
F p
M0 M1 M3
CQV (%) 45.05 ± 4.46 44.92 ± 3.41 45.75 ± 4.00 .356 .423
σCQV (%) 1.61 ± 1.65 1.33 ± 0.76 1.37 ± 1.39 .510 .608
CQS (%) 45.74 ± 2.44 45.68 ± 2.68 45.60 ± 2.58 .255 .921
σCQS (%) 11.95 ± 41.87 3.81 ± 1.56 3.64 ± 1.77 .594 .338

Values are presented as mean± SD.

SP= straw phonation; CQ= closed quotient; CQV = CQ of vowel /a/; CQS = CQ of sentence; M0 (Moment 0)= before SOVTE; M1 (Moment 1)= SOVTE for 1 minute; M3 (Moment 3)= SOVTE for 3 minutes.

REFERENCES

Andrade, P. A., Wood, G., Ratcliffe, P., Epstein, R., Pijper, A., & Svec, J. G. (2014). Electroglottographic study of seven semi-occluded exercises: Lax-Vox, straw, lip-trill, tongue-trill, humming, hand-over-mouth, and tonguetrill combined with hand-over-mouth. Journal of Voice, 28(5), 589–595.
crossref pmid
Balandat, B. (2017). Semi-occluded vocal tract exercises (SOVTE): Methodik, Hintergrund und stimmtherapeutische Empfehlungen. Forum Logopadie, 31(5), 20–27.

Christmann, M. K., & Cielo, C. A. (2017). Acoustic and auditory perception effects of the voice therapy technique finger kazoo in adult women. Journal of Voice, 31(3), 390.
crossref pmid
da Silva Antonetti, A. E., Ribeiro, V. V., Moreira, P. A. M., Brasolotto, A. G., & Silverio, K. C. A. (2019). Voiced high-frequency oscillation and LaxVox: analysis of their immediate effects in subjects with healthy voice. Journal of Voice, 33(5), 808.

da Silva Antonetti, A. E., Ribeiro, V. V., Brasolotto, A. G., & Silverio, K. C. A. (2022). Effects of performance time of the voiced high-frequency oscillation and lax vox technique in vocally healthy subjects. Journal of Voice, 36(1), 140.e29–140.e37.
crossref pmid
Fadel, C. B. X., Dassie-Leite, A. P., Santos, R. S., Santos Junior, C. G. D., Dias, C. A. S., & Sartori, D. J. (2016). Immediate effects of the semi-occluded vocal tract exercise with LaxVox® tube in singers. CoDAS, 28(5), 618–624.
crossref pmid
Hardy, K. A., & Anderson, B. D. (1996). Noninvasive clearance of airway secretions. Respiratory Care Clinics of North America, 2(2), 323–345.
pmid
Hirano, M. (1981). Clinical examination of voice New York, NY: Springer.

Hijleh, K., & Pinto, C. (2021). Realizing the benefits of SOVTEs: a reflection on the research. Journal of Singing, 77(3), 333–345.

Kim, H. (2012). Neurogenic speech-language disorders Seoul: Sigma press.

Kim, J. (2019). Meta-analysis of semi-occluded vocal track exercise studies on acoustic, aerodynamic, and electroglottographic results. Communication Sciences & Disorders, 24(2), 535–551.
crossref
Kim, J. S., Lee, D. W., Choi, C. H., Choi, S. H., Kim, J. S., Lee, D. W., ..., & Choi, S. H. (2017). Effects of laryngeal massage and semi-occluded vocal tract exercises for patients with hyperfunctional dysphonia. Communication Sciences & Disorders, 22(4), 806–817.
crossref
Köberlein, M. C., Hermann, L., Gantner, S., Tur, B., Westphalen, C., Kuranova, L., ..., & Echternach, M. (2022). The effect of water resistance therapy on the impulse dispersion of aerosols during sustained phonation. Journal of Voice, Article in press.

Lee, S. J., Choi, H. S., Kim, H., Byeon, H. K., Lim, S. E., & Yang, M. K. (2016). Korean version of the Voice Activity and Participation Profile (K-VAPP): a validation study. Communication Sciences & Disorders, 21(4), 695–708.
crossref
Lee, S. J., Lee, K. Y., Lim, J. Y., & Choi, H. S. (2017). A comparison of acoustic & electroglottographic measures according to voiced lip trill methods. Phonetics & Speech Sciences, 9(4), 107–114.

Lee, S. J., Choi, H. S., & Kim, H. (2021). Acoustic Psychometric Severity Index of Dysphonia (APSID): development and clinical application. Journal of Voice, 35(4), 660.
crossref
Lim, H. J., Choi, S. H., Kim, J. K., & Choi, C. H. (2016). Effects of Lax Vox voice therapy in a patient with spasmodic dysphonia: a case report. Phonetics & Speech Sciences, 8(2), 57–63.
crossref
Manjunatha, U., Nayak, P. S., & Bhat, J. S. (2022). Can straw phonation be considered as vocal warm up among speech language pathologists. Journal of Voice, 36(5), 735.
crossref pmid
Piragibe, P. C., Silverio, K. C. A., Dassie-Leite, A. P., Hencke, D., Falbot, L., Santos, K., ..., & Siqueira, L. T. D. (2020). Comparison of the immediate effect of voiced oral high-frequency oscillation and flow phonation with resonance tube in vocally-healthy elderly women. CoDAS, 32(4), e20190079.
pmid
Saters, T. L., Ribeiro, V. V., Siqueira, L. T. D., Marotti, B. D., Brasolotto, A. G., & Silverio, K. C. A. (2018). The voiced oral high-frequency oscillation technique’s immediate effect on individuals with dysphonic and normal voices. Journal of Voice, 32(4), 449–458.
crossref pmid
Suh, W. J., Hong, Y. H., Choi, J. M., Jung, E. J., Sung, M. W., Kim, K. H., & Kwon, T. K. (2006). Clinical characteristics of functional dysphonia. Journal of The Korean Society of Laryngology, Phoniatrics & Logopedics, 17(2), 127–132.

Tetik-Hacıtahiroğlu, K., & Düzenli-Öztürk, S. (2023). Evaluation of immediate effects of straw phonation exercise and determination of the ideal performance time in healthy adults. Journal of Voice, Article in press.

Titze, I. R. (2006). Voice training and therapy with a semi-occluded vocal tract: rationale and scientific underpinnings. Journal of Speech, Language, & Hearing Research, 49(2), 448–459.
crossref pmid
Editorial office contact information
Department of Speech Pathology, College of Rehabilitation Sciences, Daegu University,
Daegudae-Ro 201, Gyeongsan-si, Gyeongsangbuk-do 38453, Republic of Korea
Tel: +82-502-196-1996   Fax: +82-53-359-6780   E-mail: kjcd@kasa1986.or.kr

Copyright © by Korean Academy of Speech-Language Pathology and Audiology.
About |  Browse Articles |  Current Issue |  For Authors and Reviewers
Developed in M2PI