상대적 기본주파수(relative fundamental frequency, RFF)는 /모음+무성자음+모음/ (vowel+consonant+vowel, VCV)으로 이루어진 음운 환경에서 기본주파수(fundamental frequency, F0)의 변동을 추적하는 음향학적 측정치이다. 구체적으로 무성자음 직전의 10개의 주기는 Offset 구간의 주기라 하며, 무성자음 직후 발성이 시작되는 10개의 주기는 Onset 구간의 주기라고 정의한다. RFF는 무성자음에서 가장 멀리 떨어진 성문파형을 기준으로 Offset 구간과 Onset 구간에서 각 10개 주기의 F0를 반음(semitone, ST) 단위로 표준화하여 산출된다(Watson, 1998). 이러한 분석은 특정 음운 환경에서의 성대 움직임의 변화를 시간 단위(sec)로 계량화한 값을 ST로 표준화하여 비교하기 때문에, 비침습적이며 시간 기반(time-based) 의 정량적 음향학적 측정 방법으로 평가된다. 일반적으로 무성자음 전 Offset 구간에서의 F0는 성대 운동 이후 점차적인 하강 경향을 보이고, 무성자음 이후 Onset 구간에서의 F0는 급격한 상승 후 하강하는 경향을 보인다(Groll, Peterson, Zañartu, Vojtech, & Stepp, 2022; Lien, Gattuccio, & Stepp, 2014; Stepp, Hillman, & Heaton, 2010).
RFF 변화의 생리적 기전에 관하여 Serry, Stepp과 Peterson (2021, 2023)은 Hirano (1981)의 Cover-Body model을 근거로 두 가지 매개 변인이 RFF 변화에 유의미한 영향을 미친다고 하였다. 첫째, 측윤상피열근(lateral cricoarytenoid muscles, LCA)의 활동은 성대 내전을 통해 성대 틈새를 좁히고 충돌력(collision)을 강화하여 F0를 증가시키고 일정 시간 동안 F0를 유지시킨다. 반대로 무성자음 산출 시 성대 외전에 의해 LCA 활동력이 약화되면 성문 틈새가 넓어지고 충돌력이 감소하여 F0가 하락한다. 둘째, 윤상갑상근(cricothyroid muscles, CT)은 성대 길이와 장력을 조절하여 F0를 조정하는 데, 무성자음 환경에서 활성화된 CT가 인접한 후행모음에 영향을 미쳐 한시적으로 F0를 증가시킨다(Löfqvist, Baer, McGarr, & Story, 1989). 즉 유성음에서 무성자음으로의 전환 과정에서 증가하는 성대 근육의 긴장이 RFF의 변화를 유발하는 핵심 기전으로 설명된다(Heller Murray et al., 2017; McKenna, Diaz-Cadiz, Shembel, Enos, & Stepp, 2019).
이러한 기전에 기반하여, RFF의 변동이 성대 긴장과 밀접하게 관련되어 있다는 것을 바탕으로 과기능적 음성장애, 파킨슨병, 연축성 발성장애 환자를 대상으로 RFF 패턴을 분석한 비교 연구들이 보고되었다(Heller Murray et al., 2017; Roy, Fetrow, Merrill, & Dromey, 2016; Stepp, 2013; Stepp, Merchant, Heaton, & Hillman, 2011). 이 연구들에 따르면, 정상인의 경우 Offset 구간에서는 첫 번째 주기 대비 10번째 주기의 F0 하락폭이 제한적이지만 Onset 구간에서는 첫 번째 주기의 상승폭이 10번째 주기보다 크게 나타났다. 반면, 음성장애군에서는 Offset 구간과 Onset 구간 모두에서 정상인에 비해 유의한 F0 하락이 관찰되었다(Stepp et al., 2010). 이러한 연구결과는 과기능적 음성장애의 후두근 긴장성을 파악하는데 있어 RFF가 객관적인 음향학적 지표로 활용될 수 있음을 시사한다. 즉, RFF는 후두근 활동 변화에 따른 F0 변동을 민감하게 반영하여 긴장성 여부를 평가하는 임상적 도구로서 잠재적 가치가 크다.
그러나 국내에서는 아직 RFF에 대한 연구가 거의 보고되지 않았으며, 그 기본 원리에 대한 학문적 이해도 충분히 확립되지 않은 실정이다. 이러한 상황을 고려할 때, 향후 한국어에 RFF를 적용하기 위해서는 한국어의 평음, 경음, 격음으로 구분되는 특수한 음운 구조를 반영한 분석 절차 마련과 함께 언어 간 비교 가능성을 확보하기 위한 표준화 접근이 요구된다. 실제로 국외 선행연구들을 살펴보면, 사용된 음운 구조나 측정 절차에 따라 RFF 값이 다르게 보고되어 왔다. 따라서 한국어 음운 환경에 RFF를 적용하기 위해서는 두 가지 방법론적 쟁점에 대한 논의가 필요하다.
첫째, RFF 값을 산출할 때 활용할 음운 환경의 구조이다. 초기 연구에서는 어떤 음운 환경에서 값들을 추출해야 하는지 규준화되어 있지 않고 연구마다 상이하다. 예를 들어 /VCV/ 구조가 포함된 문장을 읽게 하거나, /VCV/ 구조만을 반복 산출하도록 하여 값을 추출하는 등 연구 설계에 차이가 있었다(Lien et al., 2014; Park et al., 2021; Stepp et al., 2010; Watson, 1998). Lien 등(2014)은 음소 간 변동성을 비교한 연구에서, RFF를 측정하는데 문장 읽기보다 구조화된 고립된 음운 구조를 활용한 측정 방법을 권장하였다. 이는 문장은 억양(intonation)이나 음도(pitch)의 변동에 크게 영향을 많이 받을 수 있는 반면, 단순화된 고립 구조는 이러한 영향을 상대적으로 덜 받는다. 실제로 문장 구조를 사용한 경우보다 /VCV/ 구조를 사용한 경우 RFF 값의 표준편차가 낮아 보다 안정적인 결과를 보였다. 또한 구조화된 환경은 연구자가 직접 수동으로 값들을 추출할 때 효율적이며, 향후 알고리즘을 활용한 자동화가 가능하다는 점에서 실용성이 높다. 이러한 장점에서 단순한 /VCV/ 환경이 상대적으로 낮은 변동성, 안정적인 값 산출, 그리고 임상 적용을 위한 자동화 가능성이라는 장점이 있다. 다만 생태학적 타당성(ecological validity) 을 고려할 때 문장 읽기가 실제 발화 상황의 긴장성을 더 잘 반영할 수 있으므로, 문장 기반 연구도 병행될 필요가 있다.
둘째, RFF 분석에 적합한 무성자음의 선택이다. 초기 연구에서는 파열음과 마찰음이 혼재되어 사용되었고, RFF 분석에 어떤 음소가 적합한지에 대한 정확히 기준이 제시되지 않아 RFF 측정을 위해 사용한 자음이 연구마다 달랐다. Lien 등(2014)은 무성 파열음(/p/, /t/, /k/)과 마찰음(/f/, /s/, /ʃ/)을 비교한 결과, 마찰음 /f/와 /ʃ/ 가 Offset 주기에서 하강폭이 작고 Onset 주기에서 상승폭이 가장 높으며, 전반적으로 변동성이 낮아 RFF 측정에 적합하다고 보고하였다. 이후 다수의 연구가 /f/를 중심으로 진행되고 있다. 영어의 /f/ 는 무성순치마찰음(voiceless labiodental fricative)으로 비교적 이른 시기(만 2-4세 사이)에 습득되며 전 연령대에서 발화 산출의 부담이 적기 때문에 다양한 연령층을 대상으로 활용하기에 적합하다. 그러나 한국어의 경우 마찰음 습득이 비교적 늦게 이루어지며(만 6-7세), 지역 방언에 따라 발음 차이가 존재하는 음소이다. 또한 한국어의 마찰음은 평음(/s/)과 경음(/s*/)으로 구분되는데, 평음 / s/는 모음 사이에서 유성음화될 가능성이 높기 때문에(Cho, Jun, & Ladefoged, 2002), 경음[s*]의 적합성을 검증할 필요가 있다.
따라서 본 연구는 한국어 음운 환경에서 RFF를 측정하는 것이 적절한지 여부를 탐색하고, 그에 적합한 음소를 규명하기 위해 한국어 자음 유형별(파열음, 파찰음, 마찰음), 특히 장애음 유형 분류에 따라 경음 및 격음으로 구조화된 /VCV/ 환경에서의 Offset 및 Onset 패턴을 분석하여 한국어에서 RFF 측정에 가장 적합한 음소를 파악하고자 한다.
연구방법
연구 대상자
본 연구는 강남대학교 기관생명윤리위원회(Institutional Review Board)의 승인을 받아 수행되었다(KNU-HR2023003). 연구 대상자는 본 연구와 유사한 성격의 선행연구(Lien et al., 2014)의 표집 규모를 참고하여 여성 10명으로 설정하였다. 최근 3개월 내 음성 문제나 상기도 감염의 병력이 없고, 전문 음성사용자가 아니며, 흡연 여부, 후두 구조적·기능적 이상, 위산 역류 증상이 없는 일반인을 대상으로 하였다. 최종적으로 서울·경기도권에 거주하며 한국어를 모국어로 표준어를 사용하는 20대 성인 여성 10명이 참여하였고, 이들의 평균 연령은 24.60세(표준편차=2.46)였다.
대상자의 음성은 모음 /아/ 발성과 ‘가을’ 문단(Kim, 2012) 읽기 자료를 통해 수집하였다. 수집된 음성은 임상경력 5년 이상의 1급 언어재활사인 제1연구자가 청지각적으로 평가하였다. 평가에는 GRBAS 척도(Hirano, 1981)를 사용하였으며, 전반적 쉰 소리를 나타내는 G 점수가 0점인 경우에만 연구에 포함하였다.
자료수집
본 연구에서 RFF 측정을 위해 사용된 발화 자극은 모음 /아/와 한국어 자음으로 구성된 /VCV/ 구조의 무의미 단어로 구성하였다. 자음은 파열음, 파찰음 및 마찰음 중 긴장성 또는 기식성이 있는 경음(/ㅃ/, /ㄸ/, /ㅉ/, /ㄲ/, /ㅆ/)과 격음(/ㅍ/, /ㅌ/, /ㅊ/, /ㅋ/)으로 선정하였다. 한국어 파열음과 파찰음의 평음(/ㅂ/, /ㄷ/, /ㅈ/, /ㄱ/)은 모음 사이 환경에서 유성음화될 가능성이 높아 RFF 값이 왜곡될 수 있으므로 제외하였다(Cho et al., 2002). 평마찰음 /ㅅ/ 역시 모음 사이 환경에서 유성음화 가능성이 보고되어 본 연구의 발화 자극에 포함하지 않았다(Kim & Park, 2011). 이에 본 연구에 사용된 총 발화 자극은 9개의 무의미 단어(/아빠/, /아따/, /아까/, /아파/, /아타/, /아카/, /아짜/, /아차/, /아싸/)로 구성되었다.
본 연구에서 모음 /아/를 사용한 이유는 다음과 같다. 첫째, 고모음과 저모음 간 F0의 차이가 크지 않아 특정 모음이 RFF 측정값에 큰 영향을 미치지 않는다. 둘째, 모음 /아/는 조음적 변이가 상대적으로 적어 RFF 변동을 최소화할 수 있다. 셋째, 고모음에 비해 성도의 음향적 임피던스(acoustic impedence)가 낮아 성대 진동의 안정성이 잘 유지되므로, RFF 측정에 최적화될 수 있다. 이러한 특성으로 인해 모음 /아/는 자음 유형에 따른 RFF 차이를 비교하는데 적합한 발화 자극으로 평가된다(Park & Stepp, 2019).
소음이 차단된 조용한 방에서 대상자는 의자에 앉은 상태에서 대상자와 마이크 간 거리를 고정하고 주변 환경 소음의 변동성을 최소화하기 위해 헤드셋 마이크(Sennheiser PC151, Sennheiser, Germany)를 착용하고, 디지털 오디오 녹음기(PCM-D100, Sony, Japan)로 녹음하였다. 녹음의 표본추출률은 44,100 Hz, 양자화는 16 bit였다. 대상자들은 편안한 음도와 크기로 연구자가 제시한 A4 용지에 적인 /VCV/ 구조의 무의미 단어들을 읽었다. 실험자는 발화 도중 자음 오류 산출이 나타나면 단어를 다시 산출하도록 지시하였다. 또한 강세나 말속도가 RFF에 영향을 줄 수 있기 때문에(Park & Stepp, 2019) 대상자의 읽는 속도가 너무 빠르거나 느린 속도로 읽지 않도록 제1연구자가 시범을 보인 후 대상자가 1-2개의 단어를 2-3회 연습하고 본 녹음을 진행하였으며, 각 단어별로 6회씩 반복 산출하도록 하였다.
자료분석
모든 녹음은 무료 소프트웨어인 Praat (Version 6.3.12, Boersma & Weenink, 2012)과 Microsoft Excel (2010)을 이용해 분석하였다. 자료분석 절차는 Vojtech과 Murray (2019) 매뉴얼 및 관련 선행연구(Lien et al., 2014; Stepp et al., 2010)를 준거로 하여 다음과 같이 진행하였다.
우선 모든 녹음 파일은 Praat에서 단일 채널(mono)로 변환하였으며, 분석 시 F0의 범위는 90-500 Hz로 설정하였다. 이는 여성 성인의 일반적인 발화 음도 범위를 포괄하기 위함이다. 그리고 파형(waveform)과 스펙트로그램(spectrogram)을 동시에 확인하면서 무성자음 구간을 식별하였다. 무성자음 구간의 시작과 끝은 스펙트로그램에서의 소음 패턴 및 성대 진동 신호의 부재 여부를 기준으로 결정하였다. 그리고 분석 구간을 .05 배율로 확대하여 무성자음 직전 및 무성자음 직후의 첫 번째 성대 진동주기를 식별하였다. Praat의 ‘show pulses’ 기능을 활용하여 성문 주기를 표시하고, 이를 기준으로 무성자음 직전과 직후의 연속된 10개 진동 주기를 각각 추출하였다. 무성자음 직전 10개의 주기 구간은 Offset, 무성자음 직후 10개 주기 구간은 Onset이라고 한다. 추출된 성대 진동주기 자료는 Praat의 ‘pulse listing’ 기능을 사용하여 주기 목록(period list) 형태로 산출하였다. 각 주기에서 순간 F0를 산출하고, 이를 기준 주기의 F0 (reference fundamental frequency, F0ref)에 대해 반음(semitone, ST)으로 정규화하는 변환 공식을 적용하여 RFF 값을 계산하였다. 이 때 계산식은 다음과 같다.
이 계산식에서 F0i는 i번째 주기의 F0이고, F0ref는 유성음(모음) 구간의 안정 상태에 해당하는 F0로 기준 주기의 F0로 정의된다. Offset 구간의 F0ref는 1번째 Offset (Offset 1) 주기의 F0로 설정하며, 이는 선행 무성자음으로부터 가장 멀리 떨어져 있고 후행 모음의 안정된 부분을 가장 잘 대표하기 때문이다. Onset 구간의 경우, F0ref는 10번째 Onset (Onset 10) 주기의 F0로 설정하는데, 이는 인접한 무성자음으로부터 가장 멀리 떨어져 있으며 후행 모음의 안정된 부분에 가장 근접하기 때문이다(Figure 1). 기준이 되는 주기의 RFF 값은 항상 0으로 산출되는데, 이는 F0ref를 자기 자신으로 나눈 값의 로그값이 0이 되기 때문이다. RFF를 산출하는 과정에서 Vojtech과 Murray (2019) 매뉴얼에 따라 Offset 2 주기 또는 Onset 9 주기의 크기가 0.8 ST를 초과한 경우는 제외하였다. 이는 기준 주기가 안정 상태(steady state)에 근접하도록 하기 위해서이다.
분석의 신뢰도를 검증하기 위해 제2 연구자가 전체 자료의 15%를 재분석하였으며, 피어슨 상관계수는 .95 (p<.01)로 나타났다.
통계분석
자료의 통계분석은 SPSS 통계 프로그램(IBM SPSS Statistics, verion 21.0, IBM Corp, Armonk, NY, USA)을 사용하여 수행하였다. 각 무의미 단어별로 RFF의 기술통계(평균, 표준편차)를 산출하였다. 평균과 표준편차에 대한 자음 유형(/ㅃ/, /ㄸ/, /ㄲ/, /ㅍ/, /ㅌ/, /ㅋ/, /ㅉ/, /ㅊ/, /ㅆ/)의 효과를 확인하기 위해 자음 유형과 성대 진동주기(Offset 1-10과 Onset, 1-10)를 요인으로 하는 이요인 반복측정 분산분석(two-factor repeated measures ANOVA)을 실시하였다. 각 요인별로 Bonferroni 검정을 이용한 주효과분석을 실시하였고, 자음 유형과 성대 진동주기 간 상호작용 효과도 분석하였다.
이와 더불어 자음 유형을 조음방법과 장애음 유형 분류에 따라 파열경음(/ㅃ/, /ㄸ/, /ㄲ/), 파열격음(/ㅍ/, /ㅌ/, /ㅋ/), 파찰경음(/ㅉ/), 파찰격음(/ㅊ/), 마찰경음(/ㅆ/)으로 구분한 후, 이들 RFF의 평균과 표준편차를 산출하여 자음 유형과 성대 진동주기를 요인으로 하는 이요인 반복측정분산분석을 실시하였다. 각 요인별로 Bonferroni 검정을 이용한 주효과분석을 실시하였고, 자음 유형과 성대 진동주기 간 상호작용 효과를 분석하였다.
이요인 반복측정분산분석 결과에서 구형성(sphericity) 가정이 위배된 경우, Greenhouse–Geisser 보정을 적용하였다. 각 요인의 효과크기는 부분 에타제곱(partial eta squared, ηp2)으로 산출하였으며, 효과크기의 크기는 작음(.01), 중간(.06), 큼(.14)으로 분류하였다(Witte & Witte, 2010). 모든 통계적 유의수준은 α=.05로 설정하였다.
연구결과
9개의 자음 유형을 대상으로 RFF 평균에 대한 이요인 반복측정 분산분석 결과는 Table 1에 제시하였다. Offset 구간에서는 자음 유형, 성대 진동주기, 그리고 자음 유형×성대 진동주기 간 상호작용 모두 유의하지 않았다. 반면, Onset 구간에서는 자음 유형(F=5.477, p<.001), 성대 진동주기(F=52.621, p<.001), 자음유형×성대 진동주기 간 상호작용(F=4.475, p<.001)이 모두 유의하였다. 자음 유형(.199), 성대 진동주기(.705), 자음 유형×성대 진동주기 상호작용(.169) 모두 높은 효과크기(ηp2)를 보였다. 사후검정 결과, 마찰경음(/ㅆ/)이 다른 자음보다 RFF 평균이 유의하게 높았다(p<.05). Figure 2에서 확인할 수 있듯이, 마찰경음은 자음에 인접한 Offset 10 및 Onset 1 주기에서 다른 자음 유형보다 더 높은 RFF 평균을 나타내는 경향을 보였다. 성대 진동주기에서는 Onset 1, Onset 8, Onset 9, Onset 10 주기의 RFF 평균이 다른 Onset 주기의 RFF 평균과 유의한 차이를 보였으며(p<.05), Onset 1 주기에서 가장 높은 RFF 평균이 나타났고, 주기가 증가할수록 RFF 평균은 점차 감소하였다.
모든 자음 유형을 대상으로 RFF 표준편차에 대한 분석에서는 Offset 구간에서 성대 진동주기(F=15.063, p<.001)만 유의하였고, 자음 유형 및 자음 유형×성대 진동주기 상호작용은 유의하지 않았다. 성대 진동주기의 효과크기(ηp2 =.751)는 큰 수준이었으며, 사후검정에서는 Offset 1 주기와 Offset 2 주기 간에만 유의한 차이가 나타났다(p=.040). Onset 구간에서는 성대 진동주기(F=67.192, p<.001)만 유의하였고, 자음 유형이나 자음유형×성대 진동주기 간 상호작용은 유의하지 않았다. 성대 진동주기의 효과크기(ηp2 =.918)는 매우 컸으며, 사후검정에서는 여러 성대 진동주기 간에 유의한 차이가 관찰되었다(p<.05).
자음 유형을 조음방법과 장애음 유형 분류에 따라 파열경음, 파열격음, 파찰경음, 파찰격음, 마찰경음으로 구분하여 RFF 평균에 대해 실시한 이요인 반복측정 분산분석(Table 2)에서는, Offset 구간에서 자음 유형, 성대 진동주기 및 자음유형×성대 진동주기 간 상호작용 모두 유의하지 않았다. 그러나 Onset 구간에서는 자음 유형(F=6.075, p=.002), 성대 진동주기(F=57.454, p<.001), 자음유형×성대 진동주기 간 상호작용(F=3.063, p=.011) 모두 유의하였다. 효과크기(ηp2)는 자음 유형(.144), 성대 진동주기(.615), 자음 유형×성대 진동주기 상호작용(.078)으로 모두 큰 수준이었다. 사후검정에서는 파열격음과 마찰경음이 다른 자음 유형과 유의한 차이를 보였다(p<.05). Figure 3에서 확인할 수 있듯이, 마찰경음의 RFF 평균이 가장 높았으며, 파열격음의 RFF 평균이 가장 낮았다. 특히 마찰경음은 다른 자음 유형에 비해 Offset 10과 Onset 1 주기에서 가장 높은 RFF 평균을 나타냈다. 또한 Onset 1, 8, 9, 10 주기의 RFF 평균이 다른 Onset 주기의 RFF 평균과 유의한 차이를 보였으며(p<.05), Onset 1 주기가 가장 높은 RFF 평균을 보였고, Onset의 주기가 증가할수록 RFF 평균은 점차 감소하였다(Figure 3).
다섯 종류의 자음 유형을 대상으로 RFF 표준편차를 분석한 결과(Table 2), Offset 구간에서는 자음 유형(F=11.186, p=.001)과 성대 진동주기(F=19.041, p<.001)가 유의하였으며, 효과 크기(ηp2)는 각 .554와 .679로 높았다. 반면, 자음 유형×성대 진동주기 간 상호작용은 유의하지 않았다. 사후검정에서는 파열경음과 파열격음이 파찰경음, 파찰격음, 마찰경음과 유의한 차이를 보였으며(p<.05), Figure 4에서도 이 두 유형이 가장 낮은 RFF 표준편차를 보였다. 반면, 파열경음과 파열격음 간에는 유의한 차이가 없었고, 파찰경음, 파찰격음 및 마찰경음 간에도 유의한 차이가 없었다. Offset 1 주기는 다른 Offset 주기보다 RFF 표준편차가 유의하게 낮았다. Onset 구간에서는 자음 유형(F =12.448, p=.001), 성대 진동주기(F =60.272, p<.001), 자음유형×성대 진동주기 간 상호작용(F=4.136, p=.014) 모두 유의하였고, 효과크기(ηp2)는 자음 유형(.609), 성대 진동주기(.883), 자음유형×성대 진동주기 간 상호작용(.341) 모두 큰 수준이었다. 사후검정 결과, 파열경음과 파열격음은 파찰경음, 파찰격음과 유의한 차이를 보였으며(p<.05), Figure 5에서 나타나듯이 파열경음과 파열격음이 가장 낮은 RFF 표준편차를 보였고(p<.05). 파찰경음과 파찰격음이 가장 높은 RFF 표준편차를 보였다(Figure 5). Onset 1, 8, 9, 10 주기의 RFF 표준편차는 다른 Onset 주기들의 RFF 평균과 유의한 차이를 보였으며(p<.05), Onset 1 주기가 가장 높은 RFF 표준편차를 보였고 이후 주기가 증가할수록 RFF 표준편차는 감소하였다.
논의 및 결론
본 연구는 한국어 자음을 대상으로 RFF의 변동을 체계적으로 분석하여 자음 유형과 성대 진동주기가 RFF에 미치는 효과를 살펴보았다. 특히 평음, 경음, 격음으로 구분되는 한국어의 특수한 자음 체계 속에서 RFF 패턴이 어떠한 차이를 보이는지를 검토함으로써, 기존 영어 중심 연구의 범위를 확장했다는 점에서 학문적 의의가 있다.
연구결과, 모든 자음 유형에서 Offset 10 주기의 RFF는 0에 근접하였으며, Onset 주기 구간의 RFF는 0보다 큰 값을 나타냈다. 이는 후두생리적으로 무성자음 산출 직전 Offset 구간에서 성대 외전 시 성문이 넓어지고 성대 접촉력이 하락하면서 F0가 낮아지는 경향을 보이며, 무성자음 이후 후행하는 모음의 Onset 구간에서는 성대 내전 이후 성문이 좁아지고 성대 접촉력이 높아지면서 F0가 상승하는 추세를 보인다는 것을 의미한다(Serry et al., 2023). 이는 선행연구의 결과와 일치하며, 무성자음 전후 F0의 변화기전이 영어와 한국어 모두 공통적으로 나타난다는 것을 알 수 있다. 특히 Onset 1 주기에서 높은 RFF 평균과 표준편차가 관찰되었는데, 이는 해당 주기가 자음 산출로 인해 억제되었던 성대진동이 다시 개시되는 전환점에 해당하기 때문이다. 발성 개시 시에는 성대가 내전되고 성문하압이 상승하여 공기역학적 에너지가 순간적으로 높아지고 CT 근육의 활성화가 증가되어 성대 긴장이 일시적으로 과도하게 증가하며, 이는 첫 번째 성대진동 주기에서 가장 크게 반영된다. 즉 Onset 1 주기는 성대진동을 위한 점막파동의 패턴이 완전히 정렬되지 않고, 공기역학적 피드백이 아직 안정화되지 않는 생리적·공기역학적 불안성이 큰 구간으로, 화자별 발성 전략과 자음 유형에 따라 변동성이 커지게 된다. 그리고 그 이후 주기에서는 성대진동이 안정화되고 CT 근육과 TA 근육 활성의 과도한 조절이 완화되면서 평균 RFF가 점진적으로 감소하고 표준편차도 감소하게 된다(Serry et al., 2023).
또한, Onset 구간에서 자음 유형이 RFF 평균에 유의한 영향을 미쳤으며, 마찰경음은 가장 높은 RFF 값을, 파열격음은 가장 낮은 RFF 값을 보였다. 이는 Lien 등(2014)과 Stepp 등(2010)의 결과와 일치하는데, 선행연구에서도 마찰음(/f/, /ʃ/)이 파열음(/p/, /t/, /k/)보다 더 높은 RFF 값을 나타냈다. 이러한 차이는 자음 산출 과정의 공기역학적 특성, 성대 외전 각도 및 지속시간, 성대 강성(stiffness) 등 복수 요인의 상호작용에 기인한다(Park et al., 2021; Watson, 1998). 무성자음 직전인 Offset 구간에서 마찰음은 부분폐쇄로 인해 기류가 지속되며 성대 외전 각도와 외전 지속시간이 파열음보다 상대적으로 길어 성대 접촉이 낮아지고(낮은 충돌력), 결과적으로 RFF가 더 낮아질 수 있음이 제안되어 왔다. 다만 본 연구에서는 Offset에서 자음 유형에 따른 차이가 유의하지 않았는데, 이는 CT-TA의 길항 작용 등 근긴장 조절 메커니즘이 Offset 구간의 말단에서 자음 유형 차이를 상쇄했을 가능성을 시사한다(McKenna et al., 2019; McKenna, Heller Murray, Lien, & Stepp, 2016). 무성자음 직후인 Onset에서는 파열음이 파열(burst)에 의해 성문 기류가 급증하고 성문 각도가 커져 접촉률 저하로 이어질 수 있으나, 마찰음은 지속 마찰을 위해 모음-자음 경계 직후부터 비교적 높은 전행 기류를 유지한다는 점에서 성대의 재발성 순간의 긴장 상승이 더 크게 반영될 여지가 있다. 즉 마찰음은 부분 협착을 통한 지속적인 기류 흐름으로 인해 무성 자음 직전 성대 긴장이 더 높게 유지되는 반면, 파열음은 완전 폐쇄 후 개방으로 인한 급격한 압력 변화가 성대 긴장의 안정성에 영향을 미쳐 상대적으로 낮은 RFF 값을 보였을 가능성이 있다. 이로써 Onset 1 주기에서 마찰음의 RFF가 파열음보다 높게 나타나는 경향이 설명된다. 파찰음은 선행연구에서 직접적으로 사용된 경우가 적지만, 부분폐쇄+파열+마찰의 복합적 성질을 갖기 때문에 RFF 수준과 변동성이 마찰-파열의 중간 영역에 위치할 가능성이 있다. 실제로 본 연구의 파찰경음과 파찰격음은 Onset 1 주기에서 중간 정도의 RFF를 보여 중간적 기전을 반영하는 것으로 보인다.
마찰경음 /ㅆ/는 Onset 1 주기에서 가장 높은 RFF를 보였고, 이는 높은 후 긴장과 기식성이 함께 반영되는 음소로, /ㅆ/가 다른 자음보다 RFF 평균이 높게 나타난 것은 후두 근육의 긴장이 RFF 패턴에 직접적으로 반영된 결과이며, 무성자음 이후 성대의 재발성 초기에 민감하게 반응한다는 것을 시사한다. RFF 측정을 위해 영어권에서는 /f/가 많이 사용된다는 점을 고려하면, 한국어에서는 /ㅆ/가 기능적으로 유사한 마찰 자질을 제공할 수 있다. 다만 발달적 관점에서 /f/는 영어의 조기 습득 음소(2-3세)인 반면, 한국어의 /ㅆ/는 상대적으로 늦게 습득되는 경향이 있어 연령 전반의 적용성이나 재현성에 차이가 있을 수 있다.
성대 진동주기 분석 결과, 자음 유형에 관계없이 공통적으로 Offset 10 주기의 RFF는 0 ST에 근접하거나 0 미만의 값을 보였고, Onset 구간에서는 Onset 1 주기에서 가장 높은 RFF 평균이 나타났고, 이후 주기가 진행됨에 따라 점차 감소하는 경향이 관찰되었다. 이는 /VCV/ 음운 환경에서 무성자음 직전에 성대 외전으로 성문이 넓어지고 성대 접촉력이 하락하면서 F0이 하강(음의 RFF)하는 반면, 무성자음 이후 후행 모음에서 성대가 재진동(revoicing)하는 순간, 성대 긴장이 일시적으로 급격히 증가한 뒤 점차 안정화되는 생리적 기전을 반영한다(Serry et al., 2021; Stepp et al., 2011; Watson, 1998). 반대로 Offset 구간에서는 주기별 차이가 뚜렷하지 않았는데, 이는 무성 자음 산출 전 성대의 이완 과정에서 나타나는 안정성 때문으로 해석된다. 이러한 Offset-Onset의 비대칭적 패턴은 영어권 보고(Liet et al., 2014; Park et al., 2021; Roy et al., 2016; Stepp et al., 2010)와 일치하여, 무성자음 전후의 F0 변화 기전이 한국어에서도 공통적으로 작동함을 시사한다. 결과적으로 RFF는 시간 기반의 비침습적 지표로서 한국어에서도 후두근의 긴장 변화를 민감하게 포착한다는 증거를 제공한다. 또한 Onset 구간의 Onset 8, 9, 10 주기에서도 RFF 평균이 다른 주기들과 유의한 차이를 보였는데, 이는 무성 자음 산출 이후 일정 기간 동안 성대 긴장이 점진적으로 변화하는 과정을 반영한다. 즉, Onset 구간에서의 RFF는 후두 근육의 재활성화 정도를 민감하게 반영하는 지표임을 확인할 수 있다.
표준편차 분석에서 파열계(격·경음)가 가장 낮은 RFF 변동성을, 파찰계가 가장 높은 변동성을 보였다. 이는 파열음이 명확한 개폐 구조를 가지므로 산출 시 일관성이 높고, 파찰음은 파열과 마찰이 결합된 복합적 조음 특성으로 인해 산출 간 변이가 커진 것으로 해석된다. 이러한 결과는 RFF 측정 시 자음 선택에 따라 데이터의 안정성이 달라질 수 있음을 시사한다. 즉 민감도를 중시하면 마찰경음이 유리하고, 반복 또는 추적 평가의 안정성을 중시하면 파열계가 유리함을 의미한다. 임상이나 연구 설계를 최적화하려면, 평가 목적(예: 치료 전후 변화의 민감성 탐지 vs. 장기 추적의 일관성)에 따라 자음 세트의 가중치를 달리하는 혼합형 자극 세트가 합리적이다. 또한 한국어에서 평음 /s/는 모음 사이에서 유성음화 가능성이 높아 RFF를 왜곡시킬 위험이 있으므로 경음 /ㅆ/ 중심의 마찰음의 자극 선택이 타당하다(Cho et al., 2002).
기존의 영어 중심 연구에서는 주로 /f/, /s/와 같은 마찰음을 대상으로 RFF 특성을 분석해 왔으나, 한국어는 평음, 경음, 격음으로 이루어진 특수한 대립 체계를 갖고 있어 이러한 결과를 직접적으로 적용하거나 단순 비교하기에는 한계가 있다. 선행연구에 따르면, 일반적으로 격음과 경음은 평음에 비해 후행 모음의 F0가 더 높게 나타나는 경향을 보인다. 특히 /CV/ 구조에서 격음은 강한 성문 개방과 높은 호기류를 요구하므로, 자음 이후 모음에서 성문하압과 성대긴장이 증가하고, 그 결과 상대적으로 높은 F0가 관찰된다. 반면, 경음은 높은 성대 긴장을 특징으로 하지만 성문 개방이 제한적이어서, 모음의 F0 상승이 격음보다 상대적으로 작게 나타날 수 있다(Cho et al., 2002). 이러한 한국어 무성자음의 발성 유형에 따른 F0의 차이가 /VCV/ 구조에서 RFF, 특히 자음 전후의 성대 진동 특성에 어떠한 영향을 미치는지는 추가적인 검토가 필요하다. 본 연구는 이러한 한국어의 자음의 경음과 격음 대립을 반영하여 RFF를 분석함으로써, 향후 언어 간 비교 연구와 RFF 표준화 연구에 중요한 방법론적 근거를 마련하는데 의의가 있다.
RFF는 후두 근육 긴장과 관련된 비침습적인 음향학적 지표로서, 과기능적 음성장애, 파킨슨병, 연축성 발성장애 등 긴장 조절에 어려움을 보이는 환자군의 진단 및 중재 모니터링에 활용될 수 있다(Heller Murray et al., 2017; Roy et al., 2016). 본 연구결과, 마찰경음이 높은 RFF 값을 보였다는 점은 긴장성 음성 평가에서 마찰음을 활용할 경우 민감도가 높아질 수 있음을 시사한다. 반면 파열계 자음은 낮은 변동성을 보이므로, 반복 측정 시 안정적인 데이터를 확보할 수 있는 장점이 있다. 따라서 한국어 임상 현장에서 RFF를 활용할 때, 자음 선택에 따라 평가의 목적(민감도 vs. 안정성)에 맞춘 접근이 필요하다. RFF 긴장도에 민감한 자음 선별작업을 통해 수집된 자료는 향후 임상에서 과기능적 음성장애 또는 후두근 긴장도 변화를 음성치료 전후에 비교하여 살펴보는데 유용한 보조 자료가 될 수 있다. 또한 다양한 연령대와 성별에 대한 자료가 축적된다면, 선행연구에서 제시한 바와 같이 객관적인 음향학적 음성 지표로서 기준값을 확립할 수 있을 것으로 판단된다. 다만, 본 연구는 20대 여성 화자만을 대상으로 하였기에 성별이나 연령을 일반화하는데 제한되어 있으므로, 임상적 진단 기준으로 활용하는 데에는 신중한 해석이 필요할 것으로 보인다. 이에 추후에는 남성, 아동, 노년, 장애군 등의 다양한 대상군을 포함하여 연구를 확장할 필요가 있다. 또한, 본 연구에서는 구조화된 /VCV/의 무의미 단어 중심이므로 문장 수준의 억양이나 운율 효과가 제한적으로 반영되었다. 생태학적 타당성을 위해 문장이나 자발화 과제를 살펴볼 필요가 있다. 이와 더불어 음향 기반 분석만으로는 후두 긴장성이나 공기역학적 특성 등을 분리하여 추정하기 어렵다. 이에 추후에는 구강 기류, 후두 관련 근전도, 고속영상 후두내시경 등을 동시에 측정 하여 RFF 기전을 정밀하게 검증할 필요가 있다.
결론적으로, 본 연구는 한국어 자음 환경에서 RFF의 적용 가능성을 실증적으로 확인하였다. Offset–Onset의 전형적 비대칭 패턴이 한국어에서도 재현되었으며, Onset 구간에서 마찰음과 파열음 간 유의미한 차이가 나타난 점은 영어 기반 연구와의 공통성을 입증하였다. 이는 한국어에서도 RFF가 후두 근긴장을 민감하게 반영하는 유효한 음향학적 지표가 될 수 있음을 시사하며, 향후 성별, 연령, 모음 환경을 확장한 연구를 통해 한국어 RFF 측정의 표준화 가능성과 임상적 활용성을 더욱 강화할 필요가 있다.



