| Home | E-Submission | Sitemap | Contact Us |  
top_img
Commun Sci Disord > Volume 30(4); 2025 > Article
경도인지장애군 선별을 위한 동사 유창성 검사 유용성 검증

초록

배경 및 목적

경도인지장애(Mild Cognitive Impairment, MCI)는 알츠하이머 치매로 진행될 가능성이 높은 고위험군으로, 정상 노화와 구별하여 조기에 선별하고 임상 개입을 시행하는 것이 필수적이다. 구어 유창성 검사는 MCI 집단의 언어적 결함을 정상 노화 과정과 구분할 수 있는 간편한 검사 유형 중 하나이다. 이에 본 연구에서는 구어 유창성 검사의 세 가지 유형(의미, 글자, 동사)에 따른 MCI 집단과 정상 집단의 수행력 차이를 비교하고, MCI 선별에 사용되는 인지 기능 검사와의 상관 관계를 분석하고자 하였다. 이를 토대로 두 집단을 가장 효과적으로 구분할 수 있는 구어 유창성 검사 유형을 확인하고자 하였다.

방법

MCI군 26명과 NC군 26명을 대상으로 구어 유창성 검사(의미, 글자, 동사) 및 인지 기능 검사(한국판 간이 정신상태검사, 구어 학습 검사, 작업 기억 검사)를 시행하였다. 이후 집단 간 수행력 차이를 비교하고, 구어 유창성 검사와 인지 기능 검사 간의 상관 분석을 실시하였다. 최종적으로, 인지 기능 검사 점수를 통제한 상태에서 구어 유창성 검사의 독립적인 감별력을 평가하기 위해 이항 로지스틱 회귀 분석을 수행하였다.

결과

MCI군은 의미 및 동사 유창성 검사에서 정상군보다 유의미한 수행 저하를 보였다. 또한, 각 집단에서 구어 유창성 검사와 인지 기능 검사 간의 유의한 정적 상관이 확인되었다. 특히, 구어 유창성 검사 중 동사 유창성 검사가 MCI 집단과 정상 집단을 가장 효과적으로 구별하는 독립적인 감별 도구로 나타났다.

논의 및 결론

본 연구 결과는 동사 유창성 검사가 MCI 집단을 정상 노화 과정과 민감하게 구별할 수 있는 평가 도구임을 확인하였다. 이는 향후 MCI 집단의 언어 및 인지 평가에서 필수적인 검사로 자리 잡을 가능성을 보여주며, 이론적 및 임상적 측면에서 중요한 의의를 가진다.

Abstract

Objectives

Mild Cognitive Impairment (MCI) is a high-risk condition that may progress to Alzheimer’s disease, making early screening and clinical intervention essential. Verbal fluency tests are widely used as a simple and effective tool to differentiate MCI from normal aging. This study aimed to compare the performance of three types of verbal fluency tests (semantic, letter and action fluency) between MCI and normal control adults. Finally, we sought to determine which type of verbal fluency test most effectively distinguishes MCI from normal aging.

Methods

A total of 52 participants (26 with MCI, 26 controls) participated in this study. Group differences in verbal fluency performance were analyzed, and correlations between verbal fluency and cognitive screening tests were examined. Binary logistic regression analysis was conducted to evaluate the independent discriminative power of verbal fluency.

Results

The MCI group exhibited significantly lower performance than the normal controls in the semantic and action fluency tests. Additionally, significant positive correlations were observed between verbal fluency and cognitive function tests in both groups. Among the verbal fluency tests, action fluency was identified as the most sensitive and independent predictor for distinguishing MCI from normal aging.

Conclusion

These findings indicate that the action fluency test is a highly sensitive tool for distinguishing MCI from normal aging. The results highlight the potential for the action fluency test to serve as a critical assessment tool in evaluating language and cognitive function in individuals with MCI. This study provides important theoretical and clinical implications for the early detection of MCI and the development of targeted screening methods.

경도인지장애(Mild Cognitive Impairment, MCI)는 주관적인 인지 기능 저하를 호소하며, 객관적 신경심리검사에서 기억력 또는 다른 인지 기능의 저하가 확인되지만, 일상생활 수행에는 뚜렷한 어려움이 없고, 치매로 분류되지 않는 상태이다(Petersen, 2004). MCI는 정상 노화와 치매의 중간 단계로 간주되며, 기억 저하 여부에 따라 크게 기억형 MCI (amnestic MCI, aMCI)와 비기억형 MCI (nonamnestic MCI)로 분류된다. 이 중 aMCI는 알츠하이머성 치매(dementia of the Alzheimer’s type)로의 진행 가능성이 가장 높은 고위험군으로 분류되기 때문에, 조기 감별이 필수적이다(Gauthier et al., 2006). Petersen 등(2001)의 연구에 따르면, aMCI 집단의 연간 치매 전환율은 약 10-15%로, 이는 정상 노년층의 전환율인 1-2%보다 현저히 높은 수치이다. 또한, aMCI 환자의 약 80%는 10년 이내에 치매로 전환된다고 보고하고 있다. 따라서 MCI의 조기 선별은 고령화 사회에서 중요한 과제로 부각되며, 치매 예방 및 중재를 위한 임상 연구의 핵심적인 목표로 여겨지고 있다.
MCI의 조기 선별이 중요한 과제로 대두되면서, 이를 평가하기 위한 다양한 신경심리검사가 사용되고 있다. 그 중에서도 ‘Minimental State Examination (MMSE; Folstein, Folstein, & McHugh, 1975)’은 치매 및 인지 결함을 선별하는 대표적인 검사로, 지남력(orientation), 기억 등록(memory register), 기억 회상(memory recall), 주의력(attention) 및 언어(language) 능력 등 전반적인 인지 기능을 평가할 수 있고, 짧은 시간 내 시행이 가능하다는 점에서 널리 사용되고 있다(Folstein et al., 1975; Moorhouse, 2009). 국내에서는 MMSE가 한국어로 번안되어 한국판 간이 정신 상태 검사(Korean-Mini Mental State Examination, K-MMSE; Kang, 2006)로 활용되고 있다. 그러나 MMSE는 중증 치매를 선별하는 데는 높은 민감도(sensitivity)를 보이지만, MCI와 정상 노화를 구별하는 데는 한계가 있다(Lehrner et al., 2005; Nasreddine et al., 2005; Tang-Wai et al., 2003). 뿐만 아니라, MCI 집단이 치매로 진행되는 전이 과정을 감지(detection)하지 못하는 제한점이 보고되고 있다(Arevalo-Rodriguez et al., 2021). 이를 보완하기 위하여 국내외에서는 MCI 집단을 조기에 진단하기 위해 종합적인 신경심리 검사를 시행하고 있으며, 국내에서는 서울 신경심리검사(Seoul Neuropsychological Screening Battery-II, SNSB-II; Kang, Jang, & Na, 2012)가 사용되고 있다. 그러나 SNSB-II는 검사 시간이 길고, 평가 과정이 복잡하여, 대상자의 피로도를 증가시키고 집중력 저하를 유발할 가능성이 있다는 단점이 존재한다. 이에 따라, 보다 간편하고 신속하게 MCI 집단을 선별할 수 있는 검사 도구 개발이 중요한 연구과제로 부각되고 있다.
구어 유창성 검사(Verbal Fluency Test)란, 제한된 시간 동안 특정 범주에 해당하는 하위 단어를 생성해내는 과제로, 짧은 시간 내에 MCI 집단과 정상 노화 집단을 효과적으로 구별할 수 있으며 인지 저하를 민감하게 예측하는 핵심적인 선별 검사로 제안되고 있다(Choi, Sung, & Jeong, 2020; Galasko et al., 1990; Moorhouse, 2009; Sebaldt et al., 2009). 구어 유창성 검사는 크게 특정 의미 범주(semantic category) 내에서 하위 단어를 산출하는 의미 유창성 검사(semantic fluency test, SFT)와 특정 글자(letter)를 제시하고 해당 글자로 시작되는 단어를 산출하는 글자 유창성 검사(letter fluency test, LFT)로 나뉜다. 두 유형의 과제는 모두 전두엽(frontal lobe)의 집행 기능(executive function)과 관련이 있으며, 생성이름 대기 능력을 평가하는 데 활용된다. 선행연구에 따르면, SFT는 측두엽(temporal lobe)의 의미 기억(semantic memory)과 더 밀접한 관련이 있어, LFT보다 의미 기억이 손상된 치매 집단을 정교하게 선별하는데 유리한 것으로 보고되었다(Henry, Crawford, & Phillips, 2004; Kim, Kim, Wolters, MacPherson, & Park, 2019; Lópezde-Ipiña et al., 2020). 뿐만 아니라 SFT는 MCI 집단을 정상 노년층으로부터 구별할 수 있을 뿐만 아니라, MCI에서 치매로 진행되는 집단을 더 민감하게 탐지한다고 하였다(Benoit, Chan, Piller, & Doody, 2020; Dudas, Clague, Thompson, Graham, & Hodges, 2005; Quaranta et al., 2016; Taler & Phillips, 2008). McDonnell 등 (2020)은 정상, MCI 및 치매 집단의 구어 유창성 수행력을 비교한 결과, SFT에서 집단 간 차이를 뚜렷하게 나타내는 것으로 보고하였다. 또한, Rinehardt 등(2014)은 MCI 집단이 정상 노년층과 유사한 구어 유창성 수행력 패턴을 보였지만, 알츠하이머성 치매로 진행될수록 의미 기억 저하가 두드러지면서, SFT의 수행력이 LFT보다 더욱 급격히 감소하는 패턴을 확인하였다. 이러한 결과는 SFT가 MCI 및 AD 환자의 의미 기억 변화를 민감하게 반영할 수 있는 도구임을 시사한다.
국내에서도 구어 유창성 검사를 활용하여 정상군, MCI, 및 알츠하이머성 치매 집단의 수행력을 비교한 연구가 진행되었다(Choi, Kim, Lee, & Kim, 2013). 그 결과, SFT와 LFT 모두에서 정상군, MCI 집단, 알츠하이머성 치매 집단 순으로 유의한 수행력의 차이가 나타났다(Choi et al., 2013). 이는 퇴행성 질환으로 진행될수록 의미 기억 및 집행 기능과 관련된 단어 검색 및 인출 과정에서 어려움을 겪는다는 점을 시사한다. 그러나 해당 연구에서는 MCI 집단 내에서 SFT와 LFT 중 어느 유형의 수행력이 더 저하되는지에 대한 직접적인 비교는 이루어지지 않았으며, 두 가지 유형 간 차이를 통계적으로 검증하지 않았다. 따라서, 한국어 사용 MCI 집단을 대상으로 구어 유창성 검사의 하위 유형 중 어떤 유형이 MCI의 언어적 결함을 더 민감하게 반영하는지 확인하는 데에는 한계가 있다. 그럼에도 불구하고, 국내외 선행연구들은 구어 유창성 검사가 MCI 집단의 인지적 결함을 평가하는 데 유용하다는 점을 일관되게 보고하고 있다(Baldo & Shimamura, 1998; Choi et al., 2013; Hsieh, Schubert, Hoon, Mioshi, & Hodges, 2013).
최근에는 동사 유창성 검사(Action Fluency Test, AFT)가 MCI의 언어적 특징을 민감하게 선별할 수 있는 검사 도구로 주목받고 있다(Alegret et al., 2018; Choi et al., 2020; Östberg, Fernaeus, Hellström, Bogdanović, & Wahlund, 2005). AFT는 SFT와 비교하였을 때, 전두엽의 기능을 보다 민감하게 반영하는 과제로(Woods et al., 2005), MCI 집단을 정상 노년층과 유의미하게 구분해주는 유용한 지표로 보고되고 있다(Choi et al., 2020). Östberg 등(2005)은 주관적 인지 장애(subjective cognitive impairment), MCI, 알츠하이머성 치매 집단을 대상으로 SFT, LFT 및 AFT의 수행력을 비교한 결과, 명사 중심의 SFT 및 LFT보다 동사를 산출하는 AFT에서 MCI 집단의 수행력 저하가 더욱 두드러지며, 이러한 특징이 초기 치매를 선별하는 데 유용한 언어적 지표로 활용될 수 있음을 강조하였다. 특히, 그들은 MCI 집단이 내후각피질(parahippocampal region) 의 변성과 같은 대뇌 퇴행성 변화를 보이는데, AFT가 이러한 변화를 민감하게 반영할 수 있는 검사 도구임을 제안하였다(Östberg et al., 2005). 또한 Alegret 등(2018) 역시 AFT가 정상 노화로부터 MCI 집단을 효과적으로 구별할 뿐만 아니라, MCI와 알츠하이머성 치매 간의 차이를 판별하는 데 유의미한 검사라고 하였다. 더욱이 AFT는 정상 노화에서 MCI로의 전환 뿐만 아니라, MCI에서 알츠하이머성 치매로 진행되는 과정을 예측하는 데에도 민감한 검사 도구임을 제안하였다(Alegret et al., 2018).
국내에서도 MCI 집단을 대상으로 SFT와 AFT의 수행력을 비교한 연구가 진행되었다(Choi et al., 2020). 연구결과, MCI 집단은 두 가지 유형의 구어 유창성 검사에서 정상 노년층에 비해 수행력이 저하되었으며, 특히 AFT에서의 수행력 저하가 더욱 두드러지게 나타났다. 뿐만 아니라, AFT에서 산출된 동사의 질적 분석을 실시한 결과, MCI 집단은 정상 노년층에 비해 타동사(transitive verbs)를 산출하는 데 결함을 보이는 것으로 확인되었다. 이는 AFT가 MCI 집단의 민감성을 입증하는 동시에, 특정 동사 유형에서 나타나는 결함을 측정하는 유용한 검사 도구가 될 수 있음을 시사한다. 특히, 한국어의 경우 동사 후치어로, 문장에서 동사가 마지막에 위치하는 특성이 있으며, 동사 산출 전 다양한 의미역(thematic role)을 고려해야 한다. 또한, 한국어는 문장에서 동사가 단독으로 사용될 수 있는 동사 중심(verb-salient) 언어이므로(Sung, 2015; Sung, Scimeca, Li, & Kiran, 2024), AFT가 한국어 사용자에게 더욱 민감한 평가 도구가 될 가능성이 높다. 이러한 점에서, 한국어를 사용하는 MCI 집단에서 AFT가 보다 중요한 선별 도구로 활용될 수 있는지에 대한 추가적인 연구가 필요하다.
본 연구는 구어 유창성 검사의 하위 유형(SFT, LFT, AFT)을 비교하여, 정상 통제군(Normal Controls, NC)과 MCI 집단 간 수행력 차이를 분석하고, aMCI 감별에 가장 효과적인 구어 유창성 검사 유형을 확인하는 것을 목표로 하였다. 특히, 본 연구에서는 aMCI와 비기억형 MCI 집단을 구분해주는데 유용한 검사인 신경심리검사의 하위 인지 기능 검사들과 구어 유창성 검사 간의 상관관계를 확인하고자 하였다. 하위 인지 기능 검사에는 K-MMSE를 포함하여 서울 구어 학습 검사(Seoul Verbal Learning Test, SVLT; Kang, 2003)와 숫자 폭 검사(Digit Span Test, DST)를 시행하였다. SVLT는 영어권에서 개발된 California Verbal Learning Test (Delis, Kramer, Kaplan, & Thompkins, 1987)의 한국형 검사로, MCI 및 치매와 같은 퇴행성 질환에서 구어 학습력(verbal learning)과 기억력 저하를 초기에 감지하고, 알츠하이머병으로의 전환 가능성을 예측하는 데 유용하다(Beck, Gagneux-Zurbriggen, Berres, Taylor, & Monsch, 2012; Elias et al., 2020). 또한 aMCI의 초기 단계에서 나타나는 학습 및 기억 전략의 변화를 감지할 수 있어, MCI의 하위 유형을 구분하는 데도 효과적인 것으로 알려져 있다(Christensen, Multhaup, Nordstrom, & Voss, 1991; de Jager, Schrijnemaekers, Honey, & Budge, 2009; Rahmani et al., 2022). DST는 작업 기억(Working Memory)을 평가하는 검사로, 정상 노년층과 초기 인지 저하를 보이는 MCI 집단을 선별할 뿐 아니라, aMCI를 다른 아형으로부터 구별해주는 데 중요한 역할을 한다(Saunders & Summers, 2011). 이러한 인지 기능 검사들은 MCI 집단의 진단에 중요한 요소로, 다양한 인지 수행력을 반영하고 있기 때문에, MCI의 선별에 민감한 구어 유창성 검사와 높은 상관성을 보일 가능성이 크다(Duff et al., 2008; McDonnell et al., 2020). 이에 본 연구에서는 이러한 인지 기능 검사들과 구어 유창성 검사 간의 상관관계를 분석하고자 하였다. 이를 기반으로 상관을 보이는 인지 기능 검사의 영향을 통제한 상태에서 구어 유창성 검사의 독립적인 예측력을 평가하고, 두 집단을 가장 잘 구분해주는 구어 유창성 검사의 유형을 확인하는데 최종 목적이 있다. 본 연구의 구체적인 연구질문은 다음과 같다.
1. 집단 간(MCI vs. NC) 구어 유창성 검사 유형(SFT, LFT, AFT)에 따른 수행력에는 유의한 차이가 있는가?
2. 집단 내에서 구어 유창성 검사 유형(SFT, LFT, AFT)과 인지 기능 검사(K-MMSE, SVLT, DST) 수행력 간의 상관은 어떠한가?
3. 인지 기능 검사 수행력을 통제한 후, 두 집단(MCI vs. NC)을 가장 잘 구별해주는 구어 유창성 검사의 유형은 무엇인가?

연구방법

연구대상

본 연구에는 서울 및 경기도권에 거주하는 만 60세 이상의 MCI 집단 26명과 연령, 교육년수 및 성별을 일치시킨 NC 집단 26명이 참여하였다. 연구는 이화여자대학교 생명윤리위원회(Institutional Review Board, IRB)의 사전 승인을 받은 후 실시되었으며(N0. 116-1), 모든 대상자는 연구 참여 동의서에 서명한 뒤 참여하였다.
MCI 집단은 신경과 전문의로부터 기억력 관련 영역의 저하를 포함한 다중 영역 aMCI로 진단받았으며, Petersen (2004)의 기준에 부합하는 자들로 선정되었다. 세부적인 MCI 선정 기준으로는 1) 환자 본인 또는 보호자의 보고에 의한 기억력 저하 호소, 2) 연령 및 교육년수 대비 기대되는 수준에 비해 저하된 기억력, 3) 서울 신경심리 검사 2판(SNSB-II; Kang et al., 2012)에서 전반적인 인지 검사 결과 하위 인지 기능 항목 중 기억 영역을 포함한 2가지 이상의 영역에서 17%ile 미만의 기억력 장애를 보이고(Lim, Kim, Baek, Park, & Kim, 2005), 4) K-MMSE에서 정상 범주에 속하며, 5) 한국형 도구적 일상생활 활동(Korean-Instrumental Activities of Daily Living, K-IADL; Won et al., 2022) 검사 점수가 0.43점 미만으로 일상생활에 어려움이 없으며, 6) 단축형 노인 우울 척도(Short version of the Geriatric Depression Scale, SGDS; Jung, Kwak, Joe, & Lee, 1997)에서 8점 미만으로 기억력 장애가 우울증에서 기인하지 않으며, 7) 임상 치매 척도(Clinical Dementia Rating, CDR; Hughes, Berg, Danzinger, Coben, & Martin, 1982)가 .5로 치매가 아닌 자로 선정하였다. 또한, 뇌졸중 등 인지 및 언어 장애를 유발할 수 있는 뇌 신경학적 질환이 없는 대상을 선정하였으며, Jack 등(2018)의 기준에 따라 미국 국립노화 연구소(National Institute on Aging-Alzheimer’s Association, NIA-AA)의 MCI 진단 기준을 충족하였다.
NC 집단은 MCI 집단과 연령, 교육년수 및 성별을 일치시킨 대상을 모집하였으며, 1) 건강선별설문지(Health Screening Questionnaire; Christensen et al., 1991)를 통해 인지 및 언어에 영향을 미칠 수 있는 정신과적 또는 신경학적 병력이 없으며, 2) K-MMSE 검사 결과 연령 및 교육년수 대비 정상 범주에 속하고, 3) SVLT 결과, 연령 및 교육년수 대비 16%ile 이상으로 정상 범위의 기억 및 구어학습 능력을 보이며, 4) K-IADL 점수가 .43점 미만으로 일상생활 유지에 어려움이 없으며, 5) SGDS에서 8점 미만으로 우울증과 같은 정신과학적 질환이 없는 자를 대상으로 하였다.
두 집단 간 인구통계학적 정보에 대한 기술 통계를 비교한 결과, MCI 집단의 평균 연령은 72.84세(SD=5.65), NC 집단은 72.57세(SD=6.47)로 연령 간 통계적으로 유의한 차이가 없었다(t(49.105)=.15, p=.87). 교육년수 또한 MCI 집단 평균 6.4년(SD=5.37), NC 집단 평균 6.42년(SD=3.74)으로 통계적으로 유의한 차이가 없었다(t(44.629)=-.01, p=.98). 두 집단 간 기술 통계 정보는 Table 1에 제시하였다.

연구과제

구어 유창성 검사(verbal fluency tests)

구어 유창성 검사는 제한 시간 1분 내에 제시되는 범주에 해당하는 단어를 최대한 많이 산출해내는 과제로, 본 연구에서는 SFT, LFT 및 AFT의 세 가지 검사를 각각 시행하였다. SFT는 ‘동물’과 ‘가게 물건’ 두 가지 의미 범주에서 각각 평가되었으며, ‘동물’ 범주를 우선 시행하고, 이후 ‘가게 물건’을 시행하였다. 대상자에게 “제가 ‘시작’하면 ‘동물 이름(가게나 슈퍼마켓에서 살 수 있는 물건)’을 최대한 빠르게 많이 말씀해주세요. 준비되셨습니까? 시작”이라는 지시문과 함께 실시되었다. 대상자의 모든 반응은 정오반응 기준과 상관없이 기록지에 기록하였고, 검사가 종료된 후, 총점을 산출하였다. 점수는 정반응 문항당 1점으로 계산하였으며, 오반응의 기준으로는 제시된 범주가 아닌 단어를 산출하면 정답에서 제외하고, 같은 단어를 반복해서 산출한 경우에는 최초 반응에 대해서만 점수를 부여하였고, 상위 개념의 단어(예: 새)와 함께 하위 단어(예: 참새, 까치, 제비 등)를 산출한 경우 상위 단어는 제외하고 하위 단어의 개수만을 정답으로 간주하였다.
LFT는 제시되는 글자 /ㄱ/, /ㅇ/, /ㅅ/으로 시작하는 단어를 산출하는 과제로, SFT에 비해 상대적으로 과제 이해에 어려움이 있을 수 있기 때문에 연습 문항을 시행하고, 본 문항을 시행하였다. 연습 문항의 지시문은 “지금부터 제가 어떤 글자를 말씀드리면, 그 글자로 시작하는 단어를 최대한 빠르게 많이 말씀해주시는 겁니다. 예를 들어 제가 /ㅂ/으로 시작하는 단어를 말씀해주세요라고 하면 ‘바지, 버섯, 부자’라고 대답해주시면 됩니다.”와 같이 제시되었으며, /ㅂ/으로 시작하는 단어 1-2개를 산출하도록 연습한 이후, /ㄱ/, /ㅇ/, /ㅅ/ 순서로 시행하였다. LFT 동안의 대상자의 모든 반응을 수기로 기록되었으며, 같은 단어를 반복해서 산출하거나, 특정 음소로 시작되지 않는 단어를 산출한 경우에는 오반응으로 처리하였다. 또한 고유명사(예: 사람 이름, 도시 이름 등)는 정반응에서 제외하였고, 파생어(예: 시아버지, 시어머니, 시누이 등)의 경우에는 첫 반응을 제외하고 모두 오반응으로 간주하여, 자주 사용하는 외래어(예: 스포츠, 잉크 등)는 정답으로 1점을 부여하였다.
AFT는 제한시간 동안 동사를 산출하는 과제로(Choi et al., 2020), 동사에 대한 이해를 돕기 위해 짧은 설명과 함께 과제를 시행하였다. 검사자는 “지금부터 행동, 움직임을 나타내는 단어를 최대한 빠르게 많이 말씀해주시면 됩니다. 예를 들어, 마시다, 쓸다, 주다’와 같은 단어들이 여기에 해당됩니다. 준비되셨습니까? 시작”이라는 지시문을 제시하고 검사를 시행하였다. AFT 역시 모든 반응은 수기로 기록되며, 정반응 문항당 1점으로 간주하여 총점을 계산하였다. 정반응으로 인정되는 동사의 범주는『표준국어대사전』에 등재된 동사 원형, 어근을 포함한 활용형(예: 달린다, 탔다 등), 그리고 ‘명사+하다’ 형태의 동사화 표현(예: 운동하다, 축구하다)을 모두 포함하였다. 연습 문항에서 제시한 동사를 반복해서 산출하거나, 동사 이외의 품사를 산출한 경우는 오반응으로 간주하였다. 또한 동일한 어근을 가진 동사를 여러 번 산출한 경우(예: 먹었다. 먹고 싶다. 먹다 등)에는 최초 반응만을 정답 반응으로 간주하였다.

인지 기능 검사

본 연구에서는 다양한 인지 영역을 종합적으로 평가할 수 있는 신경인지검사 SNSB-II의 하위 검사 중, 기존 선행연구들을 토대로(Choi et al., 2020; Sung, Choi, Kim, & Jeong, 2025), MCI의 인지 기능 선별에 가장 많이 활용되는 세 가지 검사를 선정하여 인지적 변수로 설정하였다. 첫 번째 인지 기능 검사는 K-MMSE로, 총 7개 범주(지남력, 기억 등록, 기억 회상, 주의 집중/계산, 언어 및 그리기)의 문항을 통해 전반적인 인지 및 언어 능력을 간편하게 평가하는 검사이다. 총점은 30점 만점이며, 연령 및 교육년수를 고려한 평균과 표준편차를 활용하여 평가하였다. 두 번째 인지 기능 검사는 기억력과 구어 학습 능력을 평가하는 SVLT이다. SVLT는 즉각 회상(immediate recall, SVLT-imm), 지연 회상(delayed recall, SVLTdel), 재인 검사(recognition, SVLT-rec)로 구성되며, 본 연구에서는 SVLT-imm과 SVLT-del 점수만을 사용하였다. 모든 검사는 정확하게 회상한 단어에만 점수를 부여하여 총점을 산출하였다. 마지막으로, 작업 기억 능력을 평가하기 위해 DST를 시행하였다. DST는 두 가지 하위 유형으로 구성되며, 제시된 숫자열을 들은 후 동일한 순서로 따라 하는 DST-forward를 우선 시행하고, 이후 역순으로 따라 하는 DST-backward를 실시하였다. DST는 대상자가 기억할 수 있는 최대 숫자 폭(span)과 총점(score)을 산출할 수 있으나, 본 연구에서는 DST-forward와 DST-backward의 총점을 기준으로 작업 기억 능력을 평가하였다.

연구절차

모든 대상자는 한 회기에 K-MMSE, SVLT, DST 및 구어 유창성 검사를 수행하였다. 구어 유창성 검사는 SFT를 먼저 시행한 후 LFT를 진행하였으며, 약 3분간 휴식 후 AFT를 시행하였다. 이후, 약 5분간의 휴식 후 DST를 실시하였다. SVLT 검사는 즉각 회상(SVLT-immediate)을 먼저 시행한 후, 지연 회상(SVLT-delayed) 시행 전 약 20분간 SVLT 수행력에 영향을 미치지 않는 기본 정보 수집 과정을 진행하였다. 이후 SVLT-delayed을 시행하였다. 모든 검사 과정은 대상자의 동의를 받아 녹음 및 녹화되었으며, 이는 과제별 정오 반응 확인을 위해 활용되었다.

통계분석

본 연구의 통계분석은 R 소프트웨어 버전 4.3 (R Core Team, 2019)을 활용하여 시행되었다. 연구질문에 따른 세부적인 통계 분석 절차는 다음과 같다. 모든 분석에 앞서, 구어 유창성 검사의 점수 체계를 통일하기 위해 베리맥스 회전(Varimax Rotation)을 사용한 주성분 분석(Principal Component Analysis, PCA)을 수행하였다. AFT 점수는 단일 검사로 총점이 하나만 존재하므로 독립변수로 그대로 사용할 수 있는 반면, SFT와 LFT는 각 유창성 범주 내 하위 점수가 존재하므로, PCA를 통해 축소된 요인을 생성하여 분석에 활용하였다. SFT의 PCA 분석 결과, 표본 적절성의 Kaiser-Meyer-Olkin (KMO) 측도는 .500, Bartlett의 구형성 검정 유의 확률은 .000으로 나타나 요인 분석에 적합한 것으로 확인되었다. 두 변수의 분산 설명력은 76.4%로 나타났으며, SFT의 ‘동물’과 ‘가게 물건’ 점수가 하나의 공통된 성분으로 묶일 수 있음을 확인하여, 두 점수의 평균값을 SFT 수행력으로 분석에 사용하였다. 동일한 방법으로, LFT의 하위 검사인 ‘/ㄱ/’, ‘/ㅇ/’, ‘/ㅅ/’에 대해 PCA를 실시한 결과, KMO 측도는 .761, Bartlett의 구형성 검정 유의 확률은 .000으로 요인 분석에 적합한 것으로 나타났다. 세 변수의 단일 요인은 전체 분산의 81.19%를 설명하였으며, 이에 따라 LFT의 하위 검사도 하나의 요인으로 축소할 수 있음을 확인하여 평균 점수를 분석에 사용하였다.
첫 번째 연구질문에 해당하는 집단(MCI vs. NC) 간 및 구어 유창성 검사 유형(SFT, LFT, AFT)의 수행력 차이를 분석하기 위해, Shapiro-Wilk 검정을 사용하여 정규성을 검토하였다. 그 결과, 정규성이 충족되지 않아, Mann-Whitney U 검정을 시행하여 집단 간 차이를 분석하였다.
둘째, 집단 내에서 구어 유창성 검사의 하위 유형과 인지 기능 검사(K-MMSE, SVLT, DST) 간의 상관관계를 피어슨 상관 분석(Pearson correlation analysis)을 통해 확인하였다. 이 때, K-MMSE는 점수가 단일 체계이기 때문에 원점수를 그대로 분석에 사용하였고, SVLT와 DST의 경우에는 하위 점수가 존재하기 때문에 PCA 분석을 통해 하나의 단일 체계로 축소하여 사용하고자 하였다. SVLT-immediate와 SVLT-delayed 점수가 하나의 차원으로 축소 가능한지 PCA 분석을 실시한 결과, 전체 분산의 80.5%를 설명하며 두 점수의 평균을 하나의 SVLT 수행력을 나타내는 변수로 설정하였다. 마찬가지로 DST-forward와 DST-backward도 PCA 분석 결과 분산 공통성이 79.8%로 나타나 하나의 차원으로 축소 가능하여 평균 DST 점수를 독립 변수로 포함하였다.
셋째, 인지적 변수를 통제한 상태에서 두 집단(MCI vs. NC)을 가장 잘 구별하는 구어 유창성 검사의 하위 유형을 확인하기 위해 이항 로지스틱 회귀 분석(Binary Logistic Regression)을 수행하였다. 이를 위해, 종속 변수를 집단(MCI vs. NC)으로 설정하고, 독립 변수를 구어 유창성 검사 점수(SFT, LFT, AFT)로 지정하였다. 또한, 인지 기능 검사(K-MMSE, SVLT, DST)를 공변량으로 설정하여 인지 기능 검사의 영향을 통제하였다.

연구결과

집단 간 구어 유창성 검사 수행력 비교

구어 유창성 검사 유형에 따른 집단 간 수행력 차이를 비교하기 위하여, Mann-Whitney U 검정을 시행하였다. 그 결과, ‘SFT (W=215, p=.024)’와 ‘AFT (W=167, p=.001)’ 수행력에서 집단 간 차이가 통계적으로 유의하였다. 반면 LFT의 수행력은 통계적으로 유의하지 않았다(W=404, p=.208). 구어 유창성 검사의 하위 유형별 집단 간 차이는 Figure 1Table 2에 제시하였다.

구어 유창성 검사 및 인지 기능 검사 간의 상관 관계

각 집단 내에서 구어 유창성 검사와 인지 기능 검사 간의 상관 관계를 분석하기 위해, 피어슨 상관 분석을 시행하였다. 먼저, MCI 집단 내에서의 상관 관계를 살펴보면, SFT는 K-MMSE (r =.46, p<.05) 및 DST (r=.43, p<.05)와 낮은 수준의 유의한 정적 상관을 보였으며, SVLT (r=.74, p<.001)와는 중간 정도 수준의 유의한 정적 상관을 나타냈다. 둘째, LFT는 K-MMSE (r =.56, p<.05) 및 SVLT (r=.55, p<.05)와 낮은 수준의 유의한 정적 상관을 보였으며, DST (r=.66, p<.001)와는 중간 수준의 유의한 정적 상관을 보였다. 마지막으로, AFT는 K-MMSE (r=.39, p<.05)와 중간 정도의 유의한 정적 상관을 보였고, DST (r=.49, p<.001)와는 낮은 수준의 유의한 정적 상관을 나타냈으나, SVLT (r=.32, p>.05)와는 유의한 상관 관계를 보이지 않았다.
다음으로, NC 집단에서 구어 유창성 검사와 인지 기능 검사 간의 상관 분석 결과를 살펴보면, SFT는 K-MMSE (r=.73, p<.001)와 높은 수준의 정적 상관을 보였으며, SVLT (r=.48, p<.001)와는 중간 수준, DST (r=.61, p<.001)와는 낮은 수준의 유의한 정적 상관을 나타냈다. LFT는 K-MMSE (r=.63, p<.001) 및 SVLT (r=.67, p<.001)와 중간 수준의 유의한 정적 상관을 보였으며, DST (r =.46, p<.05)와는 낮은 수준의 정적 상관을 보였다. 마지막으로, AFT는 K-MMSE (r=.57, p<.001) 및 SVLT (r=.53, p<.001)와 중간 수준의 유의한 정적 상관을 보인 반면, DST (r=.18, p>.05)와는 유의한 상관 관계를 나타내지 않았다. 각 집단별 피어슨 상관 계수에 대한 세부 정보는 Figure 2에 제시하였다. 또한 집단 간 인지 기능 검사 점수에 대한 기술통계 정보는 Table 3에 제시하였다.

집단을 구분해주는 구어 유창성 검사 하위 유형

두 집단(MCI vs. NC)을 구별하는 데 있어 구어 유창성 검사의 하위 유형(SFT, LFT, AFT)의 예측력을 평가하기 위해 이항 로지스틱 회귀 분석을 수행하였다. 앞선 분석에서 구어 유창성 검사와 인지 기능 검사 간 유의한 상관관계가 나타났기 때문에, 구어 유창성 검사의 독립적인 효과를 확인하고자 인지 기능 검사 점수(K-MMSE, SVLT, DST)를 공변량으로 통제한 상태에서 분석을 실시하였다. 우선, 모형의 유의성(model significance)을 확인하기 위해 실시한 Omnibus Test of Model Coefficients 결과, χ²(6)=18.124, p=.006으로 나타나, 본 회귀 모형이 통계적으로 유의미한 예측력을 가진다는 것이 확인되었다. 즉, 본 모델에 포함된 변수들이 집단(MCI vs. NC)을 분류하는 데 있어 의미 있는 기여를 하고 있음을 시사한다. 다음으로, 모형의 적합도(model fit)를 평가한 Hosmer and Lemeshow Test에서는 χ²(8)=8.555, p=.381로 나타나, 예측값과 실제 관측값 간의 차이가 통계적으로 유의하지 않아 본 모형이 데이터에 적합함을 보여주었다. 또한, 모형의 설명력(explanatory power)을 나타내는 Nagelkerke R²은 .608로 나타났다. 이는 본 회귀 모형이 전체 집단 분류의 약 60.8%를 설명하여, 구어 유창성 검사 점수와 인지 기능 검사 점수는 MCI 여부를 예측하는 데 있어 높은 수준의 기여도를 갖는 예측 변수임을 시사한다.
구어 유창성 검사 하위 유형의 유의성을 검토한 결과, AFT만이 두 집단을 구분하는 데 유의한 예측 변수로 나타났다(β=-.185, SE=.065, Wald=2.857, p=.004, Exp(β)=1.278). 이는 인지적 변수를 통제한 상태에서도 AFT가 MCI 집단을 구별하는 데 있어 독립적인 기여를 한다는 것을 의미한다. 반면, SFT (β=-.129, p=.069) 및 LFT (β=-.048, p=.126)는 통계적으로 유의하지 않았다. 본 회귀 모형의 전체 예측 성능을 평가한 결과, 정확도(accuracy)는 69.23%, 민감도(sensitivity)는 61.54%, 특이도(specificity)는 76.92%로 나타났다. 이 예측력은 모델에 포함된 모든 독립 변수의 종합적 효과를 반영한 것으로, 특히 이 중 AFT가 유의한 변수로 확인되었기에, 모델의 분류 성능에 있어 AFT의 기여도가 가장 크다고 해석할 수 있다. 모델의 판별력을 보다 종합적으로 평가하기 위해 ROC (receiver operating characteristic) 분석을 실시하였다. 그 결과, AUC (area under the curve) 값은 .685로 나타났으며, 이는 본 모형이 집단(MCI vs. NC)을 보통 정도의 정확성(moderate discrimination)으로 분류할 수 있음을 의미한다(Hosmer Jr, Lemeshow, & Sturdivant, 2013) (Figure 3).

논의 및 결론

MCI 집단은 알츠하이머성 치매로의 전환 가능성이 높아, 정상 노화와의 조기 감별이 중요한 과제로 대두되고 있다. 특히, aMCI의 경우 기억력 저하로 인해 인지 및 언어에서 특징적인 결함이 나타나므로, 이러한 미세한 언어적 결함을 조기에 선별할 수 있는 적절한 평가 도구를 선택하는 것이 매우 중요하다. 이러한 목적으로 국내에서는 SNSB-II와 같은 종합 신경심리 평가를 활용하여 MCI 집단의 인지 능력과 아형을 구분하고 있지만, 해당 검사는 소요 시간이 길고 평가 과정이 복잡하다는 등의 한계를 가지고 있다. 이러한 한계를 보완하기 위해, 국내외 연구에서는 구어 유창성 검사가 MCI 집단의 언어적 결함을 감별할 수 있는 대안적 검사로 제안되고 있다(Choi et al., 2020; Galasko et al., 1990; Moorhouse, 2009; Sebaldt et al., 2009). 특히, SFT와 LFT의 수행이 MCI 감별력에 영향을 미치며, 치매로의 전이 과정도 예측할 수 있다는 연구결과가 보고되고 있다(Benoit et al., 2020; Dudas et al., 2005; Quaranta et al., 2016; Taler & Phillips, 2008). 기존 연구들은 SFT와 LFT를 중심으로 진행되어 왔으나, 최근 연구에서는 동사 생성 과제인 AFT가 MCI 집단의 초기 언어적 결함을 더욱 민감하게 반영할 수 있는 검사로 보고되면서 그 중요성이 강조되고 있다(Choi et al., 2020; Östberg et al., 2005). 그러나 한국어를 사용하는 MCI 집단을 정상 노년층과 민감하게 구분할 수 있는지 여부를 검토하기 위해, SFT, LFT, AFT와 같은 구어 유창성 검사를 활용하고, 기존 신경심리 평가 도구들과의 상관관계를 통해 그 타당성을 검증한 연구는 여전히 제한적인 실정이다. 한국어는 영어권 언어와 달리 동사가 문장에서 더욱 중요한 역할을 차지하는 특성을 가지므로(Sung et al., 2024), AFT를 활용한 선별 검사가 한국어 사용자에게 보다 효과적인 평가 도구가 될 가능성이 높다. 이에 본 연구에서는 구어 유창성 검사의 하위 유형(SFT, LFT, AFT) 간 수행력을 비교하여, MCI 감별에 가장 효과적인 검사 유형을 규명하고자 하였다.
특히, 본 연구에서는 종합 신경심리 검사에 포함된 하위 인지 기능 검사 중, MCI 집단의 진단 및 아형 분류를 위한 대표적인 선별 검사로 사용되는 K-MMSE, SVLT, DST와 구어 유창성 검사 간의 상관 관계를 분석하고자 하였다. 이들 검사와 구어 유창성 검사 간의 유의미한 상관관계가 존재한다는 선행 연구결과를 바탕으로(Duff et al., 2008; McDonnell et al., 2020), 본 연구에서는 해당 검사들 간의 상관 관계를 검증하는 한편, 구어 유창성 검사의 독립적인 선별력을 평가하기 위해 인지 기능 변수를 통제한 상태에서 MCI와 정상 집단을 가장 효과적으로 구별할 수 있는 구어 유창성 검사 유형을 확인하고자 하였다. 이를 통해 aMCI 집단을 대상으로 임상에서 필수적으로 고려해야 할 평가 항목을 제시하고, 치매 조기 진단 및 예방을 위한 평가 전략을 마련하는데 기여하고자 한다.
첫 번째 연구질문인 구어 유창성 검사의 유형에 따른 집단 간 차이에 대한 결과를 살펴보면, MCI 집단은 NC에 비해 SFT와 AFT에서 유의한 수행력 저하를 보였으나, LFT에서는 수행력 차이를 보이지 않았다. 이러한 결과는 MCI 집단과 NC 집단의 SFT와 LFT 수행력을 비교한 McDonnell 등(2020)의 연구와 일치한다. 다만, Mc-Donnell 등(2020)의 연구에서는 aMCI 집단 내에서 SFT의 수행력이 LFT에 비해 상대적으로 더 큰 결함을 보였다고 보고된 반면, 본 연구에서는 MCI 집단의 SFT 평균 수행력이 LFT보다 높아 상반된 결과를 보였다. 이러한 차이는 분석에 사용된 SFT와 LFT의 검사 점수 유형 차이에 기인한 것으로 해석할 수 있다. McDonnell 등(2020)의 연구에서는 SFT는 ‘동물’ 유창성 검사 점수만을 포함한 반면, LFT는 ‘F, A, S’의 세 가지 유형의 총점으로 수행력을 분석하였다. 반면 본 연구에서는 PCA 분석을 통해 SFT의 ‘동물’과 ‘가게 물건’ 범주, 그리고 LFT의 ‘/ㄱ/, /ㅇ/, /ㅅ/’ 글자 유형의 평균 점수를 계산하여 하나의 차원으로 축소한 뒤 비교한 점에서 차이가 있다. 그럼에도 불구하고, 본 연구에서 MCI 집단의 ‘동물’과 ‘가게 물건’ 범주의 평균 점수, 그리고 LFT의 세 가지 글자 유형의 평균 점수를 각각 비교했을 때도 SFT 수행력이 더 높은 것으로 나타났다. 이는 MCI 집단이 LFT에 비해 SFT에서 더 나은 수행력을 보인다는 기존 연구결과(McDonnell et al., 2020; Rinehardt et al., 2014)를 지지하는 것으로 해석된다.
그러나 본 연구의 결과는 LFT에서 MCI 집단과 NC 집단의 수행력 차이가 유의하다는 또 다른 선행연구 결과와는 상이하였다(Choi, 2011). Choi (2011)는 NC, MCI, 알츠하이머성 치매 집단 간 SFT와 LFT의 수행력을 비교한 결과, SFT는 NC와 MCI 간 수행력 차이를 보였지만 MCI와 AD 간에는 유의미한 차이를 보이지 않았으며, LFT에서는 NC, MCI, AD 집단 순으로 수행력이 유의하게 감소하는 경향을 나타냈다고 보고했다. 다만, Choi (2011) 연구에서 사용된 변수는 SFT의 ‘동물’ 범주의 원점수와 LFT 세 가지 유형 원 점수의 총점으로 설정되었으며, 이는 본 연구에서 사용한 분석 변수와는 차이를 보인다. 이와 같은 연구결과를 종합해볼 때, SFT는 분석 변수의 형태와 관계없이 NC와 MCI 집단 간 차이를 비교적 명확히 드러내는 반면, LFT에서는 연구에 따라 일관되지 않은 결과가 보고된다. 그러나 본 연구에서는 PCA 분석을 통해 유창성 검사의 하위 점수가 하나의 공통 분산 구조를 가지며 단일 차원으로 축소될 수 있다는 가정하에 평균 점수를 비교하였다. 따라서 기존 연구와 비교했을 때, 통계적 타당성이 검증된 변수를 사용했다는 점에서 본 연구는 추가적인 의의를 가진다. 결론적으로, SFT와 LFT의 분석 변수에 따라 나타나는 차이를 보다 명확히 규명하기 위해 다양한 조건과 방법을 활용한 후속연구가 필요할 것이다.
특히, 본 연구의 결과 중 AFT에서 두 집단 간 차이가 유의하게 나타난 점은 주목할 만하다. 이는 AFT가 MCI의 생성이름대기 결함을 선별하는 데 있어 민감한 도구임을 시사한다. Östberg와 연구자들은 MCI, 치매, 주관적 인지 장애 집단의 SFT, LFT, AFT 수행력을 비교한 결과, MCI 집단이 다른 두 집단에 비해 AFT에서 두드러지는 결함을 보였으며, AFT 초반 10초가 SFT 및 LFT와 달리 MCI를 다른 두 집단과 구별하는 주요 시간 간격임이 확인되었다(Östberg et al., 2005). 다만, 해당 연구는 NC 집단을 포함하지 않았다는 제한점이 있으며, 이로 인해 정상 노화와 MCI 집단 간 AFT 과제 수행 차이를 명확히 확인하지 못한 한계가 있다(Östberg et al., 2005). 또한, 본 연구결과는 명사 및 동사 유창성 검사 유형에 따른 NC 집단과 MCI 집단 간 비교 연구와도 부분적으로 일치하였다. Choi 등(2020)의 연구에 따르면, 두 집단 모두 SFT보다 AFT에서 수행력이 저조했는데, 이는 동사가 명사와 달리 의미 관계를 즉석에서 재구조화해야 하는 특성 때문으로 해석된다(Östberg et al., 2005). 명사는 계층적 범주 구조(예: ‘오리-새-동물’)에 의해 쉽게 조직화되어 연관된 의미를 떠올리기 쉬운 반면(Wierzbicka, 1996), 동사는 이러한 계층 구조가 부족하여 의미 관계를 스스로 구성해야 하기 때문에 더 큰 손상을 보이며, 이러한 손상이 aMCI 집단에서 두드러지게 나타나는 것이다(Östberg et al., 2005). 더 나아가, AFT는 특히 신피질-해마 상호작용, 특히 전두엽, 전측 대상회, 그리고 해마 주변 피질(perirhinal cortex)의 기능에 크게 의존한다(Burwell, 2000). 이 영역은 알츠하이머병 초기 단계에서 병리학적 변화가 두드러지는 곳으로, 이는 MCI의 주요 병리적 특징을 설명한다. 따라서 AFT는 MCI 집단에서의 특정 병리학적 변화를 간접적으로 선별할 수 있는 중요한 도구로 활용될 수 있음을 시사한다.
둘째, 본 연구에서는 MCI 집단과 NC 집단에서 구어 유창성 검사(SFT, LFT, AFT)와 인지 기능 검사(K-MMSE, SVLT, DST) 간의 상관 관계를 분석하였다. 그 결과, SFT와 LFT는 두 집단 모두에서 K-MMSE, SVLT, DST와 낮은 수준에서 중간 수준의 유의한 정적 상관을 보였다. 이는 SFT와 LFT가 단순한 단어 회상 능력을 평가하는 것이 아니라, 다양한 인지 기능(예: 전반적인 인지 능력, 의미 기억, 실행 기능 및 작업 기억)을 반영하는 복합적인 과제임을 시사한다는 선행연구 결과와 부분적으로 일치한다(Duff et al., 2008; McDonnell et al., 2020). SFT는 의미 체계를 활용하여 단어를 회상하는 과정에서 의미 기억과 밀접하게 관련되기 때문에, SVLT에서 요구되는 단어 학습 및 회상 능력과 높은 연관성을 보일 가능성이 있다. 또한, LFT는 특정 음소를 기반으로 단어를 생성해야 하므로 전략적인 정보 검색과 실행 기능이 강조되며, 이는 작업 기억과 주의력을 평가하는 DST와 높은 상관관계를 나타낼 가능성이 크다. 또한 동시에 두 과제는 모두 빠른 단어 검색과 효율적인 조직화가 필요하므로, 전반적인 인지 기능을 평가하는 K-MMSE와도 연관될 수 있다. 즉, SFT와 LFT는 단순한 단어 회상 과제가 아니라, 의미 기억과 실행 기능이 결합된 복합적인 인지 능력을 반영하는 검사로, 이러한 특성이 집단 구분 없이 모든 인지 기능 검사(K-MMSE, SVLT, DST)와의 유의한 상관관계로 나타난 것으로 해석할 수 있다.
반면, AFT는 두 집단 모두 K-MMSE와 정적 상관을 보여, AFT의 수행력이 집단에 상관없이 전반적인 인지 능력을 반영한다는 결론을 내릴 수 있다. 그러나 MCI 집단에서는 AFT와 작업 기억력을 나타내는 DST와 유의한 상관을 보였으나, 의미 기억과 관련된 SVLT와는 유의한 상관이 없었다. 그러나 NC는 이와 상반된 패턴을 보였다. 이러한 차이는 AFT가 요구하는 인지적 과정과 각 집단의 특성이 다르게 나타나는 방식에 기인할 가능성이 있음을 시사한다. AFT는 동사를 생성하는 과정에서 문법적(grammatical) 및 구문적(syntactic) 처리와 실행 기능을 더 많이 요구하는 과제(Choi et al., 2020)로, MCI 집단에서는 AFT가 의미 기억보다는 실행 기능과 작업 기억과 더 밀접한 연관성을 보이는 것으로 해석할 수 있다. 이는 MCI 집단에서 의미 기억이 저하된 상태에서, 보상적으로 실행 기능과 작업 기억을 더 많이 활용하여 단어를 생성하려 했을 가능성이 있다. 반면, NC에서는 AFT 수행 시 실행 기능보다는 의미 기억을 기반으로 동사를 생성하는 능력이 유지되었기 때문에, SVLT와 유의한 상관을 보였고, DST와의 상관은 유의하지 않았다. 이러한 상관 분석을 통해 MCI 집단은 AFT를 수행할 때, 의미 기억의 저하로 인하여 작업 기억에 더 많이 의존하는 경향으로 짐작해 볼 수 있어, MCI의 특징을 확인하는데 그 의미가 있음을 확인하였다. 따라서, AFT는 단순한 동사 생성 과제가 아닌, 문법적·구문적 처리가 포함된 복합적인 언어 과제로서, 집단에 따라 의미 기억과 실행 기능의 기여도가 다르게 나타날 가능성이 있다. 이러한 결과는 AFT가 기존의 구어 유창성 검사(예: SFT, LFT)와는 차별적인 인지적 요구를 반영하는 검사이며, 특히 MCI 감별에 있어서 새로운 평가 도구로 활용될 가능성이 있음을 시사한다.
마지막으로 본 연구의 가장 핵심적인 연구 목적은, 구어 유창성 검사의 세 가지 유형 중 MCI 집단과 정상 노화 집단을 가장 효과적으로 구별할 수 있는 검사 유형을 확인하고, 정상 노화 과정과 MCI를 감별할 수 있는 효율적인 평가 도구를 제안하는 데 있다. 이를 위해, 집단 간 비교 분석에 앞서, 두 번째 연구 질문을 통해 구어 유창성 검사 수행력과 인지적 변수 간의 유의한 정적 상관이 존재함을 확인하였다. 이러한 결과를 바탕으로, 본 연구에서는 인지적 변수가 구어 유창성 검사에 미치는 영향을 통제한 상태에서, 구어 유창성 검사의 독립적인 선별력을 평가하기 위해 이항 로지스틱 회귀 분석을 수행하였다. 그 결과, 두 집단을 가장 잘 구별할 수 있는 구어 유창성 검사 유형으로 AFT가 단독으로 유의하게 나타났다. 이러한 결과는 MCI와 NC를 대상으로 SFT와 AFT의 수행력을 비교하고, AFT에서의 유의한 수행력 차이를 보였다는 국내의 선행 연구의 결과와도 부분적으로 일치하였다(Choi et al., 2020). 우리의 연구결과는 AFT가 한국어 사용 MCI 집단의 선별에 있어 중요한 평가 도구가 될 수 있음을 시사하며, 본 연구가 이러한 이론적 근거를 제시했다는 점에서 학문적 의의가 크다.
AFT가 집단을 감별하는 효과적인 검사로 검증된 이유는, 한국어의 동사 사용 특성과 밀접한 연관이 있을 가능성이 있다. 한국어는 ‘S (subject) + O (object) + V (verb)’ 구조를 가지는 언어로, 문장에서 동사가 마지막에 위치한다는 특징이 있다. 따라서 동사를 산출하기 위해서는 필수적으로 주어와 목적어에 해당하는 논항(argument)이 선행되어야 하며, 이 과정에서 인지적 부담(cognitive load)이 증가하게 된다. 즉, 문장 전체를 산출하지 않더라도, 동사 생성 과정에서 집행 기능이 요구되며, 이에 따른 인지적 노력이 증가할 수 있다. 특히, AFT는 명사 산출 과제보다 전두엽(frontal lobe)의 기능을 더욱 민감하게 반영하는 검사로 알려져 있으며(Woods et al., 2005), 본 연구에서도 MCI 집단과 정상 노년층을 감별하는 중요한 평가 도구로서의 유용성이 확인되었다. 이는 동사가 명사보다 문법적 요소가 강하고, 논항 구조를 형성해야 하는 특성으로 인해, 인지적 부담이 더 크게 작용할 가능성이 있기 때문이다. 따라서, 전반적인 인지 기능 저하와 인지 용량(capacity)이 제한된 MCI 집단은 통사적으로 복잡한 구조를 요구하는 과제에서 더 큰 어려움을 보일 수 있으며, 이러한 특성이 AFT 수행에서의 결함으로 나타날 수 있다. 그러므로 AFT는 기존의 명사 중심 구어 유창성 검사와 차별적인 인지적 요구를 반영하며, MCI 감별을 위한 보다 민감한 평가 도구로 활용될 가능성이 높다.
즉, MCI 집단의 인지 및 언어 결함을 진단하는 과정에서 AFT는 전두엽 기반의 실행 기능과 언어 생성 능력을 통합적으로 반영하는 과제로서 필수적으로 포함될 필요가 있으며, 이를 통해 진단 및 평가의 민감도와 정확도를 향상시킬 수 있을 것이다. 특히 AFT는 행동 중심의 동사 산출 능력 평가를 통해, 명사 중심의 유창성 과제로는 포착하기 어려운 언어적 결함을 조기에 탐지할 수 있다는 점에서 이론적 의의를 지닌다. 따라서 본 연구는 AFT가 MCI 초기 병리적 변화를 반영하는 민감한 언어적 지표로 활용될 수 있으며, 향후 임상 현장에서의 선별 및 감별 진단 도구로서의 가능성을 보여준다는 점에서 임상적 의의가 크다.
그러나 본 연구에는 몇 가지 제한점이 존재한다. 첫째, 본 연구는 aMCI 아형만을 대상으로 하였으므로, MCI의 다른 아형에 결과를 일반화하기에는 한계가 있다. 따라서 추후 연구에서는 MCI의 다양한 아형을 포함하여 구어 유창성 검사와 수행력 차이를 비교하고, 각 아형을 가장 잘 판별해내는 검사를 확인하는 것이 유의미할 것이다. 또한, MCI 집단의 장기 추적 연구를 통해 AFT가 MCI 집단의 치매로의 전이율을 예측할 수 있는 지 확인하는 것이, AFT의 유용성을 검증하는데 보다 명확한 근거를 제공할 수 있을 것이다. 추가적으로 AFT의 민감도가 한국어의 동사 특성이 반영된 한국어 사용자들에게 특화되었는지 혹은 영어권 사용자들에게도 유의한 항목인지 등의 비교 언어적 검증이 추가된다면, 신경퇴행성 질환의 판별에 있어 새로운 선별 검사를 제안할 수 있다는데 큰 의의가 있을 것이다.

Figure 1.
Mean scores of verbal fluency tests in mild cognitive impairment (MCI) groups and normal control (NC) groups.
*p < .05.
csd-30-4-827f1.jpg
Figure 2.
Heatmap of Pearson correlation coefficients between verbal fluency tests and cognitive measures in mild cognitive impairment (MCI) and normal control (NC) groups.
K-MMSE= Korean-mini mental state examination (Kang, 2006); SVLT= Seoul verbal learning test (Kang & Na, 2003); DST= Digit span task; SFT= Semantic fluency test; LFT= Letter fluency test; AFT= Action fluency test.
csd-30-4-827f2.jpg
Figure 3.
ROC curve for MCI classification based on verbal fluency performance.
csd-30-4-827f3.jpg
Table 1.
Demographic information of each group
MCI group (N= 26) NC group (N= 26) t p
Gender (Male:Female) 6:20 6:20 - -
Age (yrs) 72.84 ± 5.65 (61-83) 72.57 ± 6.47 (61-81) .15 .87
Education (yrs) 6.4 ± 5.37 (0.5-18) 6.42 ± 3.74 (0.5-16) -.01 .98

Values are presented as mean± SD (range).

MCI= Mild cognitive impairment; NC= Normal control.

Table 2.
Mean scores (with standard deviations) of each verbal fluency test across groups
MCI group (N = 26) NC group (N = 26) W p
SFT 12.15 ± 4.08 (4.5-18) 15.04 ± 4.47 (8-22.5) 215 .024*
LFT 4.94 ± 3.15 (1.3-14) 6.37 ± 3.45 (1-13.3) 404 .208
AFT 7.42 ± 4.98 (1-16) 10.88 ± 4.19 (5-18) 167 .001**

Values are presented as mean± SD (range).

MCI=Mild cognitive impairment; NC=Normal control; SFT= Semantic fluency test; LFT= Letter fluency test; AFT= Action fluency test.

* p < .05,

** p < .01.

Table 3.
Mean and standard deviation scores of each cognitive function test across groups
MCI group (N = 26) NC group (N = 26) t p
K-MMSE (/30) 24.5 ± 3.37 (17-30) 25.8 ± 3.95 (16-30) -1.208 .23
SVLT (/24) 10.69 ± 4.41 (2.5-19) 10.5 ± 4.18 (2.5-17) .161 .873
DST (/14) 3.9 ± 1.7 (1-8.5) 5.57 ± 2.22 (2-11) -3.032 .004*

Values are presented as mean± SD (range).

MCI =Mild cognitive impairment; NC=Normal control; K-MMSE = Korean-mini mental state examination (Kang, 2006); SVLT= Seoul verbal learning test (Kang & Na, 2003); DST= Digit span task.

* p < .05.

REFERENCES

Alegret, M., Peretó, M., Pérez, A., Valero, S., Espinosa, A., Ortega, G., ..., & Boada, M. (2018). The role of verb fluency in the detection of early cognitive impairment in Alzheimer’s disease. Journal of Alzheimer’s Disease, 62(2), 611–619.
crossref
Arevalo-Rodriguez, I., Smailagic, N., Roqué-Figuls, M., Ciapponi, A., Sanchez-Perez, E., Giannakou, A., ..., & Cullum, S. (2021). Mini‐Mental State Examination (MMSE) for the early detection of dementia in people with mild cognitive impairment (MCI). Cochrane Database of Systematic Reviews(7), .
crossref
Baldo, J. V., & Shimamura, A. P. (1998). Letter and category fluency in patients with frontal lobe lesions. Neuropsychology, 12(2), 259.
crossref pmid
Beck, I. R., Gagneux-Zurbriggen, A., Berres, M., Taylor, K. I., & Monsch, A. U. (2012). Comparison of verbal episodic memory measures: consortium to establish a registry for Alzheimer’s disease—Neuropsychological Assessment Battery (CERAD-NAB) versus California Verbal Learning Test (CVLT). Archives of Clinical Neuropsychology, 27(5), 510–519.
crossref pmid
Benoit, J. S., Chan, W., Piller, L., & Doody, R. (2020). Longitudinal sensitivity of Alzheimer’s disease severity staging. American Journal of Alzheimer’s Disease & Other Dementias, 35, 1533317520918719.
crossref
Burwell, R. D. (2000). The parahippocampal region: corticocortical connectivity. Annals of the New York Academy of Sciences, 911(1), 25–42.
crossref pmid
Christensen, K. J., Multhaup, K. S., Nordstrom, S., & Voss, K. (1991). A cognitive battery for dementia: development and measurement characteristics. Psychological Assessment: A Journal of Consulting & Clinical Psychology, 3(2), 168–174.
crossref
Choi, H. (2011). Detecting language deficits in patients with mild cognitive impairment through verbal fluency and picture description tasks. Communication Sciences & Disorders, 16(2), 171–184.

Choi, H., Kim, J. H., Lee, C. M., & Kim, J. I. (2013). Features of semantic language impairment in patients with amnestic mild cognitive impairment. Dementia and Neurocognitive Disorders, 12(2), 33–40.
crossref
Choi, S., Sung, J. E., & Jeong, J. H. (2020). Differential deficits of nouns and verbs in a generative naming task for individuals with mild cognitive impairment. Communication Sciences & Disorders, 25(1), 50–62.
crossref
de Jager, C. A., Schrijnemaekers, A. C. M., Honey, T. E., & Budge, M. M. (2009). Detection of MCI in the clinic: evaluation of the sensitivity and specificity of a computerised test battery, the Hopkins Verbal Learning Test and the MMSE. Age and ageing, 38(4), 455–460.
crossref pmid
Delis, D. C., Kramer, J. H., Kaplan, E., & Thompkins, B. A. O. (1987). CVLT: california verbal learning test-adult version: manual Psychological Corporation.

Dudas, R. B., Clague, F., Thompson, S. A., Graham, K. S., & Hodges, J. R. (2005). Episodic and semantic memory in mild cognitive impairment. Neuropsychologia, 43, 1266–1276.
crossref pmid
Duff, K., Beglinger, L. J., Van Der Heiden, S., Moser, D. J., Arndt, S., Schultz, S. K., & Paulsen, J. S. (2008). Short-term practice effects in amnestic mild cognitive impairment: implications for diagnosis and treatment. International Psychogeriatrics, 20(5), 986–999.
crossref pmid pmc
Elias, M. F., Beiser, A., Wolf, P. A., Au, R., White, R. F., & D’Agostino, R. B. (2000). The preclinical phase of Alzheimer disease: a 22-year prospective study of the Framingham Cohort. Archives of Neurology, 57(6), 808–813.
pmid
Folstein, M. F., Folstein, S. E., & McHugh, P. R. (1975). “Mini-mental state”: a practical method for grading the cognitive state of patients for the clinician. Journal of Psychiatric Research, 12(3), 189–198.
crossref pmid
Galasko, D., Klauber, M. R., Hofstetter, C. R., Salmon, D. P., Lasker, B., & Thal, L. J. (1990). The Mini-Mental State Examination in the early diagnosis of Alzheimer’s disease. Archives of Neurology, 47(1), 49–52.
crossref pmid
Gauthier, S., Reisberg, B., Zaudig, M., Petersen, R. C., Ritchie, K., Broich, K., ..., & Winblad, B. (2006). Mild cognitive impairment. The Lancet, 367(9518), 1262–1270.
crossref
Hsieh, S., Schubert, S., Hoon, C., Mioshi, E., & Hodges, J. R. (2013). Validation of the Addenbrooke’s Cognitive Examination III in frontotemporal dementia and Alzheimer’s disease. Dementia and Geriatric Cognitive Disorders, 36(3-4), 242–250.
crossref pmid
Henry, J. D., Crawford, J. R., & Phillips, L. H. (2004). Verbal fluency performance in dementia of the Alzheimer’s type: a meta-analysis. Neuropsychologia, 42(9), 1212–1222.
crossref pmid
Hosmer Jr, D. W., Lemeshow, S., & Sturdivant, R. X. (2013). Applied logistic regression John Wiley & Sons.

Hugues, C. P., Berg, L., Danzinger, W. L., Coben, L. A., & Martin, R. L. (1982). A new clinical scale for the staging of dementia. British Journal of Psychiatry, 140, 566–572.
crossref
Jack, C. R., Bennett, D. A., Blennow, K., Carrillo, M. C., Dunn, B., Haeberlein, S. B., ..., & Liu, E. (2018). NIA-AA Research Framework: toward a biological definition of Alzheimer’s disease. Alzheimer’s & Dementia, 14(4), 535–562.

Jung, I. K., Kwak, D. I., Joe, S. H., & Lee, H. S. (1997). A study of standardization of Korean form of geriatric depression scale (KGDS). Journal of Korean Geriatric Psychiatry, 1(1), 61–72.

Kang, Y. (2003). Seoul Verbal Learning Test (SVLT) Human Brain Research & Consulting Co.

Kang, Y. (2006). A normative study of the Korean Mini-Mental State Examination (K-MMSE) in the elderly. Korean J Psychology, 25, 1–12.

Kang, Y. U., Jang, S. M., & Na, D. L. (2012). Seoul Neuropsychological Screening Battery (SNSB-II) Seoul: Human Brain Research & Consulting Co.

Kim, N., Kim, J. H., Wolters, M. K., MacPherson, S. E., & Park, J. C. (2019). Automatic scoring of semantic fluency. Frontiers in Psychology, 10, 1020.
crossref pmid pmc
Lehrner, J., Gufler, R., Guttmann, G., Maly, J., Gleiß, A., Auff, E., & Dal-Bianco, P. (2005). Annual conversion to alzheimer disease among patients with memory complaints attending an outpatient memory clinic: the influence of amnestic mild cognitive impairment and the predictive value of neuropsychological testing. Wiener Klinische Wochenschrift, 117(18), .
crossref
Lim, J. S., Kim, J. E., Baek, M. J., Park, S. H., & Kim, S. Y. (2005). Subtypes and their clinical characteristics of mild cognitive impairment (MCI): cross sectional study. Journal of the Korean Neurological Association, 348–355.

López-de-Ipiña, K., Martinez-de-Lizarduy, U., Calvo, P. M., Beitia, B., García-Melero, J., Fernández, E., ..., & Sanz, P. (2020). On the analysis of speech and disfluencies for automatic detection of Mild Cognitive Impairment. Neural Computing and Applications, 32, 15761–15769.
crossref
McDonnell, M., Dill, L., Panos, S., Amano, S., Brown, W., Giurgius, S., ..., & Miller, K. (2020). Verbal fluency as a screening tool for mild cognitive impairment. International Psychogeriatrics, 32(9), 1055–1062.
crossref pmid
Moorhouse, P. (2009). Screening for dementia in primary care. Can Rev Alzheimers Dis Other Demen, 12, 8–13.

Nasreddine, Z. S., Phillips, N. A., Bédirian, V., Charbonneau, S., Whitehead, V., Collin, I., ..., & Chertkow, H. (2005). The Montreal Cognitive Assessment, MoCA: a brief screening tool for mild cognitive impairment. Journal of the American Geriatrics Society, 53(4), 695–699.
crossref pmid
Östberg, P., Fernaeus, S. E., Hellström, Å., Bogdanović, N., & Wahlund, L. O. (2005). Impaired verb fluency: a sign of mild cognitive impairment. Brain and Language, 95(2), 273–279.
crossref pmid
Quaranta, D., Caprara, A., Piccininni, C., Vita, M. G., Gainotti, G., & Marra, C. (2016). Standardization, clinical validation, and typicality norms of a new test assessing semantic verbal fluency. Arch Clin Neuropsychol, 31, 434–445.
crossref pmid
Petersen, R. C., Doody, R., Kurz, A., Mohs, R. C., Morris, J. C., Rabins, P. V., ..., & Winblad, B. (2001). Current concepts in mild cognitive impairment. Archives of Neurology, 58(12), 1985–1992.
crossref pmid
Petersen, R. C. (2004). Mild cognitive impairment as a diagnostic entity. Journal of Internal Medicine, 256(3), 183–194.
crossref pmid
Rahmani, F., Khanjani, M. S., Marsa, R., Sharifi, G., Bahadori, E., & Sarani, E. M. (2022). Learning strategies and verbal memory deficits on the Shiraz verbal learning test in patients with alzheimer’s disease and amnestic mild cognitive impairment. Iranian Journal of Psychiatry and Behavioral Sciences, 16(2), .
crossref
Rinehardt, E., Eichstaedt, K., Schinka, J. A., Loewenstein, D. A., Mattingly, M., Fils, J., ..., & Schoenberg, M. R. (2014). Verbal fluency patterns in mild cognitive impairment and Alzheimer’s disease. Dementia and Geriatric Cognitive Disorders, 38(1-2), 1–9.
crossref pmid
Saunders, N. L., & Summers, M. J. (2011). Longitudinal deficits to attention, executive, and working memory in subtypes of mild cognitive impairment. Neuropsychology, 25(2), 237.
crossref pmid
Sebaldt, R., Dalziel, W., Massoud, F., Tanguay, A., Ward, R., Thabane, L., ..., & Lescrauwaet, B. (2009). Detection of cognitive impairment and dementia using the animal fluency test: the DECIDE study. Canadian Journal of Neurological Sciences, 36(5), 599–604.
crossref
Sung, J. E. (2015). Age-related changes in sentence production abilities and their relation to working-memory capacity: evidence from a verb-final language. PLoS One, 10(4), e0119424.
crossref pmid pmc
Sung, J. E., Scimeca, M., Li, R., & Kiran, S. (2024). Cross-linguistic and multicultural considerations in evaluating bilingual adults with aphasia. American Journal of Speech-Language Pathology, 33(6), 2716–2731.
crossref pmid pmc
Sung, J. E., Choi, S., Kim, G. H., & Jeong, J. H. (2025). Discourse-based verbal working memory training and transfer effects for individuals with an amnestic type of mild cognitive impairment. International Journal of Speech-Language Pathology, 27(1), 81–91.
crossref pmid
Taler, V., & Phillips, N. A. (2008). Language performance in Alzheimer’s disease and mild cognitive impairment: a comparative review. J Clin Exp Neuropsychol, 30, 501–556.
crossref pmid
Tang-Wai, D. F., Knopman, D. S., Geda, Y. E., Edland, S. D., Smith, G. E., Ivnik, R. J., ..., & Petersen, R. C. (2003). Comparison of the short test of mental status and the mini-mental state examination in mild cognitive impairment. Archives of Neurology, 60(12), 1777–1781.
crossref pmid
Wierzbicka, A. (1996). Semantics: primes and universals: primes and universals Oxford University Press;UK.

Won, C. W., Yang, K. Y., Rho, Y. G., Kim, S. Y., Lee, E. J., Yoon, J. L., ..., & Yoon, D. K. (2002). The development of Korean activities of daily living (K-ADL) and Korean instrumental activities of daily living (K-IADL) scale. Journal of the Korean Geriatrics Society, 6(2), 107–120.

Woods, S. P., Scott, J., Sires, D. A., Grant, I., Heaton, R. K., & Tröster, A. I. (2005). Action (verb) fluency: test-retest reliability, normative standards, and construct validity. Journal of the International Neuropsychological Society, 11(4), 408–415.
crossref pmid
Editorial office contact information
Communication Sciences & Disorders Editorial Office Department of Communication Disorders,
Korean Nazarene University, Wolbong-ro 48, Cheonan-city, Choongcheongnam-do, Korea

Tel: +82-502-196-1996   Fax: +82-53-359-6780   E-mail: kjcd@kasa1986.or.kr

Copyright © by Korean Academy of Speech-Language Pathology and Audiology.
About |  Browse Articles |  Current Issue |  For Authors and Reviewers
Developed in M2PI