Journal of Technologic Dentistry 2024; 46(2): 36-41
Published online June 30, 2024
https://doi.org/10.14347/jtd.2024.46.2.36
© Korean Academy of Dental Technology
배은정1, 임선영2
1부천대학교 치기공과, 2배재대학교 컴퓨터공학과
Eun-Jeong Bae1 , Sun-Young Ihm2
1Department of Dental Technology, Bucheon University, Bucheon, Korea
2Department of Computer Engineering, Pai Chai University, Daejeon, Korea
Correspondence to :
Sun-Young Ihm
Department of Computer Engineering, Pai Chai University, 155-40 Baejae-ro, Seo-gu, Daejeon 35345, Korea
E-mail: sunnyihm@pcu.ac.kr
https://orcid.org/0000-0002-7545-7035
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.
Purpose: This study aimed to generate virtual mandibular left first molar teeth using deep convolutional generative adversarial networks (DCGANs) and analyze their matching accuracy with actual tooth morphology to propose a new paradigm for using medical data.
Methods: Occlusal surface images of the mandibular left first molar scanned using a dental model scanner were analyzed using DCGANs. Overall, 100 training sets comprising 50 original and 50 background-removed images were created, thus generating 1,000 virtual teeth. These virtual teeth were classified based on the number of cusps and occlusal surface ratio, and subsequently, were analyzed for consistency by expert dental technicians over three rounds of examination. Statistical analysis was conducted using IBM SPSS Statistics ver. 23.0 (IBM), including intraclass correlation coefficient for intrarater reliability, one-way ANOVA, and Tukey’s post-hoc analysis.
Results: Virtual mandibular left first molars exhibited high consistency in the occlusal surface ratio but varied in other criteria. Moreover, consistency was the highest in the occlusal buccal lingual criteria at 91.9%, whereas discrepancies were observed most in the occusal buccal cusp criteria at 85.5%. Significant differences were observed among all groups (p<0.05).
Conclusion: Based on the classification of the virtually generated left mandibular first molar according to several criteria, DCGANs can generate virtual data highly similar to real data. Thus, subsequent research in the dental field, including the development of improved neural network structures, is necessary.
Keywords: Deep Convolutional Generative Adversarial Network, Deep learning, Tooth classification, Virtual tooth generation
4차 산업혁명과 관련하여 다양한 디지털 기술들이 개발되고 진보되면서 치과 분야에도 이를 활용한 수많은 연구가 활발하게 진행되고 있다. Three-dimensional 프린팅, 로봇 공학, 사물인터넷, 빅데이터, 그리고 인공지능과 같은 다양한 기술들이 융합되면서 의료 분야에서 빅데이터를 활용한 딥러닝 분석의 중요성이 커지고 있다[1]. 치과에서 사용되는 인공지능 기술은 분석, 해석, 진단, 그리고 치료 등 다양한 영역에서 활용되고 있다[2]. 딥러닝을 활용한 연구 사례로는 Bouali 등[3]이 콘빔 computed tomography 영상을 사용하여 자동 치과 검진을 위한 딥 컨볼루션 신경망 분석을 시도한 사례와, Bae 등[4]이 치아 구조를 분석하기 위해 딥러닝 알고리즘을 적용한 연구가 있다. 또한, Imangaliyev 등[5]이 치아 플라크 이미지 분류를 위한 딥러닝 연구를 수행한 사례도 있다.
효과적인 딥러닝 활용을 위해서는 방대한 양의 데이터가 필요하다. 의료 기록이 디지털화되면서 환자 건강관리 및 치료 과정 제공을 목적으로 그 활용 방안을 모색하고 있다[6]. 데이터 산업에서 의료 빅데이터의 활용은 매우 긍정적으로 평가되며, 새로운 패러다임의 해결책으로 주목 받고 있다[7]. 그러나 개인정보 보호 및 보안 위협에 대한 우려로 인해 절차와 허가 문제는 아직 초기 단계에 머물러 있다[8]. 더욱이 의료 데이터는 윤리적으로 민감하게 보호되어 있어 일반적으로 활용하기 어렵고, 연구 목적으로 사용한다고 해도 허가 절차가 복잡하다. 의료기관에서 수집한 데이터를 외부로 제공하는 것은 환자와 기관 모두에게 민감한 문제이므로 의료 데이터를 활용한 딥러닝은 한계가 있을 수밖에 없다.
심층 합성곱 생성적 적대 신경망(Deep Convolutional Generative Adversarial Network, DCGAN)은 입력된 정보를 바탕으로 그것과 아주 비슷한 가짜 정보를 만들고, 이를 평가하는 과정을 반복하여 실제와 매우 유사한 대체 데이터를 생산하는 독립적 학습법이다[9]. 기존의 생성적 적대 신경망(Generative Adversarial Network, GAN)이 가지던 해상도의 한계 등을 극복하기 위해 다양한 연구가 진행되면서 제안된 DCGAN은 장면을 이해하고 기존 GAN보다 더욱 고해상도의 세밀한 이미지를 생성할 수 있다. Ding 등[10]은 DCGAN을 이용하여 치관보철 디자인에 이용하면서 DCGAN이 자연 치아의 형태와 생체역학을 모방할 수 있는 높은 정확도의 개인 맞춤형 치관을 설계하는 데 활용될 수 있음을 입증하였다. Tsoi 등[11]은 DCGAN을 활용하여 전치 및 대구치 단일 치관 보철을 제작 알고리즘을 제안하면서 DCGAN으로 설계된 치관보철에 적절한 재료를 사용한다면 자연치아와 유사한 수명을 기대할 것으로 전망하였다.
의료 빅데이터 분석에서 DCGAN은 실제 데이터와 유사하지만 실제 데이터가 아닌 가짜 데이터를 생성할 수 있어 매우 높은 활용 가치를 가진다[12]. 그러나 DCGAN으로 생성된 대체 데이터가 실제 데이터와 얼마나 유사한지는 반드시 검증되어야 한다. DCGAN을 사용하여 실제 치아 형상을 학습시키고, 이와 유사한 가상 치아를 생성함으로써 딥러닝을 위한 데이터를 확보하는 것은 의료데이터 활용 방안에서 새로운 패러다임을 제시할 것이다[13]. 따라서 본 연구에서는 DCGAN을 사용하여 가상의 치아를 생성하고, 이 가상의 치아가 실제 치아 형상에 얼마나 일치하는지 분석하고자 한다. 본 연구의 귀무가설은 "가상의 치아 형상은 실제 치아 형상과 통계적으로 유의미한 차이가 없다"이다.
치과용 모형 스캐너(E1, 3Shape)로 스캔된 stereolithography 파일에서 하악 좌측 제1대구치의 교합면을 이미지 형태로 변환하여 모델에 활용하였다. 총 50개의 교합면 이미지로부터 DCGAN 분석을 하였다. 본 연구에 사용한 치아는 50개이나 실제 사용한 트레이닝 셋은 100개이다. 원본 치아 이미지 50개와 원본 치아 이미지에서 치아를 제외한 나머지 배경 등을 제거한 이미지 50개로 구성되어 있다. 학습한 모델에서 생성되는 이미지는 배경 등의 부분이 제거된 치아 이미지로만 이루어져 있어야 하므로 배경 등의 부분이 제거된 이미지 50개로만 학습을 진행했었다. 하지만 치아만 존재하는 이미지는 너무 단순해서 일정 수준 학습이 반복되면 모델이 학습되지 않는 현상이 발생하였고, 결국 이를 해결하기 위해 원본 이미지 50개를 추가한 총 100개의 트레이닝 셋을 사용하게 되었다. 최종적으로 총 1,000개의 가상 치아를 생성하였다(Fig. 1).
훈련 데이터 세트는 학습의 결과로 도출되는 이미지는 256×256 해상도를 가지며, 한 번의 학습에 사용되는 크기인 batch size는 36이다. 각각의 학습마다 generator가 이미지를 생성하고 discriminator가 batch size를 다양하게 변경하며 모델을 학습한 결과, batch size를 증가시킬수록 모델의 정확도도 증가하였는데, 학습을 진행한 컴퓨터의 GPU RAM의 크기가 16GB인 것을 고려하여 최종 batch size를 36으로 설정하였다. 전체 학습 epoch는 4,000으로 실행되었다.
대부분의 사람은 32개의 영구치를 가지고 있다. 각 치아는 저작, 발음, 심미 등의 다양한 역할을 담당하고 있으며, 특히 대구치는 넓은 교합면을 통해 저작 기능을 주로 수행한다. 교합면은 상악과 하악에서 교두의 비율과 차이를 명확히 나타내지만, 상악에서 이상 결절이 발생하기도 한다[14]. 따라서 본 연구에서는 이상 결절이 잘 나타나지 않는 하악 대구치를 연구 대상으로 선정하였다.
하악 대구치의 교합면 형태는 일반적으로 부등변 사각형으로 5개의 교두를 가지며, 가장 큰 교두는 근심협측교두, 가장 작은 교두는 원심교두이다[15]. Hellman [16]은 인류 치아의 인종적 특성을 분석하며, 하악 대구치의 교두 패턴을 연구하여 가장 기본 형상의 교합면이 5개 교두를 가진 Y형태의 교합면이라고 하였다. 하악 제1대구치의 교두 비율은 저작 기능을 최적화하는 데 중요한 요소이며, Andrews [17]는 정상 교합의 6가지 핵심 요소 중 하나로 교두의 비율을 강조하였다. Christie [18]도 정상 교합을 가진 성인의 두부 방사선학적 패턴을 통해 교두의 중요성을 확인하였다. 이러한 선행연구를 바탕으로 본 연구에서는 하악 제1대구치 교합면의 특징들을 기준으로 연구를 진행하였다.
하악 좌측 제1대구치의 교두는 일반적으로 5교두이며, 협측에 3개, 설측에 2개가 존재한다. Fig. 2와 같이 중심구(main groove)를 기준으로 교두의 수가 ① 협측에 3개 (buccal cusp; BC), ② 설측에 2개 (lingual cusp; LC)가 있다면 일치로 판정하였고, 그보다 적거나 많은 경우는 불일치로 판정하였다. 교합면 비율은 중심구를 기준으로 ③ 협측과 설측 비율 (occlusal buccal lingual; OBL)이 3:2면 일치, ④ 협측 교두 3개의 비율 (occusal buccal cusp; OBC)이 5:3:2면 일치, ⑤ 설측 교두 2개의 비율 (occusal lingual cusp; OLC)이 1:1이면 일치로 판정하였다. 비율이 맞지 않는 경우는 불일치로 판정하였다. 판정은 20년 이상의 경력으로 치아 형태에 대한 깊은 지식을 갖춘 치과기공사(EJB)가 참여하여 1,000개의 치아 형상을 Table 1의 기준으로 총 3번의 분석을 시행하였다.
Table 1 . Classification criteria and intra-rater reliability analysis results (ICC) for the mandibular left first molar
Item | Classification | Criteria | Naming | ICC |
---|---|---|---|---|
No. of cusp | ① Number of buccal cusp | 3 ea | BC | 0.925 |
② Number of lingual cusp | 2 ea | LC | 0.956 | |
Occlusal surface ratio | ③ Buccal to lingual occlusal surface ratio based on the central groove | 3:2 | OBL | 0.953 |
④ Ratio of buccal cusp; mesiobuccal cusp (5):distobuccal cusp (3):distal cusp (2) | 5:3:2 | OBC | 0.951 | |
⑤ Ratio of lingual cusp; mesiolingual cusp (1):distolingual cusp (1) | 1:1 | OLC | 0.940 |
ICC: intraclass correlation coefficient.
우선 3회의 반복 분석에 대한 측정자(관찰자) 내 신뢰도 분석을 시행하였다. 측정자 내 신뢰도 분석은 급내상관계수(intraclass correlation coefficient, ICC)로 표시하며 0에서 1의 값을 가진다. 1이면 완전일치를 뜻하며, 일반적으로 0.75~0.90 사이의 값은 우수한 신뢰도(excellent reliability), 0.50~0.75 사이의 값은 좋은 신뢰도(good reliability), 0.50보다 작은 값은 낮은 신뢰도(poor reliability)로 판단한다[19,20]. BC의 ICC는 0.925, LC의 ICC는 0.956, OBL의 ICC는 0.953, OBC의 ICC는 0.951, OLC의 ICC는 0.940으로 모든 항목에서 매우 높은 일치도를 보였다.
생성된 가상 치아가 하악 좌측 제1대구치의 기준에 충족하는지 분석하고자 빈도분석을 실시하여 평균을 구하고, 그룹 간의 차이를 비교하기 위해 one-way ANOVA 분석과 Tukey’s honestly significant difference (HSD) 사후분석을 유의수준 0.05에서 실시하였다(IBM SPSS Statistics ver. 23.0, IBM).
가상으로 생성된 하악 좌측 제1대구치는 Fig. 3과 같이 생성되었다. 가상 치아 이미지를 분류 기준에 따라 판별한 결과 OBL에서 일치가 91.9%로 매우 높았으며, LC와 OLC에서도 각각 일치가 80.7%, 79.0%로 높게 나타났다. BC에서는 일치가 51.1%, 불일치가 48.9%로 큰 차이가 없었다. 그러나 OBC에서는 일치가 14.5%, 불일치가 85.5%로 다른 기준들과 다르게 불일치가 더 많은 것으로 나타났다(Table 2). 그룹 간의 차이를 보기 위해 one-way ANOVA test를 실시한 결과 유의한 차이가 있었으며, Tukey’s HSD 사후분석 결과 모든 그룹 간에 유의한 차이가 있었다 (p<0.05; Table 3).
Table 2 . Comparison results of consistency for the classification criteria of the mandibular left first molar (%)
BC | LC | OBL | OBC | OLC | |
---|---|---|---|---|---|
Consistency | 51.1±6.4 | 80.7±3.3 | 91.9±0.8 | 14.5±0.3 | 79.0±1.4 |
Inconsistency | 48.9±6.4 | 19.3±3.3 | 8.1±0.8 | 85.5±0.3 | 21.0±1.4 |
Total | 100 | 100 | 100 | 100 | 100 |
Values are presented as mean±standard deviation.
BC: number of buccal cusp, LC: number of lingual cusp, OBL: buccal to lingual occlusal surface ratio based on the central groove, OBC: ratio of buccal cusp, OLC: ratio of lingual cusp.
Table 3 . Results of Tukey's post-hoc analysis on the agreement of the mandibular left first molar
Consistency/inconsistency | ||||
---|---|---|---|---|
Group | Mean difference | Standard error | p-value | |
BC | LC | –29.6* | 4.67 | <0.001 |
OBL | –40.8* | <0.001 | ||
OLC | –27.9* | <0.001 | ||
OBC | 36.6* | <0.001 | ||
LC | OBL | –11.2* | <0.001 | |
OLC | 1.7* | 0.017 | ||
OBC | 66.2* | <0.001 | ||
OBL | OLC | 12.9* | <0.001 | |
OBC | 77.4* | <0.001 | ||
OLC | OBC | 64.5* | <0.001 |
BC: number of buccal cusp, LC: number of lingual cusp, OBL: buccal to lingual occlusal surface ratio based on the central groove, OBC: ratio of buccal cusp, OLC: ratio of lingual cusp.
*Tukey’s honestly significant difference. The mean difference is significant at the 0.05 level.
본 연구 결과 가상의 치아 형상은 실제 치아 형상과 통계적으로 유의미한 차이가 없다는 본 연구의 귀무가설은 기각되었다. 생성된 가상 치아에서 교합면 중심구를 기준으로 나누어진 협측과 설측의 비율 일치도가 가장 높게 나타나 하악 제1대구치와 유사성을 보였다. 그러나 협측 교두의 비율 일치도는 가장 낮았다. 이는 여러 가지 요인을 고려해야 한다. DCGAN이 정확한 이미지를 생성하기 위해서는 충분한 양의 고품질 학습 데이터가 필요하다. 데이터 양이 부족하거나 데이터의 다양성이 부족한 경우 생성된 이미지의 품질과 다양성이 제한될 수 있다[21]. 또한 DCGAN 모델의 적절한 학습 속도나 batch size, 네트워크 구조 등의 설정도 중요한 부분으로 작용하여 정확한 이미지를 생성하는 데 제약이 있을 수 있다[9]. 이러한 한계를 극복하기 위해서는 데이터의 품질과 다양성을 개선하고, 적절한 생성 모델을 개발하려는 노력이 필요하다.
본 연구에서는 가상 치아 생성에서 좋은 결과를 보이며, 가상 치아 이미지의 활용 가능성을 입증하였다. 추후 성능이 향상된 모델을 적용한다면 더 우수한 결과를 기대할 수 있으며, 이는 의료 데이터 사용 한계 문제를 해결하고 부족한 데이터를 보완함으로써 치과 분야에서 인공지능 적용 가능성을 높일 수 있을 것이다. 추가로, 다양한 교두 형태와 결절의 발생 빈도를 반영한 고품질 데이터 셋을 구축함으로써, 보다 정교한 모델을 개발할 수 있을 것이다.
본 연구 결과는 측정자의 판단에 따라 결정되었기 때문에 이로 인한 맹점을 줄이기 위해 전문성을 가진 측정자가 3회에 걸쳐 판별하였고, 신뢰도 분석 결과 모두 0.90 이상으로 신뢰성이 높은 것으로 나타났다. Kim [22]은 Dahlberg’s error 또는 Kappa statistics 통계와 같은 여러 가지 신뢰성 측정 방법이 있지만, ICC가 가장 유용하다고 보고하였다.
본 연구의 한계점으로는 치아를 구분하는 여러 가지 기준 중에서 다섯 가지 항목만을 가지고 분류하였기 때문에 분류 기준에 대해서 보완이 필요하다. 또한, 본 연구는 특정 데이터 셋에 기반한 결과이므로 다른 인구 집단이나 다양한 임상 상황에 적용하기 위해서는 추가적인 연구가 필요하다. 추후 연구에서는 더 많은 변수를 포함하여 다양한 치아 형태를 분석하고, 그 결과를 바탕으로 보다 포괄적인 모델을 개발하는 것이 필요하다. 또한 학습데이터의 수가 한정되어 있어 일반적인 인공지능 결과물처럼 우수한 해상도를 얻기 어려웠다. 추후에는 학습데이터의 수를 늘려 더 우수한 결과를 도출해야 할 것이다.
개인정보 보호로 인해 의료 데이터를 사용하기 어려운 빅데이터 분석에서 DCGAN은 실제 데이터와 매우 유사한 가상 데이터를 생성할 수 있다는 점에서 높은 활용 가치를 가진다[12]. DCGAN을 통해 어느 정도 안정된 학습을 진행할 수 있게 되었지만, 더 다양한 분야에 활용하고 더욱 정밀한 성능을 얻기 위해서는 향상된 신경망 구조 개발 등의 후속 연구가 필요하다. 이러한 연구를 통해 다양한 분야에서 수많은 연구가 진행될 수 있으며, 이는 치과 분야에서 인공지능의 활용 가능성을 높일 수 있을 것이다.
본 연구는 하악 제1대구치의 교합면 특징을 분석하여 가상 치아 생성의 가능성을 제시하였으며, 이는 치과 분야에서 인공지능의 활용 가능성을 높이는 데 기여할 수 있다. 앞으로 데이터 품질 개선과 모델 성능 향상을 통해 더 나은 결과를 도출할 수 있을 것으로 기대된다.
가상으로 생성된 하악 좌측 제1대구치를 여러 기준에 따라 분류한 결과, DCGAN을 이용해 실제 데이터와 매우 유사한 가상 데이터를 생성할 수 있음을 확인하였다. 이는 치과 분야에서 향상된 신경망 구조 개발 등의 후속 연구에 큰 활용 가능성을 제시한다.
This work was supported by the National Research Foundation of Korea (NRF) grant funded by the Korea government (MSIT) (No. 2021R1C1C2011105) and Innovative Human Resource Development for Local Intellectualization program through the Institute of Information & Communications Technology Planning & Evaluation (IITP) grant funded by the Korea government (MSIT)(IITP-2024-RS-2022-00156334).
No potential conflict of interest relevant to this article was reported.
Journal of Technologic Dentistry 2024; 46(2): 36-41
Published online June 30, 2024 https://doi.org/10.14347/jtd.2024.46.2.36
Copyright © Korean Academy of Dental Technology.
배은정1, 임선영2
1부천대학교 치기공과, 2배재대학교 컴퓨터공학과
Eun-Jeong Bae1 , Sun-Young Ihm2
1Department of Dental Technology, Bucheon University, Bucheon, Korea
2Department of Computer Engineering, Pai Chai University, Daejeon, Korea
Correspondence to:Sun-Young Ihm
Department of Computer Engineering, Pai Chai University, 155-40 Baejae-ro, Seo-gu, Daejeon 35345, Korea
E-mail: sunnyihm@pcu.ac.kr
https://orcid.org/0000-0002-7545-7035
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.
Purpose: This study aimed to generate virtual mandibular left first molar teeth using deep convolutional generative adversarial networks (DCGANs) and analyze their matching accuracy with actual tooth morphology to propose a new paradigm for using medical data.
Methods: Occlusal surface images of the mandibular left first molar scanned using a dental model scanner were analyzed using DCGANs. Overall, 100 training sets comprising 50 original and 50 background-removed images were created, thus generating 1,000 virtual teeth. These virtual teeth were classified based on the number of cusps and occlusal surface ratio, and subsequently, were analyzed for consistency by expert dental technicians over three rounds of examination. Statistical analysis was conducted using IBM SPSS Statistics ver. 23.0 (IBM), including intraclass correlation coefficient for intrarater reliability, one-way ANOVA, and Tukey’s post-hoc analysis.
Results: Virtual mandibular left first molars exhibited high consistency in the occlusal surface ratio but varied in other criteria. Moreover, consistency was the highest in the occlusal buccal lingual criteria at 91.9%, whereas discrepancies were observed most in the occusal buccal cusp criteria at 85.5%. Significant differences were observed among all groups (p<0.05).
Conclusion: Based on the classification of the virtually generated left mandibular first molar according to several criteria, DCGANs can generate virtual data highly similar to real data. Thus, subsequent research in the dental field, including the development of improved neural network structures, is necessary.
Keywords: Deep Convolutional Generative Adversarial Network, Deep learning, Tooth classification, Virtual tooth generation
4차 산업혁명과 관련하여 다양한 디지털 기술들이 개발되고 진보되면서 치과 분야에도 이를 활용한 수많은 연구가 활발하게 진행되고 있다. Three-dimensional 프린팅, 로봇 공학, 사물인터넷, 빅데이터, 그리고 인공지능과 같은 다양한 기술들이 융합되면서 의료 분야에서 빅데이터를 활용한 딥러닝 분석의 중요성이 커지고 있다[1]. 치과에서 사용되는 인공지능 기술은 분석, 해석, 진단, 그리고 치료 등 다양한 영역에서 활용되고 있다[2]. 딥러닝을 활용한 연구 사례로는 Bouali 등[3]이 콘빔 computed tomography 영상을 사용하여 자동 치과 검진을 위한 딥 컨볼루션 신경망 분석을 시도한 사례와, Bae 등[4]이 치아 구조를 분석하기 위해 딥러닝 알고리즘을 적용한 연구가 있다. 또한, Imangaliyev 등[5]이 치아 플라크 이미지 분류를 위한 딥러닝 연구를 수행한 사례도 있다.
효과적인 딥러닝 활용을 위해서는 방대한 양의 데이터가 필요하다. 의료 기록이 디지털화되면서 환자 건강관리 및 치료 과정 제공을 목적으로 그 활용 방안을 모색하고 있다[6]. 데이터 산업에서 의료 빅데이터의 활용은 매우 긍정적으로 평가되며, 새로운 패러다임의 해결책으로 주목 받고 있다[7]. 그러나 개인정보 보호 및 보안 위협에 대한 우려로 인해 절차와 허가 문제는 아직 초기 단계에 머물러 있다[8]. 더욱이 의료 데이터는 윤리적으로 민감하게 보호되어 있어 일반적으로 활용하기 어렵고, 연구 목적으로 사용한다고 해도 허가 절차가 복잡하다. 의료기관에서 수집한 데이터를 외부로 제공하는 것은 환자와 기관 모두에게 민감한 문제이므로 의료 데이터를 활용한 딥러닝은 한계가 있을 수밖에 없다.
심층 합성곱 생성적 적대 신경망(Deep Convolutional Generative Adversarial Network, DCGAN)은 입력된 정보를 바탕으로 그것과 아주 비슷한 가짜 정보를 만들고, 이를 평가하는 과정을 반복하여 실제와 매우 유사한 대체 데이터를 생산하는 독립적 학습법이다[9]. 기존의 생성적 적대 신경망(Generative Adversarial Network, GAN)이 가지던 해상도의 한계 등을 극복하기 위해 다양한 연구가 진행되면서 제안된 DCGAN은 장면을 이해하고 기존 GAN보다 더욱 고해상도의 세밀한 이미지를 생성할 수 있다. Ding 등[10]은 DCGAN을 이용하여 치관보철 디자인에 이용하면서 DCGAN이 자연 치아의 형태와 생체역학을 모방할 수 있는 높은 정확도의 개인 맞춤형 치관을 설계하는 데 활용될 수 있음을 입증하였다. Tsoi 등[11]은 DCGAN을 활용하여 전치 및 대구치 단일 치관 보철을 제작 알고리즘을 제안하면서 DCGAN으로 설계된 치관보철에 적절한 재료를 사용한다면 자연치아와 유사한 수명을 기대할 것으로 전망하였다.
의료 빅데이터 분석에서 DCGAN은 실제 데이터와 유사하지만 실제 데이터가 아닌 가짜 데이터를 생성할 수 있어 매우 높은 활용 가치를 가진다[12]. 그러나 DCGAN으로 생성된 대체 데이터가 실제 데이터와 얼마나 유사한지는 반드시 검증되어야 한다. DCGAN을 사용하여 실제 치아 형상을 학습시키고, 이와 유사한 가상 치아를 생성함으로써 딥러닝을 위한 데이터를 확보하는 것은 의료데이터 활용 방안에서 새로운 패러다임을 제시할 것이다[13]. 따라서 본 연구에서는 DCGAN을 사용하여 가상의 치아를 생성하고, 이 가상의 치아가 실제 치아 형상에 얼마나 일치하는지 분석하고자 한다. 본 연구의 귀무가설은 "가상의 치아 형상은 실제 치아 형상과 통계적으로 유의미한 차이가 없다"이다.
치과용 모형 스캐너(E1, 3Shape)로 스캔된 stereolithography 파일에서 하악 좌측 제1대구치의 교합면을 이미지 형태로 변환하여 모델에 활용하였다. 총 50개의 교합면 이미지로부터 DCGAN 분석을 하였다. 본 연구에 사용한 치아는 50개이나 실제 사용한 트레이닝 셋은 100개이다. 원본 치아 이미지 50개와 원본 치아 이미지에서 치아를 제외한 나머지 배경 등을 제거한 이미지 50개로 구성되어 있다. 학습한 모델에서 생성되는 이미지는 배경 등의 부분이 제거된 치아 이미지로만 이루어져 있어야 하므로 배경 등의 부분이 제거된 이미지 50개로만 학습을 진행했었다. 하지만 치아만 존재하는 이미지는 너무 단순해서 일정 수준 학습이 반복되면 모델이 학습되지 않는 현상이 발생하였고, 결국 이를 해결하기 위해 원본 이미지 50개를 추가한 총 100개의 트레이닝 셋을 사용하게 되었다. 최종적으로 총 1,000개의 가상 치아를 생성하였다(Fig. 1).
훈련 데이터 세트는 학습의 결과로 도출되는 이미지는 256×256 해상도를 가지며, 한 번의 학습에 사용되는 크기인 batch size는 36이다. 각각의 학습마다 generator가 이미지를 생성하고 discriminator가 batch size를 다양하게 변경하며 모델을 학습한 결과, batch size를 증가시킬수록 모델의 정확도도 증가하였는데, 학습을 진행한 컴퓨터의 GPU RAM의 크기가 16GB인 것을 고려하여 최종 batch size를 36으로 설정하였다. 전체 학습 epoch는 4,000으로 실행되었다.
대부분의 사람은 32개의 영구치를 가지고 있다. 각 치아는 저작, 발음, 심미 등의 다양한 역할을 담당하고 있으며, 특히 대구치는 넓은 교합면을 통해 저작 기능을 주로 수행한다. 교합면은 상악과 하악에서 교두의 비율과 차이를 명확히 나타내지만, 상악에서 이상 결절이 발생하기도 한다[14]. 따라서 본 연구에서는 이상 결절이 잘 나타나지 않는 하악 대구치를 연구 대상으로 선정하였다.
하악 대구치의 교합면 형태는 일반적으로 부등변 사각형으로 5개의 교두를 가지며, 가장 큰 교두는 근심협측교두, 가장 작은 교두는 원심교두이다[15]. Hellman [16]은 인류 치아의 인종적 특성을 분석하며, 하악 대구치의 교두 패턴을 연구하여 가장 기본 형상의 교합면이 5개 교두를 가진 Y형태의 교합면이라고 하였다. 하악 제1대구치의 교두 비율은 저작 기능을 최적화하는 데 중요한 요소이며, Andrews [17]는 정상 교합의 6가지 핵심 요소 중 하나로 교두의 비율을 강조하였다. Christie [18]도 정상 교합을 가진 성인의 두부 방사선학적 패턴을 통해 교두의 중요성을 확인하였다. 이러한 선행연구를 바탕으로 본 연구에서는 하악 제1대구치 교합면의 특징들을 기준으로 연구를 진행하였다.
하악 좌측 제1대구치의 교두는 일반적으로 5교두이며, 협측에 3개, 설측에 2개가 존재한다. Fig. 2와 같이 중심구(main groove)를 기준으로 교두의 수가 ① 협측에 3개 (buccal cusp; BC), ② 설측에 2개 (lingual cusp; LC)가 있다면 일치로 판정하였고, 그보다 적거나 많은 경우는 불일치로 판정하였다. 교합면 비율은 중심구를 기준으로 ③ 협측과 설측 비율 (occlusal buccal lingual; OBL)이 3:2면 일치, ④ 협측 교두 3개의 비율 (occusal buccal cusp; OBC)이 5:3:2면 일치, ⑤ 설측 교두 2개의 비율 (occusal lingual cusp; OLC)이 1:1이면 일치로 판정하였다. 비율이 맞지 않는 경우는 불일치로 판정하였다. 판정은 20년 이상의 경력으로 치아 형태에 대한 깊은 지식을 갖춘 치과기공사(EJB)가 참여하여 1,000개의 치아 형상을 Table 1의 기준으로 총 3번의 분석을 시행하였다.
Table 1 . Classification criteria and intra-rater reliability analysis results (ICC) for the mandibular left first molar.
Item | Classification | Criteria | Naming | ICC |
---|---|---|---|---|
No. of cusp | ① Number of buccal cusp | 3 ea | BC | 0.925 |
② Number of lingual cusp | 2 ea | LC | 0.956 | |
Occlusal surface ratio | ③ Buccal to lingual occlusal surface ratio based on the central groove | 3:2 | OBL | 0.953 |
④ Ratio of buccal cusp; mesiobuccal cusp (5):distobuccal cusp (3):distal cusp (2) | 5:3:2 | OBC | 0.951 | |
⑤ Ratio of lingual cusp; mesiolingual cusp (1):distolingual cusp (1) | 1:1 | OLC | 0.940 |
ICC: intraclass correlation coefficient..
우선 3회의 반복 분석에 대한 측정자(관찰자) 내 신뢰도 분석을 시행하였다. 측정자 내 신뢰도 분석은 급내상관계수(intraclass correlation coefficient, ICC)로 표시하며 0에서 1의 값을 가진다. 1이면 완전일치를 뜻하며, 일반적으로 0.75~0.90 사이의 값은 우수한 신뢰도(excellent reliability), 0.50~0.75 사이의 값은 좋은 신뢰도(good reliability), 0.50보다 작은 값은 낮은 신뢰도(poor reliability)로 판단한다[19,20]. BC의 ICC는 0.925, LC의 ICC는 0.956, OBL의 ICC는 0.953, OBC의 ICC는 0.951, OLC의 ICC는 0.940으로 모든 항목에서 매우 높은 일치도를 보였다.
생성된 가상 치아가 하악 좌측 제1대구치의 기준에 충족하는지 분석하고자 빈도분석을 실시하여 평균을 구하고, 그룹 간의 차이를 비교하기 위해 one-way ANOVA 분석과 Tukey’s honestly significant difference (HSD) 사후분석을 유의수준 0.05에서 실시하였다(IBM SPSS Statistics ver. 23.0, IBM).
가상으로 생성된 하악 좌측 제1대구치는 Fig. 3과 같이 생성되었다. 가상 치아 이미지를 분류 기준에 따라 판별한 결과 OBL에서 일치가 91.9%로 매우 높았으며, LC와 OLC에서도 각각 일치가 80.7%, 79.0%로 높게 나타났다. BC에서는 일치가 51.1%, 불일치가 48.9%로 큰 차이가 없었다. 그러나 OBC에서는 일치가 14.5%, 불일치가 85.5%로 다른 기준들과 다르게 불일치가 더 많은 것으로 나타났다(Table 2). 그룹 간의 차이를 보기 위해 one-way ANOVA test를 실시한 결과 유의한 차이가 있었으며, Tukey’s HSD 사후분석 결과 모든 그룹 간에 유의한 차이가 있었다 (p<0.05; Table 3).
Table 2 . Comparison results of consistency for the classification criteria of the mandibular left first molar (%).
BC | LC | OBL | OBC | OLC | |
---|---|---|---|---|---|
Consistency | 51.1±6.4 | 80.7±3.3 | 91.9±0.8 | 14.5±0.3 | 79.0±1.4 |
Inconsistency | 48.9±6.4 | 19.3±3.3 | 8.1±0.8 | 85.5±0.3 | 21.0±1.4 |
Total | 100 | 100 | 100 | 100 | 100 |
Values are presented as mean±standard deviation..
BC: number of buccal cusp, LC: number of lingual cusp, OBL: buccal to lingual occlusal surface ratio based on the central groove, OBC: ratio of buccal cusp, OLC: ratio of lingual cusp..
Table 3 . Results of Tukey's post-hoc analysis on the agreement of the mandibular left first molar.
Consistency/inconsistency | ||||
---|---|---|---|---|
Group | Mean difference | Standard error | p-value | |
BC | LC | –29.6* | 4.67 | <0.001 |
OBL | –40.8* | <0.001 | ||
OLC | –27.9* | <0.001 | ||
OBC | 36.6* | <0.001 | ||
LC | OBL | –11.2* | <0.001 | |
OLC | 1.7* | 0.017 | ||
OBC | 66.2* | <0.001 | ||
OBL | OLC | 12.9* | <0.001 | |
OBC | 77.4* | <0.001 | ||
OLC | OBC | 64.5* | <0.001 |
BC: number of buccal cusp, LC: number of lingual cusp, OBL: buccal to lingual occlusal surface ratio based on the central groove, OBC: ratio of buccal cusp, OLC: ratio of lingual cusp..
*Tukey’s honestly significant difference. The mean difference is significant at the 0.05 level..
본 연구 결과 가상의 치아 형상은 실제 치아 형상과 통계적으로 유의미한 차이가 없다는 본 연구의 귀무가설은 기각되었다. 생성된 가상 치아에서 교합면 중심구를 기준으로 나누어진 협측과 설측의 비율 일치도가 가장 높게 나타나 하악 제1대구치와 유사성을 보였다. 그러나 협측 교두의 비율 일치도는 가장 낮았다. 이는 여러 가지 요인을 고려해야 한다. DCGAN이 정확한 이미지를 생성하기 위해서는 충분한 양의 고품질 학습 데이터가 필요하다. 데이터 양이 부족하거나 데이터의 다양성이 부족한 경우 생성된 이미지의 품질과 다양성이 제한될 수 있다[21]. 또한 DCGAN 모델의 적절한 학습 속도나 batch size, 네트워크 구조 등의 설정도 중요한 부분으로 작용하여 정확한 이미지를 생성하는 데 제약이 있을 수 있다[9]. 이러한 한계를 극복하기 위해서는 데이터의 품질과 다양성을 개선하고, 적절한 생성 모델을 개발하려는 노력이 필요하다.
본 연구에서는 가상 치아 생성에서 좋은 결과를 보이며, 가상 치아 이미지의 활용 가능성을 입증하였다. 추후 성능이 향상된 모델을 적용한다면 더 우수한 결과를 기대할 수 있으며, 이는 의료 데이터 사용 한계 문제를 해결하고 부족한 데이터를 보완함으로써 치과 분야에서 인공지능 적용 가능성을 높일 수 있을 것이다. 추가로, 다양한 교두 형태와 결절의 발생 빈도를 반영한 고품질 데이터 셋을 구축함으로써, 보다 정교한 모델을 개발할 수 있을 것이다.
본 연구 결과는 측정자의 판단에 따라 결정되었기 때문에 이로 인한 맹점을 줄이기 위해 전문성을 가진 측정자가 3회에 걸쳐 판별하였고, 신뢰도 분석 결과 모두 0.90 이상으로 신뢰성이 높은 것으로 나타났다. Kim [22]은 Dahlberg’s error 또는 Kappa statistics 통계와 같은 여러 가지 신뢰성 측정 방법이 있지만, ICC가 가장 유용하다고 보고하였다.
본 연구의 한계점으로는 치아를 구분하는 여러 가지 기준 중에서 다섯 가지 항목만을 가지고 분류하였기 때문에 분류 기준에 대해서 보완이 필요하다. 또한, 본 연구는 특정 데이터 셋에 기반한 결과이므로 다른 인구 집단이나 다양한 임상 상황에 적용하기 위해서는 추가적인 연구가 필요하다. 추후 연구에서는 더 많은 변수를 포함하여 다양한 치아 형태를 분석하고, 그 결과를 바탕으로 보다 포괄적인 모델을 개발하는 것이 필요하다. 또한 학습데이터의 수가 한정되어 있어 일반적인 인공지능 결과물처럼 우수한 해상도를 얻기 어려웠다. 추후에는 학습데이터의 수를 늘려 더 우수한 결과를 도출해야 할 것이다.
개인정보 보호로 인해 의료 데이터를 사용하기 어려운 빅데이터 분석에서 DCGAN은 실제 데이터와 매우 유사한 가상 데이터를 생성할 수 있다는 점에서 높은 활용 가치를 가진다[12]. DCGAN을 통해 어느 정도 안정된 학습을 진행할 수 있게 되었지만, 더 다양한 분야에 활용하고 더욱 정밀한 성능을 얻기 위해서는 향상된 신경망 구조 개발 등의 후속 연구가 필요하다. 이러한 연구를 통해 다양한 분야에서 수많은 연구가 진행될 수 있으며, 이는 치과 분야에서 인공지능의 활용 가능성을 높일 수 있을 것이다.
본 연구는 하악 제1대구치의 교합면 특징을 분석하여 가상 치아 생성의 가능성을 제시하였으며, 이는 치과 분야에서 인공지능의 활용 가능성을 높이는 데 기여할 수 있다. 앞으로 데이터 품질 개선과 모델 성능 향상을 통해 더 나은 결과를 도출할 수 있을 것으로 기대된다.
가상으로 생성된 하악 좌측 제1대구치를 여러 기준에 따라 분류한 결과, DCGAN을 이용해 실제 데이터와 매우 유사한 가상 데이터를 생성할 수 있음을 확인하였다. 이는 치과 분야에서 향상된 신경망 구조 개발 등의 후속 연구에 큰 활용 가능성을 제시한다.
This work was supported by the National Research Foundation of Korea (NRF) grant funded by the Korea government (MSIT) (No. 2021R1C1C2011105) and Innovative Human Resource Development for Local Intellectualization program through the Institute of Information & Communications Technology Planning & Evaluation (IITP) grant funded by the Korea government (MSIT)(IITP-2024-RS-2022-00156334).
No potential conflict of interest relevant to this article was reported.
Table 1 . Classification criteria and intra-rater reliability analysis results (ICC) for the mandibular left first molar.
Item | Classification | Criteria | Naming | ICC |
---|---|---|---|---|
No. of cusp | ① Number of buccal cusp | 3 ea | BC | 0.925 |
② Number of lingual cusp | 2 ea | LC | 0.956 | |
Occlusal surface ratio | ③ Buccal to lingual occlusal surface ratio based on the central groove | 3:2 | OBL | 0.953 |
④ Ratio of buccal cusp; mesiobuccal cusp (5):distobuccal cusp (3):distal cusp (2) | 5:3:2 | OBC | 0.951 | |
⑤ Ratio of lingual cusp; mesiolingual cusp (1):distolingual cusp (1) | 1:1 | OLC | 0.940 |
ICC: intraclass correlation coefficient..
Table 2 . Comparison results of consistency for the classification criteria of the mandibular left first molar (%).
BC | LC | OBL | OBC | OLC | |
---|---|---|---|---|---|
Consistency | 51.1±6.4 | 80.7±3.3 | 91.9±0.8 | 14.5±0.3 | 79.0±1.4 |
Inconsistency | 48.9±6.4 | 19.3±3.3 | 8.1±0.8 | 85.5±0.3 | 21.0±1.4 |
Total | 100 | 100 | 100 | 100 | 100 |
Values are presented as mean±standard deviation..
BC: number of buccal cusp, LC: number of lingual cusp, OBL: buccal to lingual occlusal surface ratio based on the central groove, OBC: ratio of buccal cusp, OLC: ratio of lingual cusp..
Table 3 . Results of Tukey's post-hoc analysis on the agreement of the mandibular left first molar.
Consistency/inconsistency | ||||
---|---|---|---|---|
Group | Mean difference | Standard error | p-value | |
BC | LC | –29.6* | 4.67 | <0.001 |
OBL | –40.8* | <0.001 | ||
OLC | –27.9* | <0.001 | ||
OBC | 36.6* | <0.001 | ||
LC | OBL | –11.2* | <0.001 | |
OLC | 1.7* | 0.017 | ||
OBC | 66.2* | <0.001 | ||
OBL | OLC | 12.9* | <0.001 | |
OBC | 77.4* | <0.001 | ||
OLC | OBC | 64.5* | <0.001 |
BC: number of buccal cusp, LC: number of lingual cusp, OBL: buccal to lingual occlusal surface ratio based on the central groove, OBC: ratio of buccal cusp, OLC: ratio of lingual cusp..
*Tukey’s honestly significant difference. The mean difference is significant at the 0.05 level..
Eun-Jeong Bae
Journal of Technologic Dentistry 2024; 46(3): 93-100 https://doi.org/10.14347/jtd.2024.46.3.93Bae, EunJeong;Jeong, Junho;Son, Yunsik;Lim, JoonYeon;
Journal of Technologic Dentistry 2020; 42(1): 1-8 https://doi.org/10.14347/kadt.2020.42.1.1