분류
2026년 2월
작성일
2025.10.17
수정일
2025.12.19
작성자
최성기
조회수
201

Code-mixing 환경을 위한 한국어 통합 G2P 시스템

[제목] 

Code-mixing 환경을 위한 한국어 통합 G2P 시스템


[요약]

음성 합성(TTS)의 핵심 전처리 단계인 G2P(Grapheme-to-Phoneme) 변환은 한국어의 복잡한 음운 변동 규칙과 한글, 숫자, 영어가 혼재된 code-mixed 텍스트 처리라는 난제를 안고 있다. 기존의 Autoregressive(AR) 모델은 높은 정확도를 보이나 속도가 느리고, Non-Autoregressive(NAR) 모델은 빠르지만 연음 등 순차적 의존성 처리에 취약하여 정확도가 낮은 한계가 있었다. 본 연구는 이러한 속도와 정확도의 트레이드오프(Trade-off)를 극복하기 위해, NAR 디코더에 Positional Attention을 결합한 새로운 아키텍처를 제안한다. 제안 모델은 인접 음절 간의 위치 기반 의존성을 명시적으로 학습함으로써 순차적 디코딩 없이도 음운 변동을 효과적으로 처리한다. 이를 위해 KoCharELECTRA 인코더와 Transformer 디코더를 통합하고, 실세계 텍스트 처리를 위해 CLDNN 기반 숫자 분류와 3단계 계단식 영어 변환을 포함한 강건한 통합 전처리 파이프라인을 구축하였다. 84,937개 문장의 KT 실세계 발화 데이터 실험 결과, 제안 시스템은 순수 한글 텍스트에서 94.77%의 문장 정확도를 달성하여 기존 AR 최고 모델(92.79%)을 상회하는 성능을 기록하였다. 이는 NAR 모델이 AR 모델의 구조적 한계인 오류 전파 문제를 극복할 수 있음을 입증한 결과이다. 추론 속도 또한 11.2ms/sentAR 모델 대비 약 4배 향상되었다. Code-mixing 환경에서도 92.6%의 정확도를 기록하여 최신 경쟁 모델인 SMART-G2P(46.85%) 대비 2배 이상의 성능 격차를 확인하였다. 본 연구는 NAR 기반 모델이 한국어 G2P 태스크에서 속도와 정확도를 동시에 만족하는 최적의 해법임을 규명하고, 실시간 고품질 TTS 서비스를 위한 실용적 가이드라인을 제시한다.

학위연월
2026년2월
지도교수
권혁철
키워드
한국어 발음열 생성, 자연어처리, 자기회귀 모델, 심층학습, 인공지능, Grapheme-to-Phoneme, Korean G2P, Code-mixing, Optimality Theory, Non-Autoregressive Model, Text-to-Speech
소개 웹페이지
https://sites.google.com/view/ai-nlp-g2p/%ED%99%88
첨부파일
첨부파일이(가) 없습니다.
다음글
Enhancing Threat Detection and Response Automation in SOCs through Agentic Large Language Models
이스마일 2025-10-20 17:39:53.347
이전글
고속 컨베이어 환경에서의 생산 공정물 결함 검출을 위한 AI 비전 시스템
김형건 2025-10-17 13:46:29.627
RSS 2.0 139
게시물 검색
박사학위논문
번호 제목 작성자 작성일 첨부파일 조회수
139 Enhancing Threat Detection and Response Automation 이스마일 2025.10.20 5 99
138 Code-mixing 환경을 위한 한국어 통합 G2P 시스템 최성기 2025.10.17 0 201
137 고속 컨베이어 환경에서의 생산 공정물 결함 검출을 위한 AI 비전 시스템 김형건 2025.10.17 0 101
136 Toward Reliable and Scalable Multi-Cell LoRaWAN Ne 호앙 꾸옥 홍 낫 2025.10.16 0 101
135 Differentially Private Context-Aware and Data-Cen 우타리예바 아쎔 2025.10.10 0 130
134 Scalable Quantum Annealing Frameworks for Combinat 정선근 2025.10.02 0 127
133 Comparative Complexity of Neuropeptide and Recepto 류승희 2025.10.01 0 117
132 확산 모델 기반 필기 이미지 생성에 관한 연구 홍동진 2025.04.10 0 199
131 연합학습 기반 그래프 신경망을 활용한 전기차 충전소 최적 선택 기법 류준우 2025.04.09 0 186
130 Exploring Quantum Approach Applied to Cryptanalysi 와다니 리니 위스누 2025.04.08 0 210
129 Towards computation - communication efficient and 응우옌 민 두옹 2025.04.08 0 165
128 Hybrid Quantum Residual Neural Networks for Classi 노대일 2025.04.08 0 177
127 Distributed Resource Management for Massive IoT Ne 응우옌 쑤언 둥 2025.04.08 0 146
126 A Framework for Leveraging Large Language Models i 데리 프라타마 2025.04.07 0 190
125 Discovery and Authentication of Marker Genes Using 프라타마 리안 다니스 아디 2025.04.07 0 210
124 산업 환경의 IEEE 802.15.4 TSCH 기반 네트워크에서 트래픽 처리량 향상을 위한 이희준 2025.04.07 0 194
123 Uncertainty-Based Hybrid Deep Learning Approach fo 멘가라 악셀 기드온 2024.12.10 0 232
122 Effective Deep Learning Primitives Design for Bina 황선진 2024.10.14 0 215
121 Toward Immersive Multiview Video Streaming through 탄중 디온 2024.10.14 0 182
120 A Low-cost Deep Learning Model for Real-time Low L 등 제강 2024.10.10 0 230