분류
2025년 8월
작성일
2025.04.10
수정일
2025.07.04
작성자
홍동진
조회수
199

확산 모델 기반 필기 이미지 생성에 관한 연구

제목 : 확산 모델 기반 필기 이미지 생성에 관한 연구


디지털 기술이 일상을 대체하는 현재에도 필기 이미지는 교육, 의료, 금융, 예술 분야에서 중요한 역할을 수행하고 있다.

하지만 사고나 질병과 같은 후천적 원인으로 인해 필기에 어려움을 겪는 사람들이 증가하고 있다. 이러한 상황에 처한 사람들은 타인의 도움에 의존해야 하며, 개인의 독립성과 프라이버시, 자존감에 부정적인 영향을 받게 된다.

개인의 고유한 필체 특성을 학습하여 서명 이미지를 생성하거나 임의의 텍스트를 개인 필체로 변환하는 기술은 신체적 제약을 극복하는 보조 도구로서 실질적인 도움을 제공할 수 있다.

 

본 논문에서는 서명과 문자라는 두 요소의 생성에 대해 각각 특화된 확산 모델을 제안한다.

서명 이미지 생성을 위한 조건부 확산 모델에서는 타임스텝과 클래스 정보를 하나의 통합 임베딩으로 처리하여 네트워크 전반에 일관되게 전달하는 방식을 채택했다.

또한 서명의 희소한 전경 구조에서 전역적 일관성을 확보하기 위해 저해상도 구간에서만 자기 어텐션을 선택적으로 적용하여 계산 효율성과 표현력의 균형을 달성했으며, EMA 네트워크를 통해 학습 과정의 매개변수 변동을 완화하여 생성 안정성을 향상시켰다.

문자 이미지 생성을 위한 잠재 확산 모델에서는 VAE를 통한 지각적 압축을 수행하여 잠재 공간에서 효율적인 확산 과정을 수행한다.

콘텐트와 스타일 정보를 효과적으로 분리하고 통합하기 위해, 콘텐트 인코더가 추출한 문자의 구조적 정보는 채널 어텐션을 통해 U-Net의 인코더 부분에만 주입하고, 스타일 인코더가 다중 참조 이미지로부터 추출한 스타일 정보는 교차 어텐션을 통해 주입하는 방법으로 문자 이미지를 생성한다.

 

실험 결과, 제안된 서명 이미지 생성 모델은 CEDAR 데이터셋에서 유사도 분류 정확도 93.0%, 클래스 분류 정확도 93.4%를 달성하였으며, BHSig260-B 데이터셋에서는 유사도 분류 정확도 98.9%, 클래스 분류 정확도 99.4%를 기록하여 고품질의 서명 이미지를 생성할 수 있음을 확인하였다.

제안된 문자 이미지 생성 모델은 손글씨 폰트 이미지를 대상으로 학습 및 생성하였을 때 FID 19.58, SSIM 0.9655를 기록하여 실용적 활용이 가능한 수준의 문자 이미지를 생성할 수 있었다.

본 연구는 확산 모델을 필기 이미지 생성에 적용하여 각 구성 요소의 설계 원칙을 실험적으로 검증했으며, 서명과 문자라는 상이한 필기 도메인에서 공통적으로 적용 가능한 설계 가이드라인과 도메인별 특화 전략을 실험적 검증을 통해 제시한다.

학위연월
2025년 8월
지도교수
이도훈
키워드
diffusion model, generative model, image generation
소개 웹페이지
djhong91.github.io
첨부파일
첨부파일이(가) 없습니다.
다음글
Comparative Complexity of Neuropeptide and Receptor Transcriptional Regulation in Drosophila melanogaster
류승희 2025-10-01 07:57:28.637
이전글
연합학습 기반 그래프 신경망을 활용한 전기차 충전소 최적 선택 기법
류준우 2025-04-09 09:40:52.423
RSS 2.0 139
게시물 검색
박사학위논문
번호 제목 작성자 작성일 첨부파일 조회수
139 Enhancing Threat Detection and Response Automation 이스마일 2025.10.20 5 99
138 Code-mixing 환경을 위한 한국어 통합 G2P 시스템 최성기 2025.10.17 0 202
137 고속 컨베이어 환경에서의 생산 공정물 결함 검출을 위한 AI 비전 시스템 김형건 2025.10.17 0 101
136 Toward Reliable and Scalable Multi-Cell LoRaWAN Ne 호앙 꾸옥 홍 낫 2025.10.16 0 101
135 Differentially Private Context-Aware and Data-Cen 우타리예바 아쎔 2025.10.10 0 130
134 Scalable Quantum Annealing Frameworks for Combinat 정선근 2025.10.02 0 127
133 Comparative Complexity of Neuropeptide and Recepto 류승희 2025.10.01 0 117
132 확산 모델 기반 필기 이미지 생성에 관한 연구 홍동진 2025.04.10 0 199
131 연합학습 기반 그래프 신경망을 활용한 전기차 충전소 최적 선택 기법 류준우 2025.04.09 0 187
130 Exploring Quantum Approach Applied to Cryptanalysi 와다니 리니 위스누 2025.04.08 0 210
129 Towards computation - communication efficient and 응우옌 민 두옹 2025.04.08 0 165
128 Hybrid Quantum Residual Neural Networks for Classi 노대일 2025.04.08 0 177
127 Distributed Resource Management for Massive IoT Ne 응우옌 쑤언 둥 2025.04.08 0 146
126 A Framework for Leveraging Large Language Models i 데리 프라타마 2025.04.07 0 192
125 Discovery and Authentication of Marker Genes Using 프라타마 리안 다니스 아디 2025.04.07 0 210
124 산업 환경의 IEEE 802.15.4 TSCH 기반 네트워크에서 트래픽 처리량 향상을 위한 이희준 2025.04.07 0 194
123 Uncertainty-Based Hybrid Deep Learning Approach fo 멘가라 악셀 기드온 2024.12.10 0 233
122 Effective Deep Learning Primitives Design for Bina 황선진 2024.10.14 0 215
121 Toward Immersive Multiview Video Streaming through 탄중 디온 2024.10.14 0 188
120 A Low-cost Deep Learning Model for Real-time Low L 등 제강 2024.10.10 0 230