少樣本學習手寫字體生成模型

Few-Shot Learning Handwritten Font Generative Model


摘要

本研究採用基於機器學習的編碼-解碼模型(Encoder-Decoder)架構,將輸入影像轉換為潛在表示並解碼為生成的手寫字影像。這種架構能從現有手寫字影像中學習風格特徵,並生成相似風格的新手寫字影像。一旦訓練好生成模型,就能由少數樣本自動生成整套具有個人風格的手寫字體。雖然手寫字體能更好地表達個人風格並彌補資訊社會的冷漠感,但生成手寫字體需要大量人力和時間。前期需人工書寫大量文字,後期也要進行複雜的程式處理,才能生成一套完整的手寫字體。為了解決手寫字生成的繁瑣問題,本研究使用全新設計稿紙,收集了六十八人的大五碼(Big5)手寫字樣本,構建了包含 924,732 字的六十八人 Big5 手寫字體資料集作為本研究的基礎資料。接著通過生成模型進行少樣本學習,從少數字學習手寫風格並自動生成大量文字的手寫字。本研究節省了人力和時間,同時提高了手寫字體生成的效率。





系統概要與生成結果

本研究收集了六十八人的大五碼(Big5)手寫字樣本,構建了包含 924,732 字的六十八人 Big5 手寫字體資料集。並且接著通過生成模型進行少樣本學習,從少數樣本學習手寫風格並自動生成大量的手寫字。

本研究所使用的生成模型方法為 MX-Font 和 字到字 (zi2zi),生成結果如圖所示。





手寫資料集

北京大學 EasyFont 論文系統製作 CircleFont

字數: 3515 字





北京大學 EasyFont 論文系統製作 CircleFont_v2

字數: 5275 字





北科大方法製作結果





簡介影片

本論文之說明影片,包括研究背景概述、資料集製作、研究中所使用的生成模型方法與生成結果,以及生成結果的相似度計算比對。




CircleNTUT 改革演變說明

原始 PowerPoint 下載