Multi-Modal Preprocessor(HWP->Markdown)

최근 멀티모달 기술이 많은 관심을 받고 있습니다. 멀티모달 연구를 하면서 중요한 점은 이미지와 텍스트를 컴퓨터가 읽을 수 있는 형태로 정확히 변환하는 것입니다. PDF나 Docs 파일을 추출하는 라이브러리는 많이 있지만, 한국에서 많이 사용되는 hwp 파일을 변환하는 라이브러리는 부족하다고 느껴 직접 제작하게 되었습니다.

데모페이지

https://ca2b9bd16df610fdeb.gradio.live

사용하는 방법

  1. hwpx 파일을 업로드해주세요.
  2. 업로드된 파일을 Markdown 형식으로 변환해드립니다. 이미지가 포함된 경우, 해당 위치에 image 태그로 변환하여 표시됩니다. 현재는 hwpx 파일만 지원합니다.

준비된 기능

  1. 추출된 이미지와 markdown을 다시 전달하기
  2. 한글에는 특히 배경 이미지들이 많은데요. 멀티모달을 학습할때는 이런 이미지가 필요없기 때문에 삭제해드리는 기능

답글 남기기