최근 멀티모달 기술이 많은 관심을 받고 있습니다. 멀티모달 연구를 하면서 중요한 점은 이미지와 텍스트를 컴퓨터가 읽을 수 있는 형태로 정확히 변환하는 것입니다. PDF나 Docs 파일을 추출하는 라이브러리는 많이 있지만, 한국에서 많이 사용되는 hwp 파일을 변환하는 라이브러리는 부족하다고 느껴 직접 제작하게 되었습니다.
데모페이지
https://ca2b9bd16df610fdeb.gradio.live
사용하는 방법
- hwpx 파일을 업로드해주세요.
- 업로드된 파일을 Markdown 형식으로 변환해드립니다. 이미지가 포함된 경우, 해당 위치에 image 태그로 변환하여 표시됩니다. 현재는 hwpx 파일만 지원합니다.
준비된 기능
- 추출된 이미지와 markdown을 다시 전달하기
- 한글에는 특히 배경 이미지들이 많은데요. 멀티모달을 학습할때는 이런 이미지가 필요없기 때문에 삭제해드리는 기능