오늘 간만에 토다를 둘러보다가 예전에 잠시 만지작 거렸던 프로그램이 버전업되었길래 설치후기 겸 참고하실 분 보시라고 적습니다.

 소개해 드릴 프로그램은 제목에서도 보셨듯이 스캔, 사진, PDF 파일의 글자를 자체적으로 인식해서 텍스트/문서 파일로 만들어 주는 Nuance OmniPage Pro V17 라는 프로그램입니다. 

▶ 홈페이지 : http://www.nuance.com/imaging/products/omnipage.asp


 단문의 문서를 참고한다면 그냥 보면서 타이핑 치면 되겠지만 장문이라면 말이 달라지죠. 그럴 경우 상당히 유용할 듯 합니다. 예를들어 약 40~50장 정도의 장문의 글을 붙여넣은 후 편집하면서 오타만 수정하면 되는 것과 직접 보면서 타이핑하는 것을 비교한다면 어는 것이 더 간편할지는 뻔하니깐요.

 사용 방법에 따라 달라지겠지만 제대로 하시는 분들 설명으로는 거의 99% 정도의 한글을 제대로 인식한다고 하네요. 

 설치 과정이 영문이긴 하지만 간단하니까 넘어가기로 하고, 설치 후에는 사이트 들어가서 짧게 아무렇게나 등록하시고 exit 누르시면 설치는 완료됩니다.
 

 설치 완료 후 프로그램을 실행하면 아래와 같이 나옵니다.

실행장면


 프로그램을 실행한 후 Tools 메뉴에서 Options 를 선택. 옵션에서 언어를 Korean 을 선택합니다. 이렇게 하셔야 문서에서의 한글을 프로그램이 인식합니다. 여기서 짧게 팁이라면 기본 English 체크는 해제하시는 것이 한글을 더 잘 인식하는 결과를 보였습니다. 영어는 체크해제해도 거의 100% 하는 모습이었습니다.
  

옵션 선택하기


한글 체크


 옵션 적용 후 이제 텍스트로 뽑고 싶은 파일을 불러와 봅니다.
 PDF, JPG 외에도 많은 확장자 파일이 가능하지면 여기서는 빠르게 적용해보기 위해 PDF 파일에서 한 장 JPG 로 저장한 후 불러왔습니다. 

 파일을 드래그 하여 가장 왼쪽 Thumbnails 로 옮기면 아래와 같이 인식을 하는데 해당 페이지 전체를 인식시켜서 텍스트 파일로 옮기고자 하시면, 그냥 1-2-3 버튼을 누르시면 자동으로 인식 - 변환됩니다. 아래는 그 스샷입니다.
※ 1-2-3 옆의 메뉴바를 보시면 아래 사진에서는 카메라 모양으로 변해 있습니다.(기본 Load Files) 
다른 확장자를 다 해보지 않아 정확히 모르겠지만 png 파일은 사진파일로 인식을 제대로 못하더군요. 그래서 일부러 JPG 로 파일을 만들어 적용했습니다. 참고하세요^^;;
 

적용 시작



적용 완료


 완료되면 위와 같이 complete 새창이 뜹니다. 여기서 오른쪽 화면을 보시면 변형되어 텍스트로 인식한 모습이 보입니다. 우측 모습이 저렇게 뭉게지고 깨져 있어서 잘못된거 아닌가 걱정하실 필요 없습니다. 저장하면 나름 깔끔하게 원형을 유지하려는 형태로 나타납니다.

 변형 후 저장할 이름을 지정하는 새창이 뜨는데 여기서 저는 간단하게 TXT 파일로 만들어 봤습니다.

텍스트파일로 저장



[참고] 저장시 지정할 수 있는 확장자 목록입니다. 보시면 아시겠지만 워드, 파포, PDF, XPS 등 다양합니다.


저장 후 원본 사진파일과 변형된 텍스트 파일을 비교해 보았습니다.

비교 & 잘못 인식된 부분 체크


 적용 결과를 보니 100% 완벽하진 않습니다^^;;; 하지만 장문을 옮기는 작업일 경우(논문, 레포트 등)에는 꽤 편리할 듯 합니다.
 한글에서 잘못 인식하는 부분은 "ㅓ" 를 "ㅣ" 로 인식하는게 대부분이었습니다.  다 그런건 아니지만...테스트 부분에서는 대부분이라고 해봐야 달랑 2군데..^^;;;
 몇몇분들의 설명으로는 포토샵으로 사진을 선명하게 하면 더 나은 결과를 얻을 수 있다고 합니다^^;;;; 
 그 외 잘못 인식하는 것들은 보시면 아시겠지만 특수문자 인식 문제네요.

[추가 Tip 2]
 
스캔을 포토샵으로 받는 것을 권해드립니다. 이미지 보정을 해서 사용할 수 있으니까요. 이미지 보정이 중요한 이유는 미세한 인식오류를 사전에 방지해 준다고 합니다.

▶ 보정 차이에 따른 인식 비교 : Omnipage Pro 포토샵 보정에 의한 인식 변화



※ 자료를 부탁하신 분들께는 최대한 빠르게 보내드리고자 노력하고 있습니다. 자료를 활용하신 후에는 짧막한 댓글 / 추천 정도는 부탁드려도 되겠지요? ^^ 그걸로 서로 퉁~ 치자구요 ㅎㅎ

※ 관련 내용을 요청하실 것이 있는 분은 상단의 버튼식 메뉴에 보이는 방명록(GuestBook)의 비밀글 기능을 이용해 주세요. 앞으로는 위 내용과 관련하여 아래 댓글 및 공개글로 어떤 요청을 하신다면 죄송하지만 삭제조치하겠습니다. 서로를 위한 방안이니 부당하게 여기지 마시길 바라며...


LiveREX 유튜브 채널 추천 영상 (구독하고 선물도 받아가세요!)
☞ 이 글은 LiveREX 의 동의없이 재발행/재배포 할 수 없습니다. [License] 를 참고하세요!
Facebook Comment