: 스캔 / 사진파일 문서를 텍스트로 바꾸는 프로그램 - Omnipage


 위 포스팅을 하고 나서 윈도우 7 카페에 해당 글을 게재했다가 류지명님 의견에 저도 호기심이 발동하여 테스트 해 본 결과입니다.

 글자가 크고 뚜렷한 것들은 다 잘 인식할 거라 생각되서 글자가 작고 오밀조밀하게 적힌 페이지를 사진파일로 만들어서 비교해 봤습니다. 참고로 문서 원본 자체의 활자가 육안 인식상으로도 뚜렷하지 않다는 점 참고해주세요.

 포토샵으로 보정하는 방법이 가지각색인지라 저는 대표적으로 많이 쓰는 오토 기능과 필터의 shapen 기능, 그리고 curves, 마지막으로 level 수동 조절 기능으로 비교했습니다. 더 좋은 보정 방법을 아시는 분은 의견 달아주세요^^

 오밀조밀하면 떠오르는 글은 역시 법 조문 관련 글이죠^^;;; 결과물 보시죠!!

클릭하시면 크게 보입니다


 글자가 작아서 잘 안보이실 듯하여 설명드리지면, 메모장 위에서부터 보정 전, 오토+shapen, 오토+shanpen+curves, 오토+curves 진하게, 레벨 수동 조정입니다.

 보정전 결과는 시작부터 원문자를 제대로 인식도 못할 뿐더러 도통 먼 말인지 알 수 없는 문장들이... -_-

 위 5가지 보정 중에서 제일 정확도가 높은건 오토+shapen+curves 였습니다.
curves 효과 적용 차이는 아래에서 사진으로 참고하시도록 했습니다.
 또한, 레벨과 curves 기능으로 글자를 진하게 할수록 좋을 듯하여 번갈아가며 몇 번 테스트 해봤으나, 일정 수준 이상 진해질수록 오히려 잘못 인식하기만 하는 결과를 보였습니다.
 
[참고] curves 적용 차이 비교



위 사진이 3번째 메모장, 즉 제일 잘 인식한 보정의 결과물이고, 아래 사진의 결과가 4번째 메모장입니다.

 다시 한번 말씀드리지만 보정 방법은 이것보다 훨씬 다양합니다. 여기서는 대표적으로 사용하시는 몇 가지만 적용해 본 결과일 뿐입니다.
 
 더 좋은 보정 방법을 아시면 좋은 정보 부탁드립니다^^

[추가 Tip]

 류지명님께서 알려주신 더 잘 인식하게 하기 위한 스캔/보정시 팁입니다.
핵심만 스샷으로 올려드릴게요^^;;;


▷ 제가 작업한 해상도는 스크린 해상도인 72 dpi 입니다. 72 dpi 에서 위와 같은 오밀조밀한 사진 파일도 약간의 보정만으로 저 정도의 결과를 보여주니 Omnipage pro 의 성능을 짐작하시는데 어려움 없으실 것으로 생각되네요.

LiveREX 유튜브 채널 추천 영상 (구독하고 선물도 받아가세요!)
☞ 이 글은 LiveREX 의 동의없이 재발행/재배포 할 수 없습니다. [License] 를 참고하세요!
Facebook Comment