본문 바로가기

OCR

SH OCR 6.0 (3. '한글'에서 중국어 텍스트 파일 이용하기. 끝) 중국어로 이루어진 텍스트를 만드는 데까지는 일사천리로 이루었으되, 이것을 그냥 두면 '꿰지 않은 구슬'일 뿐이오. 널리 이용하는 '한글'을 통해 '꿰인 구슬'로 만들어 보쇠다. 그대로 편집하면 되지만, 간체자가 부담스러워 번체자로 바꾸고 싶다면, 아래와 같이 하면 되오. * * * 비록 문자인식이라는 기술이 참으로 좋기는 하나, 아직은 100%의 인식률을 보이지는 않소. 인식률이 99%라 하여도 한 페이지당 3~5 글자 정도는 오식되는 셈이니, 오식을 찾아 고쳐주는 것도 보통 일은 아니오. 그리고, '한글'에서도 간혹 코드가 맞아떨어지지 않는 경우가 있어 엉뚱한 글자로 바뀔 수 있으니, 면밀히 교정하는 작업이 필수적이라 하겠소. * * * 이상으로 SH OCR 6.0을 이용한 문자인식에 대하여 알아보았소.. 더보기
SH OCR 6.0 (2. 문자인식) 2. 문자인식 설치를 잘 하였으니 이제 본연의 기능인 문자인식을 해 보오. 실행을 하면 역시 이런저런 깨진 모양을 보여주는데, 일단 아래와 같은 처치를 해 주오. 보기 좋은 모양새로 바꾸었으니, 이제 인식하고자 하는 그림파일을 불러오오. (문서를 스캔할 때는 200dpi 이상의 해상도에서 'Black & White'로 하는 것이 좋소. SH OCR 6.0은 BMP, TIFF, JPG의 세 가지 형식만 지원하니 GIF나 PNG 등의 다른 형식으로 저장하진 마오.) 그림이 너무 작게 표시되므로, 아이콘을 클릭한 뒤 돋보기 모양의 커서를 그림에 클릭하오. 스캔할 때 살짝 비뚫어져 있었다면 인식률이 다소 떨어지게 되오. 아이콘을 클릭하여 비뚫어짐 보정을 해 주오. 글자 사이에 불필요한 점 같은 것이 끼어 있으면.. 더보기
SH OCR 6.0 (1. 설치) 0. 프롤로그 무릇 OCR이라 함은, 설명하기 귀찮으니 링크를 참고하시오. 요즘에야 스캐너에 번들로 들어 있는 OCR도 우수한 인식률을 보여주므로 별도의 OCR 소프트웨어를 사용할 일이 거의 없으나, 몇 년 전만 해도 문자인식을 위해서는 '아르미' 등의 OCR 소프트웨어를 별도로 구해서 사용해야 했소. 그런데, 영문이나 한글은 인식률이 썩 좋았지만, 한자, 특히 간체자 위주로 이루어진 문서를 대할 때면 애로사항이 활짝 꽃피는 일이 허다하였소. 그리하야, 당시에는 아래와 같은 물건을 구해다 쓰는 것이 유일한 대책이었으니.. 두둥! 이 자리를 빌어, 이걸 중국에서 직접 구해다 주신 지니어스윤 선햏께 심심한 감사를 표하오. 요새는 스캐너 번들 소프트웨어에서도 영문, 한글, 간자, 번자, 일문을 막론하고 잘 인.. 더보기