본문 바로가기

~하는 법

SH OCR 6.0 (3. '한글'에서 중국어 텍스트 파일 이용하기. 끝)

중국어로 이루어진 텍스트를 만드는 데까지는 일사천리로 이루었으되, 이것을 그냥 두면 '꿰지 않은 구슬'일 뿐이오.

널리 이용하는 '한글'을 통해 '꿰인 구슬'로 만들어 보쇠다.

'한글'을 실행하여 '불러오기'를 하오.<br />'파일 형식'을 '텍스트 문서' 또는 '유니코드 문서'로 선택하여 열어야 하오.



'문자 코드 선택'을 '간체(GB)'로 하고 '읽기'를 클릭하오.


이렇게 매끈하게 읽어지게 되오.<br />한글 200x은 물론이고, 한글 97에서도 잘 읽히오.



그대로 편집하면 되지만, 간체자가 부담스러워 번체자로 바꾸고 싶다면, 아래와 같이 하면 되오.

먼저 전체선택을 하고(단축키 [Ctrl+A]),


메뉴의 '편집'에서 '글자 바꾸기'→'간체/번체 바꾸기'를 클릭하오.<br />단축키는 [Alt+Shift+F9] 되겠소


간체/번체 바꾸기 창이 뜨면 '바꿀 방법'에서 '간체를 번체로'를 선택하고 [바꾸기]를 누르오.


이와 같이 멋스러운 번체자로 모두 바뀌었소.



* * *

비록 문자인식이라는 기술이 참으로 좋기는 하나, 아직은 100%의 인식률을 보이지는 않소.
인식률이 99%라 하여도 한 페이지당 3~5 글자 정도는 오식되는 셈이니, 오식을 찾아 고쳐주는 것도 보통 일은 아니오.

그리고, '한글'에서도 간혹 코드가 맞아떨어지지 않는 경우가 있어 엉뚱한 글자로 바뀔 수 있으니, 면밀히 교정하는 작업이 필수적이라 하겠소.

* * *

이상으로 SH OCR 6.0을 이용한 문자인식에 대하여 알아보았소.
지금은 8.0이나 10.0 버전이 나왔을지도 모를 일이구료. 언젠가 구해지면 또 다루어보리다.

태그