ㅤㅋㅝㄱ익스프레스 파일을 이미지나 텍스트로 변환하는 방법 문의드립니다.

ㅤㅋㅝㄱ익스프레스 파일을 이미지나 텍스트로 변환하는 방법 문의드립니다.

김용우 2 5,390
ㅤㅋㅝㄱ익스프레스 파일을 레이아웃 그대로 유지하면서 이미지 파일로 만드는 방법, 그리고 ㅤㅋㅝㄱ익스프레스 파일의 텍스트를 추출하는 방법을 찾고 있습니다.

맨 처음에는 ㅤㅋㅝㄱ익스프레스 파일을 PDF로 변환하면 문제를 간단히 해결할 수 있을거라 생각했습니다.

일단 PDF 파일로 변환하면 이미지 파일로 변환할 수도 있고, 원하면 텍스트도 간단히 추출할 수 있다고 봤으니까요.

그런데, Acrobat으로 PDF 파일을 만들면 라이센스가 있는 서체 같은 경우는 다른 서체로 변환이 되기 때문에 레이아웃이 바뀌어서 PDF 파일이 만들어진다고 하네요.

그러면 나중에 이미지 파일로 변환할 때도 원본 ㅤㅋㅝㄱ익스프레스 파일과 다른 레이아웃의 이미지가 만들어질테니 그건 원하는 게 아닙니다.

PDF Invader나 ezPDF gate 같은 프로그램은 이 문제를 해결했다곤 하는데 모든 서체를 지원하는 건 아닌가 보네요. 번들된 서체가 출판할 때 일반적으로 많이 쓰는 서체인지도 잘 모르겠고요.

그래서 ㅤㅋㅝㄱ익스프레스 파일에서 바로 이미지로 변환하는 방법이 있는지, 그리고 ㅤㅋㅝㄱ익스프레스 파일에서 텍스트를 쉽게 추출하는 방법이 있는지 여쭤봅니다.

한페이지씩 EPS 파일로 저장하는 기능은 있는 것 같던데, 많은 파일을 한 페이지씩 작업하는 건 비효율적이라 일괄적으로 할 수 있는 방법을 찾고 있습니다.

텍스트를 추출하는 것도 한꺼번에 파일 내의 모든 텍스트를 추출할 수 있으면 하고요. 텍스트도 html이거나 xml 같은 구조적인 텍스트 파일로 추출할 수 있으면 더 좋을 것 같습니다. 

Comments

김용우
답변 감사합니다. 서체 문제가 완벽히 해결되는게 아니라면 좀 문제가 있을 것 같네요. 좀더 고려해보겠습니다. 
베스트맥(A/S,판매)
현재 PDF로 전환하는 방법이 가장 최선이고요.

그중에서 EZ PDF GATE가 최고에 방법 입니다.

EZ PDF GATE는 PC에 설치하는 프로그램이고요.
포스트스크립트 서체와 한셋트 입니다.
그래서 프로그램과 서체를 PC에 설치하고 맥에서 출력을 보내면 PC에 설치된 포스트스크립트 서체가 PDF파일로 전환되는 겁니다.
다시 말해서 PC에 PDF파일로 저장이 되는 겁니다.

모든 서체가 안되다는것은 아니고요.
설치되어 있는 포스트스크립트 서체만 변환이 되고요.
그외에 서체는 변환은 되지만 자간이 정확하지 않습니다.

EZ PDF GATE를 공급하는 유니닥스 회사다 모든 서체회사에 공급 계약이 되어 있니 않기 때문입니다.
===================
도움이 필요하시면 베스트맥(A/S,판매)를 클릭하고 자기소개를 참고하세요 
Banner
Facebook Twitter GooglePlus KakaoStory NaverBand