용어집

활성 영역은 삭제, 이동 또는 수정할 수 있는 이미지의 특정 선택 영역입니다. 영역을 활성 상태로 만들려면 클릭하십시오. 활성 영역을 둘러싸는 프레임은 굵게 표시되며 끌어서 영역의 크기를 변경할 수 있는 작은 정사각형으로 되어 있습니다.

자동 급지 장치(ADF)는 문서를 스캐너로 자동으로 보내는 장치입니다. ADF가 있는 스캐너는 수동으로 처리하지 않고도 여러 페이지를 스캔할 수 있습니다. FineReader Sprint는 여러 페이지 문서를 지원합니다.

ADRT®(Adaptive Document Recognition Technology)는 여러 페이지 문서의 변환 품질을 높여주는 기술입니다. 예를 들어, 제목, 머리글 및 바닥글, 각주, 페이지 번호 매기기 및 서명과 같은 구조적 요소를 인식할 수 있습니다.

영역 은 프레임으로 둘러싸인 이미지의 한 부분이며 데이터의 특정 유형입니다. OCR을 수행하기 전에 FineReader Sprint는 인식할 이미지의 부분과 순서를 결정하기 위해 텍스트, 그림, 표 및 바코드 영역을 검색합니다.

영역 템플릿은 비슷한 일련의 문서에서 영역의 크기와 위치에 대한 정보가 들어 있는 템플릿입니다.

배경 이미지 영역은 텍스트가 인쇄된 그림이 들어 있는 이미지 영역입니다.

바코드 영역은 바코드가 들어 있는 영역입니다.

코드 페이지는 문자와 문자의 코드를 대응시키는 표입니다. 사용자는 코드 페이지에서 사용 가능한 것들을 통해 필요한 문자를 선택할 수 있습니다.

컬러 모드는 문서 컬러가 보존되는지를 결정합니다. 흑백 이미지는 작은 FineReader 문서를 생성하고 프로세스를 빠르게 해줍니다.

문서 분석은 문서의 논리적 구조 요소 및 다른 데이터 유형 영역을 식별하는 프로세스입니다. 문서 분석은 자동 또는 수동으로 수행할 수 있습니다.

문서 열기 암호는 작성자가 지정한 암호를 입력해야 PDF 문서를 열 수 있는 암호입니다.

dpi(Dots per inch)는 이미지 해상도 단위입니다.

드라이버는 컴퓨터 주변 기기(스캐너, 모니터 등)를 제어하는 소프트웨어 프로그램입니다.

FineReader 문서는 종이 문서 처리를 위해 FineReader Sprint에서 생성한 개체입니다. 페이지 이미지, 인식된 텍스트(모든 텍스트가 인식된 경우), 인식 언어 및 내보내기 설정이 포함되어 습니다.

무시된 문자는 단어에 포함된 글자 이외의 문자(음절 문자 또는 강세 기호 등)입니다. 이런 문자는 맞춤법 검사에서 무시됩니다.

반전된 이미지는 배경은 어둡고 문자는 밝게 인쇄된 이미지입니다.

결합문자는 두 개 이상의 결합된 문자의 조합입니다(예: fi, fl, ffi). 이러한 문자는 FineReader Sprint에서 구분하기 어렵습니다. 이런 문자를 하나의 복합 문자로 취급하면 OCR의 정확도가 높아집니다.

사용자 지정 하이픈은 줄 끝에 있는 경우 단어나 단어 조합을 어디에서 끊을 것인지를 나타내는 하이픈(¬)입니다("자동포맷"의 경우 "자동-" 및 "포맷"으로 분리). FineReader Sprint 는 사전 문자에서 발견되는 모든 하이픈을 사용자 지정 하이픈으로 바꿉니다.

페이지 레이아웃은 페이지 상의 텍스트, 표, 그림, 단락 및 열의 정렬입니다. 글꼴, 글꼴 크기, 글꼴 색, 텍스트 배경 및 텍스트 방향 또는 페이지 레이아웃의 일부입니다.

페이지 레이아웃 분석은 페이지 이미지의 영역을 검색하는 과정입니다. 영역은 텍스트, 그림, 표, 바코드, 배경 그림 및 인식 영역으로 6개 유형입니다. 페이지 레이아웃 분석은 읽기 단추를 클릭할 때 자동으로 수행될 수도 있고 OCR 전에 사용자가 수동으로 수행할 수도 있습니다.

PDF 보안 설정은 PDF 문서를 열기, 편집, 복사 또는 인쇄할 수 없게 만드는 제한 사항입니다. 이러한 설정에는 문서 열기 암호, 사용 권한 암호 및 암호화 수준이 있습니다.

사용 권한 암호는 작성자가 지정한 암호를 입력하지 않으면 다른 사용자는 PDF 문서를 인쇄 또는 편집하지 못하는 암호입니다. 문서에 대해 보안 설정을 선택하면 다른 사용자는 암호를 입력하지 않으면 이러한 설정을 변경할 수 없습니다.

그림 영역은 그림이 들어 있는 이미지 영역입니다. 이 유형의 영역은 실제 그림 또는 그림으로 표시할 다른 개체(예: 텍스트의 섹션)를 둘러쌀 수 있습니다.

기본 형태는 "사전" 단어 양식입니다(사전 항목의 표제어 입력 항목들은 대개 표제어의 기본 형태로 제시됩니다).

금지어는 인식될 텍스트에서 특정 문자가 결코 등장하지 않을 경우, 그 문자가 금지어 목록에 포함되어 있을 수 있습니다. 금지어를 지정하면 OCR의 속도 및 품질이 높아집니다.

해상도는 dpi(dots per inch)로 측정하는 스캐닝 매개변수입니다. 10포인트 글꼴 이상으로 설정된 텍스트의 경우 300dpi 해상도, 글꼴 크기가 9포인트 이하로 인쇄되는 작은 텍스트의 경우 400에서 600dpi가 많이 사용됩니다.

인식 영역은 사용자가 읽기 단추를 클릭하면 FineReader Sprint가 분석하여 자동으로 읽는 이미지 영역입니다.

스캐너는 이미지를 컴퓨터에 입력하는 장치입니다.

스캐닝 모드는 이미지를 흑백, 회색조 또는 컬러로 스캔할 것인지를 지정하는 스캐닝 매개변수입니다.

구분 기호는 단어를 구분하기 위해 사용하는 기호(예: /, \, — 등)이며 단어와는 공백으로 구분됩니다.

지원 ID는 일련 번호의 고유 식별자입니다. 지원 ID는 추가 보호 기능을 제공하며 기술 지원을 제공하기 전에 기술 지원 직원이 확인합니다.

표 영역은 표 양식에 데이터가 포함되어 있는 이미지 영역입니다. 응용프로그램이 이 유형의 영역을 읽으면 응용프로그램은 표를 형성할 영역내에 수직과 수평의 구분 기호를 그립니다. 그러면 이 영역은 출력 텍스트에서 표로 그려집니다.

Tagged PDF는 문서의 논리적 부분, 그림 및 표와 같이 문서 구조에 대한 정보가 포함된 PDF 문서입니다. 문서 구조는 PDF 태그 안에 인코딩되어 있습니다. 그러한 태그가 사용된 PDF 파일은 다른 화면 크기에 맞게 변경될 수 있으며 휴대용 장치에서 잘 표시됩니다.

텍스트 영역은 텍스트가 들어 있는 이미지 영역입니다. 텍스트 영역은 단일 열 텍스트만 포함할 수 있습니다.

불확실한 문자는 응용프로그램이 잘못 인식했을 수 있는 문자입니다.

유니코드는 Unicode Consortium(Unicode, Inc.)에서 개발한 표준입니다. 이 표준은 텍스트 처리를 위한 16비트 국제 인코딩 시스템입니다. 이 기준은 특정 언어로 쓰여진 텍스트를 처리하는 데 사용하는 문자 인코딩, 속성과 절차를 결정합니다.