FineReader Sprint 詞彙

A B C D F I L O P R S T U

A

Active area(作用中區域)是可在文件上刪除、移動或修改的選取區域。要將某區域設定為作用中,請按一下該區域。包圍作用中區域的框架為粗體,且提供可拖曳與變更區域大小的小方括弧 。

Automatic Document Feeder(自動進紙器,ADF)設備可用於將文件自動放至掃描器。具有 ADF 的掃描器不需要手動介入即可掃描多頁面。FineReader Sprint 支援多頁文件。

ADRT® (適應性文件辨識技術) 是可提升多頁文件轉換品質的技術。例如,它能辨識諸如標題、頁首與頁尾、腳註、頁碼及簽名等結構元素。

區域是影像上被邊框所包圍,且包含某類型資料的部分。執行 OCR 之前,FineReader Sprint 會偵測文字、圖片、表格和條碼區域,以判斷要辨識哪一個影像區域及辨識順序。

區域範本是在一組外觀相似的文件內,包含有關區域的大小和位置的資訊的範本。

B

背景影像區域是一個包含文字的圖像的影像區域。

條碼區域是包含條碼的影像區域。

C

字碼頁是建立字元與字元代碼間相互關係的表格。使用者可從字碼頁中選取所需的可用字元。

色彩模式決定是否保留文件顏色。黑白影像會產生更小的 FineReader 文件,且處理速度較快。

D

文件分析是用於識別具有不同資料類型的文件和區域的邏輯結構元素的過程。可以自動或手動方式進行文件分析。

文件開啟密碼可避免使用者開啟 PDF 文件的密碼,除非使用者輸入作者指定的密碼。

每英寸點數 (dpi) 是影像解析度的度量標準。

Driver(驅動程式)是用於控制電腦週邊設備 (例如,掃描器、螢幕等) 的軟體程式。

F

FineReader 文件是由 FineReader Sprint 所建立的物件,可用於處理書面文件。它包含頁面影像、已辨識的文字 (如果已辨識任何文字)、辨識語言和匯出設定。

I

已忽略的字元是任何在字詞中找到的非字母的字元 (例如,音節字元或重音符號)。拼字檢查時,將忽略這些字元。

反相影像是在陰暗背景列印白色字元的影像。

L

連字是兩個或更多「黏合」字元的組合 (如 fi、fl、ffi)。FineReader Sprint 很難將這些字元分開。將它們視為一個複合字元處理可提高 OCR 準確性。

O

選擇性的連字號是當字詞或字詞組合出現在行尾而需要分割時,表示應分割的確實位置的連字號 (¬) (例如,「autoformat」應分割成「auto」和「format」)。FineReader Sprint 可取代在具有選擇性的連字號的字典字詞中找到的所有連字號。

P

頁面配置是頁面上文字、表格、圖片、段落和欄的排列。字型、字型大小、字型顏色、文字背景和文字方向也屬於頁面配置的一部分。

頁面配置分析是偵測頁面上的影像區域的程序。區域可分為六種類型:文字、圖像、表格、條碼、背景圖像和辨識區域。可按一下「讀取」按鈕後自動執行頁面配置分析,或在 OCR 之前使用者手動執行。

PDF 安全性設定是可避免開啟、編輯、複製或列印 PDF 文件的限制。這些設定包括文件開啟密碼、權限密碼和加密層級。

權限密碼是可避免其他使用者列印和編輯 PDF 文件的密碼,除非他們輸入作者指定的密碼。如果文件有選取特定的安全設定,則除非其他使用者輸入密碼,否則將無法變更這些設定。

圖像區域是包含圖像的影像區域。此類區域可能包含實際圖片或任何其他應會顯示為圖片的物件 (例如所選文字)。

主要形式是字詞的「字典」形式(字典條目的詞條通常以主要形式提供)。

禁止使用的字元如果某些字元絕對不會在要辨識的文字中出現,則它們可能已包含在禁止使用的字元清單中。指定禁止使用的字元可提升 OCR 的速度及品質。

R

解析度是以每英寸點數 (dpi) 為單位的掃描參數。300 dpi 的解析度應用於字型大小為 10pt 或更大的文字,而 400 至 600 dpi 則適合以較小字型大小 (9pt 或更小) 列印的文字。

辨識區域是在按一下讀取按鈕時 FineReader Sprint 應該會自動分析和讀取的影像區域。

S

掃描器是將影像輸入電腦的裝置。

掃描模式是決定是否以黑白、灰階或彩色掃描影像的掃描參數。

分隔符號是可分隔字詞 (例如,/、\、—) 並由空格從字詞本身分開的符號。

支援 ID 是序號的唯一識別碼。支援 ID 提供了額外防護,在提供技術支援前先由技術支援服務人員檢查。

T

表格區域是包含表格資料的影像區域。當應用程式讀取這類區域時,它會在區域內描繪垂直與水平分隔符號以形成表格。此區域會在輸出文字中形成表格。

標記的 PDF 是包含邏輯部分、圖片和表格等文件結構資訊的 PDF 文件。該結構透過 PDF 標籤進行編碼。帶此類標籤的 PDF 檔案的內容可以重新編排,以符合不同大小的螢幕,並在手持裝置上正確顯示。

文字區域是包含文字的影像區域。注意,文字區域應僅包含單欄文字。

U

不確定的字元是程式可能未正確辨識的字元。

Unicode 是由 Unicode Consortium (Unicode, Inc.) 所開發的標準。此標準是用於處理文字的 16 位元國際編碼系統。此標準可決定了處理以某種語言書寫文字時所使用的字元編碼、屬性和程序。