Glossario

Area attiva: l'area selezionata di un'immagine che può essere eliminata, spostata o modificata. Per rendere attiva un'area, basta selezionarla facendo clic su di essa. Il riquadro che racchiude un'area attiva è in grassetto e presenta dei quadratini che è possibile trascinare per modificare le dimensioni dell'area.

Alimentatore automatico (ADF): un dispositivo che invia automaticamente i documenti a uno scanner. Uno scanner con alimentatore automatico è in grado di digitalizzare più pagine senza alcun intervento manuale. FineReader Sprint offre supporto per documenti multipagina.

ADRT®: Adaptive Document Recognition Technology (tecnologia di riconoscimento adattivo dei documenti), una tecnologia che consente di migliorare la qualità di conversione dei documenti multipagina. Questa tecnologia consente, ad esempio, di riconoscere elementi quali come titoli, intestazioni, piè di pagina, note, numeri di pagina e firme.

Area: una porzione di immagine racchiusa in un riquadro e contenente dati di tipo specifico. Prima dell'esecuzione dell'OCR, in FineReader Sprint vengono rilevate le aree testo, immagine, tabella e codice a barre per determinare le sezioni dell'immagine da riconoscere e l'ordine in cui eseguire il riconoscimento.

Modello area: un modello contenente informazioni sulle dimensioni e sulla posizione delle aree all'interno con documenti di aspetto simile.

Area immagine di sfondo: un'area immagine contenente un'immagine con del testo sovrimpresso.

Area codice a barre: un'area dell'immagine contenente un codice a barre.

Tabella dei codici: una tabella che stabilisce la corrispondenza tra i caratteri e i relativi codici. È possibile selezionare i caratteri desiderati tra quelli disponibili in una tabella di codici.

Modalità di colore: consente di determinare se conservare i colori del documento originale. Le immagini in bianco e nero generano documenti di FineReader Sprint di dimensioni ridotte e consentono un'elaborazione più rapida.

Analisi del documento: il processo di identificazione degli elementi della struttura logica di un documento e delle aree contenenti vari tipi di dati. L'analisi del documento può essere eseguita automaticamente o manualmente.

Password di apertura documento: una password specificata dall'autore che consente l'apertura del documento PDF solo agli utenti che la conoscono.

Punti per pollice (dpi): un'unità di misura per la risoluzione delle immagini.

Driver: un programma che controlla una periferica di computer, ad esempio uno scanner, un monitor e così via.

Documento FineReader: un oggetto creato da FineReader Sprint per l'elaborazione di un documento cartaceo e contenente le immagini delle pagine, il testo riconosciuto (se presente), la lingua di riconoscimento e le impostazioni di esportazione.

Caratteri ignorati: caratteri non alfabetici presenti nelle parole, ad esempio sillabe o accenti. Questi caratteri vengono ignorati durante il controllo ortografico.

Immagine invertita: un'immagine con caratteri bianchi su sfondo nero.

Legatura: una combinazione di due o più caratteri "attaccati", ad esempio fi, fl, ffi... La separazione di queste combinazioni di caratteri in FineReader Sprint è difficoltosa e la loro elaborazione come un unico carattere composto consente di migliorare la precisione del riconoscimento.

Trattino facoltativo: un trattino (¬) che indica esattamente il punto in cui dividere una parola o una combinazione di parole in fine di riga (la parola "autoestinguente", ad esempio, deve essere divisa in "auto-" e "estinguente"). FineReader Sprint sostituisce tutti i trattini rilevati nelle parole del dizionario con trattini facoltativi.

Layout di pagina: la disposizione di testo, tabelle, immagini, paragrafi e colonne su una pagina. Il tipo, le dimensioni e il colore dei caratteri, lo sfondo e l'orientamento del testo fanno anch'essi parte del layout di pagina.

Analisi del layout di pagina: il processo di rilevamento delle aree in un'immagine della pagina. Le aree possono essere di sei tipi: testo, immagine, tabella, codice a barre, immagine di sfondo e riconoscimento. È possibile eseguire l'analisi del layout di pagina automaticamente facendo clic sul pulsante Leggi o manualmente dall'utente prima del riconoscimento.

Impostazioni di protezione PDF: limitazioni che consentono di impedire l'apertura, la modifica, la copia o la stampa di un documento PDF. Tali impostazioni includono le password per l'apertura del documento, le password di autorizzazione e i livelli di crittografia.

Password di autorizzazione: una password specificata dall'autore che limita le operazioni di stampa e modifica del documento PDF solo agli utenti che la conoscono. Se per il documento sono state impostate delle opzioni di protezione, tali opzioni potranno essere modificate soltanto previa immissione della password.

Area immagine: un'area contenente un'immagine. Questo tipo di area può includere un'illustrazione o qualsiasi altro oggetto che vada visualizzato come immagine (ad esempio una sezione di testo).

Forma primaria: la forma riportata nel "dizionario" di un termine (i lemmi nei dizionari sono di solito riportati nella forma primaria).

Caratteri non consentiti: se determinati caratteri non sono mai presenti nel testo riconosciuto, è possibile specificarli in un set di caratteri non consentiti. Specificando tali caratteri è possibile velocizzare e migliorare la qualità del riconoscimento.

Risoluzione: un parametro di digitalizzazione misurato in punti per pollice (dpi). Si consiglia di utilizzare una risoluzione di 300 dpi per testi con caratteri da 10 punti o più grandi e una risoluzione compresa tra 400 e 600 dpi per testi stampati con caratteri di dimensioni inferiori (9 punti o più piccoli).

Area di riconoscimento: un'area dell'immagine che viene analizzata e letta automaticamente da FineReader Sprint facendo clic sul pulsante Leggi.

Scanner: un dispositivo per l'acquisizione di immagini tramite computer.

Modalità di digitalizzazione: un parametro di digitalizzazione che determina se è necessario acquisire un'immagine in bianco e nero, in scala di grigi o a colori.

Separatori: simboli che separano le parole (es. /, \, -), a loro volta separati con uno spazio dalle parole stesse.

ID assistenza: un identificatore univoco del numero di serie. L'ID assistenza offre ulteriore protezione e viene verificato dal servizio di assistenza tecnica prima di fornire supporto.

Area tabella: un'area immagine contenente dati in formato tabulare. Quando vengono lette aree di questo tipo, vengono tracciati separatori verticali e orizzontali all'interno dell'area in modo da formare una tabella. L'area viene rappresentata in una tabella nel testo di destinazione.

Tagged PDF: un documento PDF contenente informazioni sulla struttura, ad esempio su parti logiche, immagini e tabelle. Tale struttura viene codificata tramite dei tag PDF. Un file PDF contenente tag può essere adattato a varie dimensioni dello schermo e viene visualizzato correttamente sui dispositivi palmari.

Area testo: un'area dell'immagine contenente del testo. Le aree testo contengono unicamente del testo disposto su un'unica colonna.

Caratteri incerti: caratteri che il programma potrebbe non aver riconosciuto correttamente.

Unicode: standard sviluppato dall'Unicode Consortium (Unicode, Inc.) che stabilisce un sistema di codifica internazionale a 16 bit per l'elaborazione di testi scritti. Lo standard determina la codifica dei caratteri e le proprietà e procedure utilizzate nell'elaborazione dei testi scritti in una data lingua.