FineReader Sprint Glossaire

A B C D F L O P R S T U

A

Une zone active est une zone sélectionnée sur une image et qui peut être supprimée, déplacée ou modifiée. Pour qu'une zone devienne active, il faut cliquer dessus. Le cadre entourant une zone active est affiché en gras et comporte de petits carrés qui peuvent être étirés pour modifier la taille de la zone.

Le chargeur automatique de documents (ADF) est un dispositif de scanner permettant d'y charger automatiquement des documents. Un scanner muni d'un ADF peut numériser plusieurs pages sans intervention manuelle. FineReader Sprint prend en charge les documents comprenant plusieurs pages.

L'ADRT® (Adaptive Document Recognition Technology), technologie adaptative de reconnaissance de documents, est une technologue qui augmente la qualité de la conversion des documents de plusieurs pages. Par exemple, elle permet de reconnaître des éléments de structure tels que les titres, les en-têtes et pieds de page, les notes de bas de page, les numéros de page et les signatures.

Une Zone est une section d'image entourée d'un cadre et contenant un certain type de données. Avant de procéder à la reconnaissance optique des caractères, FineReader Sprint détecte les zones de texte, de tableau et de code-barres afin de déterminer les sections de l'image qui devraient être reconnues et dans quel ordre.

Modèle de zone Modèle qui comporte des informations relatives à la taille et à l'emplacement de zones dans un ensemble de documents similaires.

B

Une zone d'image d'arrière-plan est une zone d'image comportant une photo avec du texte imprimé dessus.

Un Code-barres est une zone d'image contenant un code-barres.

C

Une Page de code est un tableau qui établit les correspondances entre les caractères et leurs codes. Les utilisateurs peuvent sélectionner les caractères dont ils ont besoin parmi les caractères disponibles dans une page de code.

Le Mode Couleur détermine si les couleurs du document doivent être conservées. Les images en noir et blanc génèrent des documents FineReader de taille réduite et sont plus rapides à traiter.

D

Une Analyse de document est un processus d'identification de la structure logique d'un document ainsi que des zones contenant les divers types de données. L'analyse de document peut être effectuée automatiquement ou manuellement.

Le Mot de passe d'ouverture de document est une option qui empêche les utilisateurs d'ouvrir des documents PDF à moins qu'ils ne saisissent le mot de passe spécifié par l'auteur.

Les Points par pouce (ppp) sont une mesure de résolution d'image.

Un pilote est un programme qui contrôle un périphérique d'ordinateur (par exemple un scanner, un écran, etc.).

F

Un Document FineReader est un objet créé par FineReader Sprint pour traiter un document papier. Il contient des images de page, le texte reconnu (si le texte a été reconnu), la langue de reconnaissance et les paramètres d'exportation.

Les Caractères ignorés représentent tout caractère non alphabétique trouvé dans des mots (par ex. : caractères syllabiques ou accents). Ces caractères sont ignorés pendant la vérification de l'orthographe.

Une Image inversée est une image dont les caractères blancs sont imprimés sur fond noir.

L

Une Ligature est une combinaison de deux caractères collés ou plus (par ex. : fi, fl, ffi). Il est difficile de séparer ce genre de caractères pour FineReader Sprint. Les traiter en tant que caractères composés améliore la précision de l'OCR.

O

Le Tiret facultatif est un tiret (¬) indiquant l'endroit exact où un mot ou un groupe de mots doit être coupé s'il se trouve en fin de ligne (par ex. : « autoformater » doit être scindé en « auto et formater »).ABBYY FineReader Sprint remplace tous les tirets trouvés dans les mots du dictionnaire par des tirets facultatifs.

P

La Mise en page est la présentation des textes, tableaux, images, paragraphes et colonnes d'une page. Les polices, les tailles de police, les couleurs de police, l'arrière-plan du texte et l'orientation du texte font également partie de la mise en page.

L'Analyse de la mise en page est le processus permettant de détecter les zones sur l'image d'une page. Il existe six types de zone : zone de texte, d'image, de tableau, de code-barres, d'image d'arrière-plan et de reconnaissance. L'analyse de la mise en page peut être effectuée automatiquement en cliquant sur le bouton Lire, ou l'utilisateur peut l'exécuter manuellement avant la reconnaissance optique de caractères.

Les Paramètres de sécurité PDF sont des restrictions pouvant empêcher l'ouverture, la modification, la copie ou l'impression d'un document PDF. Ces paramètres incluent le mot de passe d'ouverture de document, le mot de passe des autorisations et les niveaux de codage.

Un Mot de passe d'autorisation est un mot de passe qui empêche les autres utilisateurs d'imprimer et/ou de modifier un document PDF sauf s'ils saisissent le mot de passe spécifié par l'auteur. Si certains paramètres de sécurité sont sélectionnés pour le document, les autres utilisateurs ne seront pas en mesure de les modifier tant qu'ils ne saisiront pas le mot de passe.

Une Zone d'image est une zone contenant une image. Une zone de ce type peut contenir une image ou tout autre objet (par exemple une partie de texte) à afficher sous forme d'image.

Une Forme de base est la forme « dictionnaire » d'un mot (les premiers mots des entrées de dictionnaire sont généralement fournis dans leurs formes de base).

Caractères interdits Si certains caractères n'apparaissent jamais dans un texte à reconnaître, c'est qu'ils font peut-être partie de la liste des caractères interdits. Spécifier les caractères interdits augmente la vitesse et la qualité de la reconnaissance optique de caractères.

R

La Résolution est un paramètre de numérisation mesuré en points par pouce (ppp). Une résolution de 300 ppp convient pour les textes imprimés dans des polices de corps de 10 pt ou plus, une résolution de 400 à 600 ppp est préférable pour les textes imprimés dans des polices de plus petite taille (9 pt ou moins).

La Zone de reconnaissance est une zone d'image que FineReader Sprint doit analyser et lire automatiquement lorsque vous cliquez sur le bouton Lire.

S

Le Scanner est un périphérique permettant d'acquérir des images sur un ordinateur.

Le Mode de numérisation est un paramètre de numérisation qui détermine si une image doit être numérisée en noir et blanc, en niveaux de gris ou en couleur.

Les Séparateurs sont des symboles pouvant séparer des mots (p. ex. /, \, —) ; ils sont séparés des mots en eux-mêmes par des espaces.

L'ID d'assistance est un identificateur unique de numéro de série. L'ID d'assistance offre une protection supplémentaire ; il est vérifié par le service d'assistance technique avant de fournir l'assistance.

T

Une Zone de tableau est une zone d'image contenant des données sous forme de tableau. Lorsque l'application lit ce type de zone, elle trace des séparateurs verticaux et horizontaux dans la zone pour former un tableau. Cette zone est représentée sous forme de tableau dans le texte obtenu.

Un PDF balisé est un document PDF contenant des informations relatives à la structure du document, telles que ses parties logiques, images et tableaux. La structure est encodée sous forme de « balises PDF ». Un fichier PDF contenant des balises PDF peut être réorganisé afin de s'adapter aux différentes tailles d'écran et de s'afficher correctement sur les ordinateurs portables.

Une Zone de texte est une zone d'image contenant du texte. Notez que les zones de texte ne doivent contenir qu'une seule colonne de texte.

U

Les Caractères incertains sont des caractères qui ont peut-être été reconnus de façon incorrecte.

Unicode est une norme développée par Unicode Consortium (Unicode, Inc.). La norme est un système d'encodage international 16 bits pour le traitement de texte. Cette norme détermine l'encodage des caractères ainsi que les propriétés et les procédures utilisées dans le traitement des textes écrits dans une langue donnée.