FineReader Sprint Glossário

A B C D F I L O P R S T U

A

Área ativa é a área selecionada em uma imagem e que pode ser excluída, movida ou modificada. Para tornar a área ativa, clique nela. A moldura em volta da área ativa é destacada e tem pequenos quadrados que podem ser arrasados para alterar a dimensão da área.

Alimentador Automático de Documentos (ADF) é um dispositivo que alimenta documentos para o scanner. Um scanner com um ADF pode digitalizar várias páginas sem intervenção manual. No FineReader Sprint é possível trabalhar com documentos com várias páginas.

ADRT® (Tecnologia Adaptiva de Reconhecimento de Documentos) é uma tecnologia que aprimora a qualidade da conversão de documentos multipáginas. Por exemplo, ela pode reconhecer elementos estruturais, como títulos, cabeçalhos e rodapés, numeração de páginas e assinaturas.

Área é uma seção de uma imagem envolta em uma moldura e que contém determinados tipos de dados. Antes de executar o OCR, o FineReader Sprint detecta áreas de texto, imagem, tabela e código de barras para poder determinar que seções da imagem devem ser reconhecidas, e em que ordem.

Modelo de área é um modelo que contém informações sobre o tamanho e localização das áreas para um conjunto de documentos de aparência similar.

B

Área de imagem de fundo é uma área de imagem que contém uma imagem com texto sobre ela.

Área de código de barras é uma área de imagem que contém um código de barras.

C

Página de código é uma tabela que estabelece a correspondência entre caracteres e seus códigos. Usuários podem selecionar os caracteres que precisam entre os disponíveis em uma página de códigos.

Modo de cor determina se as cores do documento devem ser retidas. Imagens em preto e branco produzem documentos do FineReader menores e mais rápidos de serem processados.

D

Análise de documento é um processo de identificação de elementos de estrutura lógica de um documento e áreas com tipos diferentes de dados. A análise do documento pode ser conduzida automática ou manualmente.

Senha de Abertura de Documento é uma senha que impede que usuários abram um documento PDF, a menos que digitem a senha especificada pelo autor.

Pontos por polegada (dpi) é uma medida de resolução de imagem.

Driver é um programa de software que controla um periférico de computador (ex. scanner, monitor etc).

documento do FineReader é um objeto criado pelo FineReader Sprint para processar um documento de papel. Ele contém imagens de páginas, texto reconhecido (se algum texto for reconhecido), idioma de reconhecimento e configurações de exportação.

Caracteres ignorados são caracteres que não são letras encontrados nas palavras (ex.: caracteres de sílabas ou marcas de entonação). Esses caracteres são ignorados durante a verificação ortográfica.

Imagem invertida é uma imagem com caracteres em branco impressa em um fundo escuro.

L

Ligadura é a combinação de dois ou mais caracteres que são colados juntos (ex. fi, fl, ffi). Tais caracteres são difíceis de serem separados pelo FineReader Sprint. Tratá-los como um caractere conjunto melhora a precisão do OCR.

O

Hífen opcional é um hífen ( ) que indica exatamente onde a palavra ou combinação de palavras deve ser separada caso ela ocorra no final de uma linha (ex. "formatação" deve ser separado como "forma" e "tação"). O FineReader Sprint substitui todos os hifens encontrados nas palavras do dicionário por hifens opcionais.

P

Layout de página é o arranjo de textos, tabelas, imagens, parágrafos e colunas em uma página. As fontes, tamanhos, cores de fontes, fundo e orientação do texto também são parte do layout da página.

Análise de layout de página é um processo de detecção de áreas em uma imagem de página. Áreas podem ser de seis tipos: texto, imagem, tabela, código de barras, imagem de fundo e área de reconhecimento. Clique no botão Ler para fazer a análise automática de layout de página, ou faça a análise manual, antes de executar o OCR.

Configurações de segurança do PDF são restrições que impedem que o documento PDF seja aberto, editado, copiado ou impresso. Essas configurações incluem Senhas de Abertura de Documento, Senhas de Permissão e níveis de criptografia.

Senha de Permissões é uma senha que impede que usuários abram um documento PDF, a menos que digitem a senha definida pelo autor. Se algumas configurações de segurança são selecionadas para o documento, outros usuários não poderão alterar essas configurações, a menos que digitem a senha.

Área de imagem é uma área de imagem que contém uma figura. Este tipo de área pode conter uma imagem real ou qualquer outro objeto que deva ser exibido como uma imagem (ex. seção de texto).

Forma principal é a forma de uma palavra no "dicionário" (vocábulo base do dicionário são geralmente apresentados em suas formas primárias).

Caracteres proibidos se não quiser que determinados caracteres ocorram em um texto a ser reconhecido, você pode incluí-los na lista de caracteres proibidos. Especificar caracteres proibidos aumenta a velocidade e qualidade do OCR.

R

Resolução é um parâmetro de digitalização medido em pontos por polegada (dpi). A resolução de 300 dpi deve ser usada para textos em fontes de 10 pt e superior, enquanto que de 400 a 600 dpi é recomendável para textos com fontes de tamanhos menores (9 pt e inferior).

Área de reconhecimento é uma área de imagem que o FineReader Sprint deve analisar e ler automaticamente quando você clicar no botão Ler.

S

Scanner é um dispositivo para inserção de imagens em um computador.

Modo de digitalização é o parâmetro de digitalização que determina se uma imagem deve ser digitalizada em preto e branco, cinza ou cor.

Separadores são símbolos que podem separar palavras (ex. /, \, — ) e que são separados das próprias palavras por espaços.

ID de Suporte é um identificador exclusivo de um número de série. A ID de suporte fornece proteção adicional e é verificada pela equipe de suporte técnico antes de fornecer o atendimento.

T

Área de tabela é uma área de imagem que contém uma tabela. Quando o aplicativo lê este tipo de área, ele desenha separadores verticais e horizontais dentro da área para formar a tabela. Esta área é então renderizada como uma tabela no texto de saída.

PDF Marcado é um documento PDF que contém informações sobre a estrutura do documento, como suas partes lógicas, imagens e tabelas. A estrutura de um documento é codificada em tags de PDF. Um arquivo PDF com essas tags pode ser redistribuído para se ajustar a diferentes tamanhos de tela e será bem exibido em dispositivos portáteis.

Área de texto é uma área de imagem que contém um texto. Observe que áreas de texto devem conter apenas textos de coluna única.

U

Caracteres indefinidos são caracteres que podem ter sido reconhecidos incorretamente pelo programa.

Unicode é uma norma desenvolvida pelo Unicode Consortium (Unicode, Inc.). A norma é um sistema de codificação internacional de 16 bits para processamento de textos. A norma determina a codificação de caracteres, propriedades e procedimentos usados no processamento de textos escritos em determinados idiomas.