Instalação e uso de scanners

Autor: Laércio Vasconcelos
Dezembro/2003
   

    Há muitos anos os scanners atingiram preços ao alcance dos usuários, e hoje são quase tão comuns quanto as impressoras. Aprenda aqui os fundamentos da sua instalação e utilização. Assim você poderá usar o seu scanner com mais eficiência. 

Copyright (C)
Laércio Vasconcelos Computação

Nenhuma parte deste site pode ser reproduzida sem o consentimento do autor. Apenas usuários individuais estão autorizados a fazer download ou listar as páginas e figuras para estudo e uso próprio e individual, sem fins comerciais.

O scanner e seus acessórios

Quando compramos um scanner, recebemos o seguinte material:

OBS.: Scanners antigos eram ainda acompanhados de uma placa de interface SCSI ou uma interface proprietária.

Figura 1

Um scanner e seus acessórios.

 

 

 

O software mais importante que acompanha o scanner é aquele responsável pela captura de imagens. Capturar ou digitalizar uma imagem con­siste em varrer uma figura ou foto com o scanner, gerando assim um ar­quivo gráfico. Este arquivo pode ser gra­vado nos vários formatos disponí­veis (PCX, TIF, BMP, JPG, etc.), ou então pode ser envi­ado diretamente a um editor gráfico para que a imagem seja processada antes da grava­ção. Dentro do próprio editor gráfico podemos usar um comando de aquisição de imagem, fazendo assim com que o software de captura seja ativado.

Não somos obrigados a usar o editor gráfico que acompanha o scanner. Podemos utilizar qualquer outro que seja de nosso gosto. Contudo, o software para captura é de uso obrigató­rio, já que foi desenvolvido especificamente para o modelo de scanner que acompanha.

Figura 2

Exemplo de software de controle de um scanner.

 

 

 

Atualmente qualquer editor gráfico é capaz de receber dados do scanner insta­lado, graças ao padrão TWAIN. O Windows possui um driver chamado TWAIN source manager, encarregado de fazer a conexão entre programas gráficos e os drivers dos scanners. Todos os programas gráficos modernos são TWAIN compatíveis, assim como ocorre com os scanners. Este padrão faz com que o reconhecimento do scanner pelos programas gráficos seja tão padronizado como é o uso do mouse.

OBS: TWAIN não é abreviatura ou sigla de termo algum. Muitos brincam dizendo que significa “Technology without an interesting name”.

Figura 3

Funcionamento do sistema TWAIN.

 

 

 

A figura 3 mostra o funcionamento do sistema TWAIN. O centro de tudo é o TWAIN source manager, indicado como TWAIN.DLL (no Windows 9x/ME existem dois gerenciadores, o TWAIN.DLL e o TWAIN_32.DLL). Progra­mas Twain compatíveis en­viam comandos ao gerenciador TWAIN de uma forma padronizada, pedindo-lhes que seja enviado o arquivo gráfico capturado pelo scanner. A maioria dos editores gráficos modernos possui um co­mando Scan (ou Acquire, ou ainda Capture), obedecendo ao sistema TWAIN. O gerenciador TWAIN, por sua vez, envia comandos padronizados ao driver do dispositivo de entrada apropriado. Não é comum, mas um compu­tador pode ter diversos dispositivos de entrada TWAIN (TWAIN sources), como por exemplo, um scanner e uma câmera digital – como é exemplificado na figura 3. Cada dispositivo de entrada de imagem deve ter o seu próprio TWAIN driver, que é fornecido pelo seu fabricante.

Figura 4

Comandos relativos aos scanners e outros dispositivos de imagem que são adicionados aos menus dos programas gráficos.

 

 

 

O OCR (Optical Character Recognition, ou Reconhecimento Ótico de Ca­racte­res) é mais uma das interessantes aplicações dos scanners. Progra­mas de OCR são capa­zes de receber de um scanner, um texto capturado a partir de um documento qualquer (o scanner trata este texto como um gráfico), e reconhece os caracteres exis­tentes nesse texto, re­constituindo o texto original. Assim podemos copiar um texto do papel para o computador, sem ter que digitá-lo. O reconhecimento ótico de caracteres envolve diversas técnicas especiais de processamento de imagem, mas mesmo assim não possibilita uma precisão de 100%, ou seja, alguns caracteres não chegam a ser reconheci­dos, e o usuário deve retocá-los manualmente.

Os programas para OCR também obedecem ao sistema TWAIN, o que faz com que possam utilizar qualquer modelo de scanner que também siga este padrão. Da mesma forma, se você comprou um scanner e não gostou do programa OCR que o acompanha, pode adquirir separadamente um OCR de seu agrado.

Scanner de interface paralela

A instalação deste tipo de scanner é muito simples. Como o scanner está ligado na porta paralela, praticamente não existe mais nada a definir, em termos de hardware. Bastará indicar o drive e diretório onde será feita a instalação, e escolher quais são os softwares a serem instalados: driver Twain, Editor gráfico e OCR.

Figura 5

Conexão de um scanner na porta paralela.

 

 

 

A figura 5 mostra os passos envolvidos na instalação de um scanner paralelo:

1) Desconectar a impressora da porta paralela

2) Ligar o cabo da impressora no conector do scanner com a indicação Printer

3) Conectar o cabo do scanner no seu conector indicado como Computer

4) Ligar o cabo do scanner na porta paralela do computador

5) Ligar o adaptador AC no scanner (no caso de modelos que não têm fonte interna)

6) Ligar o adaptador AC na rede elétrica (ou o cabo de força do scanner)

Antes de instalar o software que acompanha o scanner, devemos checar se a porta paralela está corretamente configurada e sem conflitos, através do Gerenciador de Dis­positivos (figura 6). Nesta ocasião podemos também testar se a impressora está fun­cionando corretamente. A porta paralela deverá estar configurada como ECP.

Figura 6

A porta paralela está corretamente configurada.

 

 

 

 

O scanner será reconhecido automaticamente pelo Windows, passando à etapa de instalação de drivers, assim como ocorre com outros dispositivos Plug and Play. A instalação do software que acompanha o scanner é si­milar à instalação da maioria dos softwares. Será perguntada a linguagem, o diretório da instalação, o nome do usuário e da empresa. Eventualmente pode ser também pergun­tado o tipo de instalação (Normal, mínima ou personalizada). A figura 7 mostra as opções de uma instalação personalizada. Além dos drivers, podemos instalar também um editor gráfico (no exemplo, o Photo Magic 4.0), um programa de OCR (Type Reader) e um manual do usuário. Terminada a instalação devemos reiniciar o computa­dor.

Figura 7

Escolhendo os softwares a serem instalados.

 

 

 

Scanner USB

A figura 8 mostra as típicas conexões de um scanner USB.

1) Ligar o adaptador AC no scanner

2) Ligar o adaptador AC na rede elétrica

3) Conectar o cabo USB no scanner

4) Conectar o cabo USB no computador

5) O cabo USB também pode ser conectado em um hub USB

Figura 8

Conexões típicas de um scanner USB.

 

 

 

O Scanner será detectado pelo Windows, já que todos os dispositivos USB são Plug and Play. Entrará em ação o assistente para adicionar novo hardware. No caso do Windows XP, antes desse assistente será mostrado um quadro para que possamos escolher entre procurar drivers na Internet ou em um disco rígido/disquete/CD-ROM. No nosso exemplo optamos por este segundo método.

Figura 9

O assistente vai instalar os drivers do scanner.

 

 

 

As diversas versões do Windows são acompanhados de drivers para vários scanners. O processo de instalação é similar ao de outros tipos de hardware, bastando seguir as instruções do assistente. Terminada a instalação dos drivers, o scanner aparecerá no Gerenciador de Dispositivos, na seção “Dispositivos de imagem”.

Figura 10

O scanner aparece na seção “Dispositivos de imagem” no Gerenciador de Dispositivos.

 

 

 

Assim como ocorre com outros produtos, alguns modelos podem ser acompanhados de programas de instalação, como o mostrado na figura 11. Devemos inicialmente instalar os drivers, e depois editores gráficos e programas de OCR.

Figura 11

Exemplo de programa de instalação fornecido pelo fabricante do scanner.

 

 

 

Usando um scanner de mesa

Também chamados scanners de página, esses modelos têm a capacidade de capturar de uma só vez, imagens em formatos maiores, como A4, carta e ofício. O uso dos softwares que acompanham esses scanners é bastante simples. Através de um editor gráfico qualquer, usamos o comando File / Scan, File / Acquire ou similar. Entrará em ação o Twain Data Source. Quando um PC possui mais de um dispositivo Twain compatível instalado (ex: scanner e câmera digital), é preciso antes usar o comando File / Select Source para indicar qual deles irá gerar a imagem.

Os scanners de mesa possuem uma função chamada Prescan (pré-escanear) ou Preview. Com ela, é feita uma captura de rascunho em baixa resolução, e muitas vezes sem usar cores, da extensão completa da imagem. A partir desta imagem, podemos marcar um retângulo que delimita o trecho desejado. Na figura 12 colocamos no scanner a página de uma revista e fizemos o selecionamento da sua ilustração a ser cap­turada.

Figura 12

Usando a função pré-escanear e dimensionando a área desejada.

 

 

 

Neste programa sempre encontrarmos, não importa qual seja o modelo do scanner, um comando para definir características da imagem. No nosso exemplo, este comando é obtido pelo botão Painel. Será apresentado o quadro da figura 13, no qual podemos selecionar o modo de cores (preto e branco, escala de cinzas ou RGB), a reso­lução ótica, a escala (100% resulta no tamanho normal, valores maiores ativam a resolu­ção interpolada), e ainda controles para ajuste de brilho, contraste e formação de negati­vos.

Figura 13

Selecionando o modo de captura.

 

 

 

Depois de delimitar a área e definir os parâmetros de captura, usamos o botão Scan (escanear). A imagem será capturada e transferida para o editor gráfico.

Figura 14

Outro programa de controle de scanner.

 

 

 

A figura 14 mostra o programa de controle de um outro modelo de scanner, o Genius ColorPage Vivid 4. Existem comandos similares aos encontrados nos programas de controle de outros scanners. Podemos escolher a resolução, o modo gráfico (line art, escala de cinzas ou color), ajustar brilho e contraste, além de várias outras funções. Os três controles na parte inferior da janela são para fechar, pré-escanear e escanear. Terminada a captura da imagem, o resultado será entregue como um arquivo aberto no editor gráfico que solicitou a captura.

Figura 15

Figura capturada do scanner, já aberta no editor gráfico que a solicitou (Imaging do Windows ME).

 

 

 

Este scanner permite escolher entre cores de 24, 36 ou 48 bits. Se nossa intenção é simplesmente obter a figura para exibir na tela ou imprimir, é mais indicado usar 24 bits. Se a figura for posteriormente tratada por editores profissionais de fotos, podemos fazer a captura com 36 ou 48 bits. Note entretanto que apenas alguns programas de edição profissional de fotos podem manipular esses bits adicionais. A maioria dos programas opera com cores de apenas 24 bits. Na figura 16 vemos o selecionamento de modo gráfico no programa Adobe Photoshop. Usamos Image/Mode, e podemos escolher entre diversas opções. Quanto ao número de bits, as opções são duas: 8 bits por canal (resultaria em um arquivo RGB de 24 bits) ou 16 bits por canal (resultaria em um arquivo RGB de 48 bits). Note que os scanners e os monitores trabalham no modo RGB, mas ao operarmos com editores profissionais, podemos usar o modo CMYK, que usa 4 canais. Desta forma os 24 ou 48 bits originados do scanner seriam transformados em 32 ou 64 bits pelo programa ao usar o modo CMYK.

Figura 16

Selecionando o número de bits por canal no Adobe Photoshop.

 

 

 

Usando programas de OCR

Todos os scanners são acompanhados de programas de OCR, mas nem sempre esses programas reconhecem os caracteres acentuados do idioma português – principalmente os modelos importados de forma extra-oficial. A maioria dos scanners entretanto possui um comando para a escolha do idioma, como o ABBYY FineReader, que acompanha atualmente os scanners da Genius (figura 17).

Figura 17

Escolha do idioma.

 

 

 

É possível que você consiga comprar um excelente scanner por um bom preço, mas acompanhado de um programa inadequado para nosso idioma. É possível também que encontre scanners não tão bons, mas com um bom programa de OCR para português. Se você não estiver satisfeito com o seu OCR, pode adquirir outro em sepa­rado, já que todos eles são compatíveis com qualquer modelo de scanner, graças ao pa­drão Twain.

Muitos programas de OCR possuem um comando Scan que dá acesso ao Twain Data Source. Observe que em geral os programas para OCR recomendam usar o modo Line Art (preto e branco) e a resolução de 300 dpi. Consulte o manual do seu programa para checar qual é a resolução mais indicada.

Alguns programas para OCR operam de forma diferente. O Type Reader, por exemplo, possui um comando Twain / Acquire, que faz automaticamente a captura de toda a extensão da página localizada no scanner, usando a resolução padrão, que no seu caso é 300 dpi. O documento será inicialmente capturado como uma imagem, como vemos na figura 18. É preciso verificar se na imagem capturada, o texto está legível, e se não está posicionado de forma inclinada. Muitas vezes as partes brancas da figura fi­cam cheias de manchas pretas, como em uma fotocópia de má qualidade. Devemos ajustar o brilho e o contraste até obter uma boa imagem. Este ajuste pode ser feito pelo programa OCR ou pelo Twain Data Source.

Figura 18

Página capturada pelo OCR na forma de imagem.

 

 

 

O comando View / Zoom permite ampliar a imagem capturada, e desta forma podemos checar sua qualidade, como vemos na figura 19. Quanto melhor a quali­dade da imagem, mais facilidade o programa de OCR terá para fazer a conversão para texto.

Figura 19

Checando a qualidade da imagem capturada.

 

 

 

Depois de capturada a imagem, usamos no Type Reader os comandos Locate (para delimitar as colunas de texto) e Recognize (para converter em texto). Note que quando um OCR não reconhece o idioma português, ou quando não está configurado para o português, os caracteres acentuados não serão reconhecidos. No caso do Type Reader, basta usar o comando Language / Portuguese, habilitando assim o reconheci­mento dos caracteres acentuados de nossa língua. A figura 20 mostra um trecho reco­nhecido, primeiro sem a configuração para o português (esquerda), depois com o idioma português habilitado (direita).

Figura 20

Texto reconhecido, sem idioma português e com idioma português.

 

 

 

Depois de ter o texto reconhecido, usamos o comando File Save. Podemos assim salvar um arquivo de formato TXT contendo o texto capturado (no caso do Type Reader, é preciso gravar no formato DOC, do Microsoft Word, para que os acentos se­jam preservados). Agora podemos abri-lo com um editor de textos e fazer sua formata­ção e checagem gramatical. Os programas para OCR não são 100% eficientes, e sempre será necessário fazer correção ortográfica e reformatar o texto. O trabalho do OCR não é perfeito, mas é muito melhor que ter o trabalho de digitar todo o texto.

Figura 21

Comandando a leitura de um documento para reconhecer seu texto, com o programa que acompanha os scanners Genius.

 

 

 

A figura 21 mostra um outro programa de OCR, o ABBYY FineReader Sprint, que acompanha os scanners da Genius. Existem três botões indicados com 1, 2 e 3 que devem ser usados para fazer o trabalho completo. O primeiro deles comanda a captura da imagem. Isto provocará a execução do programa de captura (figura 22).

Figura 22

O programa de OCR chama o programa de captura.

 

 

 

A imagem é recebida pelo programa de OCR, e o resultado é apresentado para o usuário (figura 23). Neste momento a imagem recebida ainda é um arquivo gráfico. Usamos agora o botão 2–Reconhecer, para fazer o reconhecimento dos caracteres.


Figura 23 - A imagem já foi recebida pelo programa de OCR, ainda em forma de arquivo gráfico.

O programa passará a apresentar os seus resultados, já na forma de texto (figura 24). Note que nem sempre as formatações do documento original são mantidas, como figuras e divisão de colunas. Em geral é preciso fazer retoques posteriores.


Figura 24 - O documento já convertido na forma de texto. 

Finalmente usamos o botão 3-Salvar. Este programa pode salvar o resultado em um arquivo TXT (toda a formatação será perdida, serão gravados apenas os caracteres) ou RTF, que preserva cores, tipos e figuras. Terminado o trabalho, usamos um editor de textos como o Microsoft Word (figura 25) para fazer correção ortográfica e diagramação. Muitos programas de OCR permitem a passagem dos seus resultados para o Word e outros editores com os comandos Editar/Copiar e Editar/Colar.


Figura 25 - O documento final, já aberto pelo Word.