|
Instalação e uso de scanners Autor: Laércio Vasconcelos |
|
Copyright (C) |
Quando compramos um scanner, recebemos o seguinte material:
Scanner
Cabo de conexão com o PC
Software para captura de imagens
Adaptador AC
Software para edição de imagens
Software para OCR (reconhecimento ótico de caracteres)
Manuais diversos
OBS.:
Scanners antigos eram ainda acompanhados de uma placa de interface SCSI ou uma
interface proprietária.
|
|
Figura
1 Um
scanner e seus acessórios. |
O software mais importante que acompanha o scanner é aquele responsável pela captura de imagens. Capturar ou digitalizar uma imagem consiste em varrer uma figura ou foto com o scanner, gerando assim um arquivo gráfico. Este arquivo pode ser gravado nos vários formatos disponíveis (PCX, TIF, BMP, JPG, etc.), ou então pode ser enviado diretamente a um editor gráfico para que a imagem seja processada antes da gravação. Dentro do próprio editor gráfico podemos usar um comando de aquisição de imagem, fazendo assim com que o software de captura seja ativado.
Não somos obrigados a usar o editor gráfico que acompanha o scanner. Podemos utilizar qualquer outro que seja de nosso gosto. Contudo, o software para captura é de uso obrigatório, já que foi desenvolvido especificamente para o modelo de scanner que acompanha.
|
|
Figura
2 Exemplo
de software de controle de um scanner. |
Atualmente qualquer editor gráfico é capaz de receber dados do scanner instalado, graças ao padrão TWAIN. O Windows possui um driver chamado TWAIN source manager, encarregado de fazer a conexão entre programas gráficos e os drivers dos scanners. Todos os programas gráficos modernos são TWAIN compatíveis, assim como ocorre com os scanners. Este padrão faz com que o reconhecimento do scanner pelos programas gráficos seja tão padronizado como é o uso do mouse.
OBS:
TWAIN não é abreviatura ou sigla de termo algum. Muitos brincam dizendo que
significa “Technology without an interesting name”.
|
|
Figura
3 Funcionamento
do sistema TWAIN. |
A figura 3 mostra o funcionamento do sistema TWAIN. O centro de tudo é o TWAIN source manager, indicado como TWAIN.DLL (no Windows 9x/ME existem dois gerenciadores, o TWAIN.DLL e o TWAIN_32.DLL). Programas Twain compatíveis enviam comandos ao gerenciador TWAIN de uma forma padronizada, pedindo-lhes que seja enviado o arquivo gráfico capturado pelo scanner. A maioria dos editores gráficos modernos possui um comando Scan (ou Acquire, ou ainda Capture), obedecendo ao sistema TWAIN. O gerenciador TWAIN, por sua vez, envia comandos padronizados ao driver do dispositivo de entrada apropriado. Não é comum, mas um computador pode ter diversos dispositivos de entrada TWAIN (TWAIN sources), como por exemplo, um scanner e uma câmera digital – como é exemplificado na figura 3. Cada dispositivo de entrada de imagem deve ter o seu próprio TWAIN driver, que é fornecido pelo seu fabricante.
|
|
Figura
4 Comandos
relativos aos scanners e outros dispositivos de imagem que são
adicionados aos menus dos programas gráficos. |
O OCR (Optical Character Recognition, ou Reconhecimento Ótico de Caracteres) é mais uma das interessantes aplicações dos scanners. Programas de OCR são capazes de receber de um scanner, um texto capturado a partir de um documento qualquer (o scanner trata este texto como um gráfico), e reconhece os caracteres existentes nesse texto, reconstituindo o texto original. Assim podemos copiar um texto do papel para o computador, sem ter que digitá-lo. O reconhecimento ótico de caracteres envolve diversas técnicas especiais de processamento de imagem, mas mesmo assim não possibilita uma precisão de 100%, ou seja, alguns caracteres não chegam a ser reconhecidos, e o usuário deve retocá-los manualmente.
Os programas para OCR também obedecem ao sistema TWAIN, o que faz com que possam utilizar qualquer modelo de scanner que também siga este padrão. Da mesma forma, se você comprou um scanner e não gostou do programa OCR que o acompanha, pode adquirir separadamente um OCR de seu agrado.
A instalação deste tipo de scanner é muito simples. Como o scanner está ligado na porta paralela, praticamente não existe mais nada a definir, em termos de hardware. Bastará indicar o drive e diretório onde será feita a instalação, e escolher quais são os softwares a serem instalados: driver Twain, Editor gráfico e OCR.
|
|
Figura
5 Conexão
de um scanner na porta paralela. |
A figura 5 mostra os passos envolvidos na instalação de um scanner paralelo:
1) Desconectar a impressora
da porta paralela
2) Ligar o cabo da impressora
no conector do scanner com a indicação Printer
3) Conectar o cabo do scanner
no seu conector indicado como Computer
4) Ligar o cabo do scanner na
porta paralela do computador
5) Ligar o adaptador AC no
scanner (no caso de modelos que não têm fonte interna)
6) Ligar o adaptador AC na
rede elétrica (ou o cabo de força do scanner)
Antes de instalar o software que acompanha o scanner, devemos checar se a porta paralela está corretamente configurada e sem conflitos, através do Gerenciador de Dispositivos (figura 6). Nesta ocasião podemos também testar se a impressora está funcionando corretamente. A porta paralela deverá estar configurada como ECP.
|
|
Figura
6 A
porta paralela está corretamente configurada. |
O scanner será reconhecido automaticamente pelo Windows, passando à etapa de instalação de drivers, assim como ocorre com outros dispositivos Plug and Play. A instalação do software que acompanha o scanner é similar à instalação da maioria dos softwares. Será perguntada a linguagem, o diretório da instalação, o nome do usuário e da empresa. Eventualmente pode ser também perguntado o tipo de instalação (Normal, mínima ou personalizada). A figura 7 mostra as opções de uma instalação personalizada. Além dos drivers, podemos instalar também um editor gráfico (no exemplo, o Photo Magic 4.0), um programa de OCR (Type Reader) e um manual do usuário. Terminada a instalação devemos reiniciar o computador.
|
|
Figura
7 Escolhendo
os softwares a serem instalados. |
A figura 8 mostra as típicas conexões de um scanner USB.
1) Ligar o adaptador AC no
scanner
2) Ligar o adaptador AC na
rede elétrica
3) Conectar o cabo USB no
scanner
4) Conectar o cabo USB no
computador
5) O cabo USB também pode
ser conectado em um hub USB
|
|
Figura
8 Conexões
típicas de um scanner USB. |
O Scanner será detectado pelo Windows, já que todos os dispositivos USB são Plug and Play. Entrará em ação o assistente para adicionar novo hardware. No caso do Windows XP, antes desse assistente será mostrado um quadro para que possamos escolher entre procurar drivers na Internet ou em um disco rígido/disquete/CD-ROM. No nosso exemplo optamos por este segundo método.
|
|
Figura
9 O
assistente vai instalar os drivers do scanner. |
As diversas versões do Windows são acompanhados de drivers para vários scanners. O processo de instalação é similar ao de outros tipos de hardware, bastando seguir as instruções do assistente. Terminada a instalação dos drivers, o scanner aparecerá no Gerenciador de Dispositivos, na seção “Dispositivos de imagem”.
|
|
Figura
10 O
scanner aparece na seção “Dispositivos de imagem” no Gerenciador de
Dispositivos. |
Assim como ocorre com outros produtos, alguns modelos podem ser acompanhados de programas de instalação, como o mostrado na figura 11. Devemos inicialmente instalar os drivers, e depois editores gráficos e programas de OCR.
|
|
Figura
11 Exemplo
de programa de instalação fornecido pelo fabricante do scanner. |
Também chamados scanners de página, esses modelos têm a capacidade de capturar de uma só vez, imagens em formatos maiores, como A4, carta e ofício. O uso dos softwares que acompanham esses scanners é bastante simples. Através de um editor gráfico qualquer, usamos o comando File / Scan, File / Acquire ou similar. Entrará em ação o Twain Data Source. Quando um PC possui mais de um dispositivo Twain compatível instalado (ex: scanner e câmera digital), é preciso antes usar o comando File / Select Source para indicar qual deles irá gerar a imagem.
Os scanners de mesa possuem uma função chamada Prescan (pré-escanear) ou Preview. Com ela, é feita uma captura de rascunho em baixa resolução, e muitas vezes sem usar cores, da extensão completa da imagem. A partir desta imagem, podemos marcar um retângulo que delimita o trecho desejado. Na figura 12 colocamos no scanner a página de uma revista e fizemos o selecionamento da sua ilustração a ser capturada.
|
|
Figura
12 Usando
a função pré-escanear e dimensionando a área desejada. |
Neste programa sempre encontrarmos, não importa qual seja o modelo do scanner, um comando para definir características da imagem. No nosso exemplo, este comando é obtido pelo botão Painel. Será apresentado o quadro da figura 13, no qual podemos selecionar o modo de cores (preto e branco, escala de cinzas ou RGB), a resolução ótica, a escala (100% resulta no tamanho normal, valores maiores ativam a resolução interpolada), e ainda controles para ajuste de brilho, contraste e formação de negativos.
|
|
Figura
13 Selecionando
o modo de captura. |
Depois de delimitar a área e definir os parâmetros de captura, usamos o botão Scan (escanear). A imagem será capturada e transferida para o editor gráfico.
|
|
Figura
14 Outro
programa de controle de scanner. |
A figura 14 mostra o programa de controle de um outro modelo de scanner, o Genius ColorPage Vivid 4. Existem comandos similares aos encontrados nos programas de controle de outros scanners. Podemos escolher a resolução, o modo gráfico (line art, escala de cinzas ou color), ajustar brilho e contraste, além de várias outras funções. Os três controles na parte inferior da janela são para fechar, pré-escanear e escanear. Terminada a captura da imagem, o resultado será entregue como um arquivo aberto no editor gráfico que solicitou a captura.
|
|
Figura
15 Figura
capturada do scanner, já aberta no editor gráfico que a solicitou
(Imaging do Windows ME). |
Este scanner permite escolher entre cores de 24, 36 ou 48 bits. Se nossa intenção é simplesmente obter a figura para exibir na tela ou imprimir, é mais indicado usar 24 bits. Se a figura for posteriormente tratada por editores profissionais de fotos, podemos fazer a captura com 36 ou 48 bits. Note entretanto que apenas alguns programas de edição profissional de fotos podem manipular esses bits adicionais. A maioria dos programas opera com cores de apenas 24 bits. Na figura 16 vemos o selecionamento de modo gráfico no programa Adobe Photoshop. Usamos Image/Mode, e podemos escolher entre diversas opções. Quanto ao número de bits, as opções são duas: 8 bits por canal (resultaria em um arquivo RGB de 24 bits) ou 16 bits por canal (resultaria em um arquivo RGB de 48 bits). Note que os scanners e os monitores trabalham no modo RGB, mas ao operarmos com editores profissionais, podemos usar o modo CMYK, que usa 4 canais. Desta forma os 24 ou 48 bits originados do scanner seriam transformados em 32 ou 64 bits pelo programa ao usar o modo CMYK.
|
|
Figura
16 Selecionando
o número de bits por canal no Adobe Photoshop. |
Todos os scanners são acompanhados de programas de OCR, mas nem sempre esses programas reconhecem os caracteres acentuados do idioma português – principalmente os modelos importados de forma extra-oficial. A maioria dos scanners entretanto possui um comando para a escolha do idioma, como o ABBYY FineReader, que acompanha atualmente os scanners da Genius (figura 17).
|
|
Figura
17 Escolha
do idioma. |
É possível que você consiga comprar um excelente scanner por um bom preço, mas acompanhado de um programa inadequado para nosso idioma. É possível também que encontre scanners não tão bons, mas com um bom programa de OCR para português. Se você não estiver satisfeito com o seu OCR, pode adquirir outro em separado, já que todos eles são compatíveis com qualquer modelo de scanner, graças ao padrão Twain.
Muitos programas de OCR possuem um comando Scan que dá acesso ao Twain Data Source. Observe que em geral os programas para OCR recomendam usar o modo Line Art (preto e branco) e a resolução de 300 dpi. Consulte o manual do seu programa para checar qual é a resolução mais indicada.
Alguns programas para OCR operam de forma diferente. O Type Reader, por exemplo, possui um comando Twain / Acquire, que faz automaticamente a captura de toda a extensão da página localizada no scanner, usando a resolução padrão, que no seu caso é 300 dpi. O documento será inicialmente capturado como uma imagem, como vemos na figura 18. É preciso verificar se na imagem capturada, o texto está legível, e se não está posicionado de forma inclinada. Muitas vezes as partes brancas da figura ficam cheias de manchas pretas, como em uma fotocópia de má qualidade. Devemos ajustar o brilho e o contraste até obter uma boa imagem. Este ajuste pode ser feito pelo programa OCR ou pelo Twain Data Source.
|
|
Figura
18 Página
capturada pelo OCR na forma de imagem. |
O comando View / Zoom permite ampliar a imagem capturada, e desta forma podemos checar sua qualidade, como vemos na figura 19. Quanto melhor a qualidade da imagem, mais facilidade o programa de OCR terá para fazer a conversão para texto.
|
|
Figura
19 Checando
a qualidade da imagem capturada. |
Depois de capturada a imagem, usamos no Type Reader os comandos Locate (para delimitar as colunas de texto) e Recognize (para converter em texto). Note que quando um OCR não reconhece o idioma português, ou quando não está configurado para o português, os caracteres acentuados não serão reconhecidos. No caso do Type Reader, basta usar o comando Language / Portuguese, habilitando assim o reconhecimento dos caracteres acentuados de nossa língua. A figura 20 mostra um trecho reconhecido, primeiro sem a configuração para o português (esquerda), depois com o idioma português habilitado (direita).
|
|
Figura
20 Texto
reconhecido, sem idioma português e com idioma português. |
Depois de ter o texto reconhecido, usamos o comando File Save. Podemos assim salvar um arquivo de formato TXT contendo o texto capturado (no caso do Type Reader, é preciso gravar no formato DOC, do Microsoft Word, para que os acentos sejam preservados). Agora podemos abri-lo com um editor de textos e fazer sua formatação e checagem gramatical. Os programas para OCR não são 100% eficientes, e sempre será necessário fazer correção ortográfica e reformatar o texto. O trabalho do OCR não é perfeito, mas é muito melhor que ter o trabalho de digitar todo o texto.
|
|
Figura
21 Comandando
a leitura de um documento para reconhecer seu texto, com o programa que
acompanha os scanners Genius. |
A figura 21 mostra um outro programa de OCR, o ABBYY FineReader Sprint, que acompanha os scanners da Genius. Existem três botões indicados com 1, 2 e 3 que devem ser usados para fazer o trabalho completo. O primeiro deles comanda a captura da imagem. Isto provocará a execução do programa de captura (figura 22).
|
|
Figura
22 O
programa de OCR chama o programa de captura. |
A imagem é recebida pelo programa de OCR, e o resultado é apresentado para o usuário (figura 23). Neste momento a imagem recebida ainda é um arquivo gráfico. Usamos agora o botão 2–Reconhecer, para fazer o reconhecimento dos caracteres.
Figura
23 - A
imagem já foi recebida pelo programa de OCR, ainda em forma de arquivo gráfico.
O programa passará a apresentar os seus resultados, já na forma de texto (figura 24). Note que nem sempre as formatações do documento original são mantidas, como figuras e divisão de colunas. Em geral é preciso fazer retoques posteriores.
Figura
24 - O
documento já convertido na forma de texto.
Finalmente usamos o botão 3-Salvar. Este programa pode salvar o resultado em um arquivo TXT (toda a formatação será perdida, serão gravados apenas os caracteres) ou RTF, que preserva cores, tipos e figuras. Terminado o trabalho, usamos um editor de textos como o Microsoft Word (figura 25) para fazer correção ortográfica e diagramação. Muitos programas de OCR permitem a passagem dos seus resultados para o Word e outros editores com os comandos Editar/Copiar e Editar/Colar.
Figura
25 - O
documento final, já aberto pelo Word.