Os PDFs quando nascem não são todos iguais

Uma das questões mais frequentes quando se trata de leitores de livros electrónicos tem a ver com os PDFs. Podem ser lidos? Com que qualidade, pode fazer-se zoom sobre os documentos, etc.

Há muitos ângulos de abordagem desta questão, mas neste caso vou centrar-me, naturalmente na leitura de PDFs no Kindle.

Assim, e respondendo a uma pergunta de JCM, um leitor deste blog, posso dizer que me parece muito difícil, senão mesmo impossível, que os PDF que indica como existindo na Biblioteca Nacional Francesa, ou mesmo na Biblioteca Nacional de Portugal http://purl.pt/index/livro/PT/index.html (Colecções Digitalizadas) sejam lidos no Kindle.

Isto porque as obras em causa foram digitalizadas com fins de preservação e divulgação científica, com optimização para visualização em ecrãs de computador, sem preocupações em termos de dimensão, visando a máxima qualidade de forma a reproduzir e preservar para o futuro (da forma mais fiel possível) as obras em causa.

Mas, para além deste tipo de PDFs, quem trabalha diariamente na redacção de textos, elaboração de contratos, peças processuais ou em qualquer tipo de trabalho que envolva processamento de texto, sabe que os PDFs não são todos iguais.

De facto, sem entrar em grandes detalhes técnicos (que também não conheço a fundo) há PDFs que são puras "fotografias" do texto em papel que reproduzem e outros PDFs que nos permitem extrair o texto respectivo e a sua "reutilização", contagem, correcção etc.

Este último tipo de PDFs inclui documentos que permitem, por exemplo, converter o seu conteúdo, de forma mais ou menos automática para um processador de texto ou... para um formato que seja lido pelo Kindle.

Assim, no primeiro caso temos PDFs "estáticos", em que cada página é uma "fotografia". Estes PDFs podem ser lidos no Kindle de forma "nativa", ou seja, o Kindle lê este tipo de ficheiros. O problema destes ficheiros é que estão normalmente optimizados para o formato A4 e para serem lidos num PC, num ecrã grande. Assim, para tentar obviar esse problema uma recente alteração de software do Kindle permite a leitura dos ficheiros em modo "paisagem" (landscape) e sem necessidade de qualquer tipo de conversão ou "pré-tratamento". Como se pode ver aqui (mil desculpas pela péssima qualidade das fotos feitas com um iPhone e sem grande iluminação):


Mas esta solução não é muito confortável porque o Kindle, neste momento, não permite fazer qualquer tipo de zoom sobre os PDFs.

A mesma página de um PDF "não tratado" em modo "retrato" (ainda pior):

É praticamente impossível de ler devido ao tamanho em que fica a letra pois não há possibilidade de fazer zoom sobre o texto.

Mas, para além desta forma de visualizar PDFs a Amazon disponibiliza um serviço de conversão automática de ficheiros que faz com que os PDFs "não estáticos" ("reflowable") possam ser convertidos para o formato proprietário do Kindle com excelentes resultados na maior parte dos casos.

Assim, para converter um ficheiro PDF para o formato azw (amazon kindle) basta enviar um e-mail para um endereço personalizado de cada utilizador (o_seu_nome_aqui@free.kindle.com,) e menos de 30 segundos depois terá, na volta do e-mail, o seu ficheiro devidamente formato para o Kindle.



A qualidade final do ficheiro recebida depende da "qualidade" do PDF enviado. Se tiver um PDF "estático" (imagem pura) vai receber um final praticamente ilegível para o Kindle; se enviar um PDF que um terceiro tiver criado a partir de um processador de texto ou um PDF "pesquisável" é bem provável que o ficheiro seja correctamente convertido e bem lido no Kindle.

Uma forma de saber se o PDF é pesquisável ou é uma mera imagem estática é abrir o PDF e tentar fazer "pesquisa de palavra"; no Adobe Reader pode escrever uma palavra que vê no texto do PDF na caixa "Pesquisar" ou "Localizar"; se tiver escrito uma palavra que sabe estar no texto e o programa disser que não a encontra estará perante um PDF a que (por comodidade de autor) chamei de "estático", se a palavra for localizada então isso significa que o PDF deverá ser "bem convertido" para o Kindle.
Exemplo da mesma página, já convertida para o formato Kindle:





Neste caso o resultado final é perfeito. O livro de Margarida Rebelo Pinto é apresentado no Kindle no mesmo (bom) formato de qualquer livro que pode comprar directamente na Amazon.


E este processo de conversão e leitura no Kindle é válido para os milhares de livros livres de direitos de autor que a Google disponibiliza no Google Books, ou que estejam disponíveis no Site Scribd, por exemplo...


Utilizei para este exemplo o livro "Sei Lá", que Margarida Rebelo Pinto simpaticamente disponibiliza para download gratuito no seu blog, em formato PDF.

Não sei se fui claro... se tiverem dúvidas tentarei ajudar na medida dos meus conhecimentos.

3 comentários:

JCM disse...

Caro José Bernardes,

Muito obrigado pelos seus muito úteis esclarecimentos e, também, pela sua amável disponibilidade.

Mesmo que não possa ler os textos da Gallica, estou decidido a entrar no clube Kindle.

Um Feliz Natal,

JCMaia

neves disse...

Há outra forma de converter PDFs mas só quem tiver o programa Acrobat ( não confundir com o Acrobat Reader....) é que o pode fazer:

O Acrobat permite gravar PDFS em vários formatos que o Kindle lê (Txt, Doc, etc, isto é, abre o texto que quer converter e "Save as" no formato que quiser escolher.....

José Bernardes disse...

Obrigado leitor Neves, tem toda a razão. Além disso, os programas que indico nos primeiros posts do blog também permitem fazer o mesmo, e são gratuitos. Mobipocket e Calibre. Eu acabei por analisar a questão do ponto de vista de um proprietário do Kindle com acesso ao tal serviço gratuito da Amazon. Mas tive ainda outra razão para o fazer é que, comparando os ficheiros criados pela Amazon e os criados no Acrobat ou na Calibre, os primeiros (Amazon) acabam por ser formatados "a pensar" nas especificações do Kindle e, feita a comparação, têm claramente mais qualidade para leitura no Kindle.

Enviar um comentário