segunda-feira, 10 de julho de 2017

Como escanear livro para formato EPUB

O que torna o EPUB melhor que o PDF para livros digitais é a possibilidade de adaptação do texto a diferentes tamanhos de telas. O PDF é basicamente um arquivo de foto, o que impossibilita que alteremos o tamanho da fonte, estilo, etc. Por outro lado o EPUB permite-nos que façamos tudo isso e muito mais que o HTML possibilita, por isso é o formato ideal para livros eletrônicos.

Neste tutorial ensinarei passo a passo como digitalizar um livro para EPUB usando apenas um celular, um computador com o FineReader instalado e um software onde faremos as devidas formatações, no caso utilizaremos o Sigil que é gratuito. 



NO CELULAR

A grande vantagem em usar o celular como scanner ao invés do tradicional de mesa é que não há necessidade de destruir o livro para fazer a digitalização. Uma simples variação na página impossibilitaria o software de reconhecer o que ali havia, por isso para um trabalho de qualidade usando um scanner de mesa é imprescindível que o livro seja destruído. Por outro lado, um celular com uma câmera razoável resolveria esse problema e você continuaria com o seu livro perfeito.

Existem muitos aplicativos que fazem a função de um scannear disponível para Android e todos eles basicamente fazem a mesma coisa. Eu costumo usar o Office Lens e será ele que utilizarem aqui no tutorial - lembrando que não há necessidade de ter algum aplicativo do tipo uma vez que apenas o que faremos é tirar fotos das páginas do livro e posteriormente usaremos um leitor de OCR para converter a foto em texto puro, no entanto eles acabam facilitando um pouco mais o processo.


Você pode encontrar o Office Lens para download na Google Play ou caso preferir clique aqui para download do APK.

O próximo passo é simplesmente fotografar as páginas do livro que deseja digitalizar tomando o devido cuidado com o foco e nitidez das mesmas.


*Adendo: usar o Office Lens permite-nos que escolhemos a área da página do livro que queremos digitalizar. Todos os livros físicos, por exemplo, vêm com a contagem de página em cada folha algo desnecessário em livros digitais. Usando o aplicativo podemos cortar a imagem facilmente eliminando as partes desnecessárias.


Páginas fotografadas, passe-as para o seu computador e vamos para a parte mais trabalhosa. 😄

*recomendo que passe os arquivos para o computador pelo cabo USB ou algum outro método que não compacte as mesmas, o que poderia prejudicar a identificação das palavras.



NO COMPUTADOR

O primeiro passo é instalar o FineReader. Veja como fazer clicando aqui. (caso tenha algum problema, entre em contato que responderei)


Abra o aplicativo e clique em Abrir. Então procure pelas páginas que você digitalizou e abra a primeira.


Ao abrir a foto da página digitalizada o FineReader inicia automaticamente o processo de conversão da imagem em texto. Veja que ao lado direito, após alguns segundos de processamento, aparece a página do livro já convertida. As palavras marcadas em azul são partes onde o FineReader não conseguiu identificar 100%  e que portanto merece a sua atenção.

O próximo passo é simplesmente pegar (Ctrl C + Ctrl V) o texto já convertido e usar um editor de texto para fazer a organização do livro. Como no caso pretendo digitalizar o livro que tenho para EPUB, utilizarei o editor Sigil que lida muito bem com esse tipo de arquivo. Porém você poderia utilizar qualquer outro processador de texto, como o Word por exemplo.

Caso queira utilizar o Sigil, clique aqui para fazer o download. Recomendo ele pois na internet tem muito conteúdo sobre ele então será fácil aprender a usá-lo.

Abra-o e simplesmente cole o texto:


No Sigil é onde faremos toda a edição do Ebook. Adicionar os capítulos, arrumar a estrutura do texto, capa, etc.


De resto, basta repetir o processo com todas as páginas...



Valeu pessoal, até a próxima!



Compartilhe: