DjVu: diferenças entre revisões
Linha 6: | Linha 6: | ||
Djvu (Déjà Vu, do francês) é um formato para distribuição de documentos com foco na web. Pode substituir com vantagens formatos como PDF, PS, TIFF, etc para a distribuição de documentos scaneados, documentos digitais ou imagens de alta resolução. |
|||
Originalmente desenvolvido nos Bell Labs da AT&T, a partir de 1995, o formato hoje está sendo comercialmente explorado pela empresa Lizardtech e ao mesmo tempo sendo desenvolvido, como software aberto, pelo projeto DjVuLibre, conduzido pelos próprios inventores da tecnologia. |
|||
Um arquivo digitalizado, em formato PDF, ocupa 20MB, já o mesmo arquivo, no formato djvu ocupa apenas 4MB, um quinto do total. Outra grande vantagem em relação à outros formatos, o download não é feito do documento inteiro, mas de suas partes. No caso do PDF você só consegue ver o documento após o download dos 40MB. Já com o djvu as páginas são carregadas individualmente, o que gera um tempo de espera equivalente à carga de uma página html normal, talvez um pouco mais. |
|||
Outra coisa interessante, acoplando-se o djvu a um software de reconhecimento de caracteres, é possível fazer busca textual. O software de OCR empregado, o Clara OCR, que embora ainda não faça um reconhecimento 100% dos caracteres, certamente contribui para exibir inequivocamente a eficácia de tal solução. |
|||
O software Clara OCR, desenvolvido por Ricardo Ueda (http://www.ime.usp.br/~ueda/), é licenciado sob a GPL e pode ser baixado no endereço http://www.claraocr.org. |
|||
Como o PDF, o DjVu exige um visualizador para a sua leitura. O visualizador é gratuito e pode ser instalado como um plugin nos browsers mais comuns. Visualizadores para Windows, Mac e Linux encontram-se no site da LizardTech, Inc. Downloads em: |
|||
* http://www.lizardtech.com/download/?f=0&d=1 |
|||
Para sistemas Unix, o projeto DjVuLibre disponibiliza visualizadores com o programa fonte. Existem ainda pacotes binários para as principais distribuições do Linux. Alguns deles são: |
|||
* Debian: djvulibre-plugin |
|||
* RedHat e Mandrake: veja em http://djvu.sourceforge.net/ |
|||
Utilitários sofisticados para criar e manipular arquivos DjVu estão comercialmente disponíveis. Estão disponíveis também excelentes utilitários com código aberto no projeto DjVuLibre. Estes utilitários incluem programas para manipulação das imagens e dos textos, implementando, inclusive, algumas interfaces em XML. Um pacote Debian com binários de alguns dos programas de desenvolvimento é o djvulibre-dev. |
|||
Segue abaixo um tutorial para criação de documento .djvu: |
|||
* http://www.djvuzone.org/support/tutorial/... |
|||
=={{links}}== |
=={{links}}== |
Revisão das 19h14min de 20 de janeiro de 2007
DjVu (origem na expressão francesa "déjà vu"; em português pronuncia-se: "dejá vi") é uma nova tecnologia de compressão de imagem desenvolvida desde 1996 nos laboratórios da AT&T. Formato para documentos digitais.
Usa uma tecnologia que permite a visualização mais rápida do que por exemplo um arquivo PDF. Um arquivo djvu pode ser até 100 vezes menor do que jpeg ou pdf.
Djvu (Déjà Vu, do francês) é um formato para distribuição de documentos com foco na web. Pode substituir com vantagens formatos como PDF, PS, TIFF, etc para a distribuição de documentos scaneados, documentos digitais ou imagens de alta resolução.
Originalmente desenvolvido nos Bell Labs da AT&T, a partir de 1995, o formato hoje está sendo comercialmente explorado pela empresa Lizardtech e ao mesmo tempo sendo desenvolvido, como software aberto, pelo projeto DjVuLibre, conduzido pelos próprios inventores da tecnologia.
Um arquivo digitalizado, em formato PDF, ocupa 20MB, já o mesmo arquivo, no formato djvu ocupa apenas 4MB, um quinto do total. Outra grande vantagem em relação à outros formatos, o download não é feito do documento inteiro, mas de suas partes. No caso do PDF você só consegue ver o documento após o download dos 40MB. Já com o djvu as páginas são carregadas individualmente, o que gera um tempo de espera equivalente à carga de uma página html normal, talvez um pouco mais.
Outra coisa interessante, acoplando-se o djvu a um software de reconhecimento de caracteres, é possível fazer busca textual. O software de OCR empregado, o Clara OCR, que embora ainda não faça um reconhecimento 100% dos caracteres, certamente contribui para exibir inequivocamente a eficácia de tal solução.
O software Clara OCR, desenvolvido por Ricardo Ueda (http://www.ime.usp.br/~ueda/), é licenciado sob a GPL e pode ser baixado no endereço http://www.claraocr.org.
Como o PDF, o DjVu exige um visualizador para a sua leitura. O visualizador é gratuito e pode ser instalado como um plugin nos browsers mais comuns. Visualizadores para Windows, Mac e Linux encontram-se no site da LizardTech, Inc. Downloads em:
* http://www.lizardtech.com/download/?f=0&d=1
Para sistemas Unix, o projeto DjVuLibre disponibiliza visualizadores com o programa fonte. Existem ainda pacotes binários para as principais distribuições do Linux. Alguns deles são:
* Debian: djvulibre-plugin * RedHat e Mandrake: veja em http://djvu.sourceforge.net/
Utilitários sofisticados para criar e manipular arquivos DjVu estão comercialmente disponíveis. Estão disponíveis também excelentes utilitários com código aberto no projeto DjVuLibre. Estes utilitários incluem programas para manipulação das imagens e dos textos, implementando, inclusive, algumas interfaces em XML. Um pacote Debian com binários de alguns dos programas de desenvolvimento é o djvulibre-dev.
Segue abaixo um tutorial para criação de documento .djvu:
* http://www.djvuzone.org/support/tutorial/...