Saltar para o conteúdo

DjVu: diferenças entre revisões

Origem: Wikipédia, a enciclopédia livre.
Conteúdo apagado Conteúdo adicionado
Linha 6: Linha 6:



Djvu (Déjà Vu, do francês) é um formato para distribuição de documentos com foco na web. Pode substituir com vantagens formatos como PDF, PS, TIFF, etc para a distribuição de documentos scaneados, documentos digitais ou imagens de alta resolução.

Originalmente desenvolvido nos Bell Labs da AT&T, a partir de 1995, o formato hoje está sendo comercialmente explorado pela empresa Lizardtech e ao mesmo tempo sendo desenvolvido, como software aberto, pelo projeto DjVuLibre, conduzido pelos próprios inventores da tecnologia.

Um arquivo digitalizado, em formato PDF, ocupa 20MB, já o mesmo arquivo, no formato djvu ocupa apenas 4MB, um quinto do total. Outra grande vantagem em relação à outros formatos, o download não é feito do documento inteiro, mas de suas partes. No caso do PDF você só consegue ver o documento após o download dos 40MB. Já com o djvu as páginas são carregadas individualmente, o que gera um tempo de espera equivalente à carga de uma página html normal, talvez um pouco mais.

Outra coisa interessante, acoplando-se o djvu a um software de reconhecimento de caracteres, é possível fazer busca textual. O software de OCR empregado, o Clara OCR, que embora ainda não faça um reconhecimento 100% dos caracteres, certamente contribui para exibir inequivocamente a eficácia de tal solução.

O software Clara OCR, desenvolvido por Ricardo Ueda (http://www.ime.usp.br/~ueda/), é licenciado sob a GPL e pode ser baixado no endereço http://www.claraocr.org.

Como o PDF, o DjVu exige um visualizador para a sua leitura. O visualizador é gratuito e pode ser instalado como um plugin nos browsers mais comuns. Visualizadores para Windows, Mac e Linux encontram-se no site da LizardTech, Inc. Downloads em:

* http://www.lizardtech.com/download/?f=0&d=1

Para sistemas Unix, o projeto DjVuLibre disponibiliza visualizadores com o programa fonte. Existem ainda pacotes binários para as principais distribuições do Linux. Alguns deles são:

* Debian: djvulibre-plugin
* RedHat e Mandrake: veja em http://djvu.sourceforge.net/

Utilitários sofisticados para criar e manipular arquivos DjVu estão comercialmente disponíveis. Estão disponíveis também excelentes utilitários com código aberto no projeto DjVuLibre. Estes utilitários incluem programas para manipulação das imagens e dos textos, implementando, inclusive, algumas interfaces em XML. Um pacote Debian com binários de alguns dos programas de desenvolvimento é o djvulibre-dev.

Segue abaixo um tutorial para criação de documento .djvu:

* http://www.djvuzone.org/support/tutorial/...


=={{links}}==
=={{links}}==

Revisão das 19h14min de 20 de janeiro de 2007

DjVu (origem na expressão francesa "déjà vu"; em português pronuncia-se: "dejá vi") é uma nova tecnologia de compressão de imagem desenvolvida desde 1996 nos laboratórios da AT&T. Formato para documentos digitais.

Usa uma tecnologia que permite a visualização mais rápida do que por exemplo um arquivo PDF. Um arquivo djvu pode ser até 100 vezes menor do que jpeg ou pdf.


Djvu (Déjà Vu, do francês) é um formato para distribuição de documentos com foco na web. Pode substituir com vantagens formatos como PDF, PS, TIFF, etc para a distribuição de documentos scaneados, documentos digitais ou imagens de alta resolução.

Originalmente desenvolvido nos Bell Labs da AT&T, a partir de 1995, o formato hoje está sendo comercialmente explorado pela empresa Lizardtech e ao mesmo tempo sendo desenvolvido, como software aberto, pelo projeto DjVuLibre, conduzido pelos próprios inventores da tecnologia.

Um arquivo digitalizado, em formato PDF, ocupa 20MB, já o mesmo arquivo, no formato djvu ocupa apenas 4MB, um quinto do total. Outra grande vantagem em relação à outros formatos, o download não é feito do documento inteiro, mas de suas partes. No caso do PDF você só consegue ver o documento após o download dos 40MB. Já com o djvu as páginas são carregadas individualmente, o que gera um tempo de espera equivalente à carga de uma página html normal, talvez um pouco mais.

Outra coisa interessante, acoplando-se o djvu a um software de reconhecimento de caracteres, é possível fazer busca textual. O software de OCR empregado, o Clara OCR, que embora ainda não faça um reconhecimento 100% dos caracteres, certamente contribui para exibir inequivocamente a eficácia de tal solução.

O software Clara OCR, desenvolvido por Ricardo Ueda (http://www.ime.usp.br/~ueda/), é licenciado sob a GPL e pode ser baixado no endereço http://www.claraocr.org.

Como o PDF, o DjVu exige um visualizador para a sua leitura. O visualizador é gratuito e pode ser instalado como um plugin nos browsers mais comuns. Visualizadores para Windows, Mac e Linux encontram-se no site da LizardTech, Inc. Downloads em:

   * http://www.lizardtech.com/download/?f=0&d=1 

Para sistemas Unix, o projeto DjVuLibre disponibiliza visualizadores com o programa fonte. Existem ainda pacotes binários para as principais distribuições do Linux. Alguns deles são:

   * Debian: djvulibre-plugin
   * RedHat e Mandrake: veja em http://djvu.sourceforge.net/ 

Utilitários sofisticados para criar e manipular arquivos DjVu estão comercialmente disponíveis. Estão disponíveis também excelentes utilitários com código aberto no projeto DjVuLibre. Estes utilitários incluem programas para manipulação das imagens e dos textos, implementando, inclusive, algumas interfaces em XML. Um pacote Debian com binários de alguns dos programas de desenvolvimento é o djvulibre-dev.

Segue abaixo um tutorial para criação de documento .djvu:

   * http://www.djvuzone.org/support/tutorial/... 

Ligações externas