DjVu
DjVu | |
---|---|
Файл кеңейтімі: | .djvu, .djv |
MIME түрі: | image/vnd.djvu, image/x-djvu |
Type code: | DJVU |
Дамытқан мекеме атауы: | AT&T Labs - Research |
Формат типі: | Кескінді файл форматтары |
DjVu (фр. déjà vu — «бұған дейін көрілген») — сканерден өткізілген құжаттарды - кітап, журнал, қолжазба және басқаларды сақтау үшін жасалған технология.
Бұл технология формула, сызбанұсқа, сурет және қолжазба символдарына бай әрі символдардың оптикалық оқылуына қиындық туғызатын материалдардың кескіндерін сапасыз сығу жолымен жасалынады. Және де бұл форматтың қолданысы рәсімделудің маңыздылығын көрсету жағдайында ұтымды, мысалға, тарихи құжаттардың мазмұнынан бөлек, қағаздың сапасын: түсін, сынын; пергаменттің ақаулары: жарықшаларын, бүктелген орындарын, түзетулерін, сияның аққан жерлерін, саусақ іздерін және басқа да заттардың қалдырған іздерін көрсету үшін.
Қазіргі таңда DjVu бірнеше электронды ғылыми кітапхананың негізгі форматына айналды. Ол айтарлықтай белгілі және оның негізінде электронды құжаттардың біразы жасалатын болды.
Форматтағы желі бойынша алмасу ерекшеліктері файлдың жүктелуі аяқталмағанды күтпей-ақ беттерді көре алу мүмкіндігін ескере жасалған. DjVu-файлы мәтіндік (OCR) қабаттан тұруы мүмкін әрі бұл файл бойынша толыққанды іздеу жүргізуге мүмкіндік туғызады. Бұдан бөлек, DjVu-файлда енгізілген интерактивті мазмұн мен белсенді аумақтар — сілтемлер болуы мүмкін, бұл DjVu-кітаптардағы ыңғайлы навигацияның атқарылуына мүмкіндік береді.
Қолданылатын технологиялар
[өңдеу | қайнарын өңдеу]Түрлі-түсті кескіндерді сығу үшін DjVu-да шығыс кескінін үш қабатқа: алдыңғы бөлік, артқы бөлік және ақ-қара түсті (бір биттік) маскаға бөлетін арнайы технология қолданылады. Маска әуелгі файлдың рұқсаттығымен сақталады; себебі мәтіннің кескіні мен басқа да анық детальдарды құрайтын соның дәл өзі. Қалған, беттің суреттері мен бет текстурасын құрайтын артқы бөлік, орын үнемділігі үшін сартты баптаулармен сақталады. Алдыңғы бөлік маскадағы түстік мәліметтерді сақтап отырдаы, оның рұқсаттығы әдетте одан бетер қысқартылады. Осыдан кейін, артқы және алдыңғы бөліктер вейвлет-түрлену арқылы, ал маска — JB2 алгоритмі арқылы сығылады.
JB2 алгоритмінің ерекшелігі — оның беттегі қайталанатын символдарды іздеп, олардың кескіндерін тек бір мәрте сақтауы болып табылады. Ал көп беттік құжаттарда болса қатарынан келе жатқан беттер ортақ кескін «сөздігін» қолданады.
Көптеген кітапты сығу үшін тек екі түстің өзі жеткілікті. Бұл жағдайда ұтымды сығылуға қол жеткізудің амалы — бір қабатты ғана қолдану. Тұрпайы, ақ-қара түсті суретті, 600 dpi рұқсаттықпен сканерден өткізілген кітаптың орташа көлемі 15 Кб, шамасын құрайды, яғни түпкі файлдан 100 есе кем. Күрделі артқы қабаттың қолданысында көлем ұтысы әдетте 4—10 есені құрайды. Алайда, DjVu-дің стандартты баптауларында мәліметтерді сапалық шығынымен сығу қолданылады, сол себептен аса маңызды құжаттар үшін сапаны сақтай отырып сығу қолданылады, ол үшін PNG, JPEG 2000, TIFF, т.с.с. қолданылады. DjVu-де сонымен қатар сапаны сақтай отырып мәліметтерді сығуды да қолдануға болады. Мысалға DjVuLibre пакетіндегі CJB2 қондыртпасы сондай мүмкіндікті береді.
DjVu форматының негізінде AT&T Labs тарапынан жасалған келесідей технологиялар бар:
- сканерден өткізілген кескін мәтінін аядан ажырату алгоритмі;
- аяны сығудың IW44 вейвлетті алгоритмі;
- ақ-қара түсті кескіндерді сығудың JB2 алгоритмі;
- ZIP-ті сығудың әмбебап алгоритмі;
- «сұраныс бойынша» орналастыру алгоритмі;
- кескіндерді «тасалау» алгоритмі.
DjVu кескіндерін мәтіндік ұсыну
[өңдеу | қайнарын өңдеу]DjVu форматы беттегі мәтінді құрайтын "мәтіндік қабаттың" болуын ескереді. (Соның көмегімен жұмыс істеу кезінде іздеу мен мәтінді жеңілдей көшіріп алу үшін қолданылады). Егер мәтіндік қабатқа қол жетімсіз жағдай туса, мәтінді алудың бірден-бір жолы — шет қондырмалы бағдарламаларда оптикалық оқыту жасату.
Лицензиялық ақпарат
[өңдеу | қайнарын өңдеу]AT&T өз технологиясын LizardTech компаниясына сатқан болатын, ал кейінгісі оны өзінің коммерциялық мақсаттарында қолдануға тырысқан, алайда форматтың ашықтығына байланысты[1] DjVu құжаттарын құру әрі тамашалау үшін түрлі тұғырнамаларға қолжетімді еркін бағдарламалық қамтамасыз ету құралы бар болып шықты. 2008 жылдың 1 шілдесінде LizardTech DjVu менеджментін Celartem аналық компаниясына берген болатын[2], ал 2009 жылдың 10 маусымында Celartem DjVu технологиясына қатысты құқықтарды Caminova компаниясына тапсырды[3].
Бұлардан бөлек GNU GPL лицензиясы негізінде жарияланатын ішіндегі кодтаушы-бағдарламалары әрі оларды тамашалайтынDjVuLibre кітапханасы сынды ашық бағдарламалық қамтамасыз ету құралы бар.
DjVu-мен жұмыс істеуге арналған бағдарламалар
[өңдеу | қайнарын өңдеу]- Көру үшін
Windows-қа
Linux-қа
Android-қа
iOS-ға
- Түзету үшін
- Құру үшін
- Түрлендіру үшін
Тағы қараңыз
[өңдеу | қайнарын өңдеу]- Электронды кітап
- Электронды қағаз
- Электронды кітапхана
- Кітаптарды сандық форматқа түсіру
- M-Book Mini
- Amazon Kindle
Дереккөздер
[өңдеу | қайнарын өңдеу]- ↑ Лицензия
- ↑ LizardTech-тің пресс-релизі Мұрағатталған 28 қыркүйектің 2008 жылы.
- ↑ LizardTech-тің пресс-релизі Мұрағатталған 16 шілденің 2009 жылы.
Сыртқы сілтемелер
[өңдеу | қайнарын өңдеу]- DJVU — формат для электронных библиотек. Мұрағатталған 24 қарашаның 2004 жылы. (орыс.)
- Дежавю или DjVu: ликбез. (орыс.)
- DjVu.org (орыс.)