DjVu
DjVu (ֆր.՝ déjà vu — «արդեն տեսանելի»)՝ «պատկերների սեղմում կորուստներով» տեխնոլոգիան, որը մշակվել է հատուկ սկանավորված փաստաթղթերը (գրքեր, ամսագրեր, ձեռագրեր և այլն) պահպանելու համար, որտեղ բանաձևերի առատությունը, սխեմաները, նկարները և ձեռագիր սիմվոլները չափազանց ժամանակատար են դարձնում սիմվոլների օպտիկական նիշերը ճանաչելը։ Այն նաև արդյունավետ լուծում է, եթե կարիք կա նմուշի բոլոր նրբությունները փոխանցել, օրինակ պատմական փաստատթղթերը, որտեղ կարևոր է ոչ միայն բովանդակությունը, այլև թղթի գույնն ու որակը, մագաղաթի թերությունները, ճաքերը, ծալված տեղերի հետքերը, ուղղումները, այլ իրերով թողնված հետքերը։
Ամենասկզբից տեխնոլոգիան մշակվել է Յան Լեկունի, Լեոն Բոտի և Պատիկ Հեֆֆերնի կողմից՝ AT&T լաբորատորիայում (1996-2001 թվականներին)։ DjVu-ն էլեկտրոնային մի քանի գրադարանների հիմք է դարձել։ Այն բավականին հայտնի է և օգտագործվում է բազմապիսի փաստաթղթերի համար։
Ֆորմատը օպտիմիզացված է ցանկցով փոխանցելու այնպիսի մեթոդով, որ էջը կարելի է դիտել մինչ բեռնման ավարտը։ DjVu ֆորմատը կարող է պարունակել տեքստային (OCR) շերտ, ինչը թույլ է տալիս փնտրել որևէ բան ողջ տեքստի մեջ։ Բացի դա, DjVu ֆայլը կարող է պարունակել ներդրված ինտերակտիվ ցանկ և ակտիվ շրջանները՝ հղումներ, ինչը թույլ է տալիս իրականացնել հարմար նավարկում ողջ DjVu ֆայլի մեջ։
Օգտագործվող տեխնոլոգիաները
խմբագրելDjVu-ում գունավոր պատկերները սեղմելու օգտագործվում է հատուկ տեխնոլոգիա, որը պատկերը բաժանում է 3 շերտի՝ առջևի պլան, հետևի պլան և սև-սպիտակ (մեկբիթանի) երեսի։ Երեսը պահպահում է իսկական պատկերի չափսը, հենց դա էլ պարունակում է տեքստի պատկերը և այլ հստակ տվյալներ։ Հետևի պլանի չափսը, որում մնում են էջի նկարազարդումներն ու հյուսվածները, տարածք խնայելու համար փոքրացվում է։ Առջևի պլանը պարունակում է երեսի գունային ինֆորմացիան։ Առևի պլանի չափսը սովորաբար շատ ավելի է փոքրացվում։ Այնուհետև հետևի և առջևի պլանները вейвлет-преобразования օգնությամբ խտացվում են, իսկ երեսը՝ JB2 ալգորիթմով։
JB2 ալգորիթմի առանձնահատկությունն այն է, որ այն էջի վրա փնտրում կրկնվող սիմվոլներ և պահպանում է դրանց պատկերը միայն մեկ անգամ։ Մի քանի էջից բաղկացած փաստաթղթերում յուրաքանչյուր էջ օգտագործում է ընդհանուր «բառարանի» պատկերները։
Գրքերի մեծ մասը սեղմելու համար կարելի է օգտվել միայն երկու գույնից։ Այս դեպքում օգտագործվում է միայն մեկ շերտ, ինչը թույլ է տալիս հասնել սեղմման ռեկորդային աստիճանի։ Սև ու սպիտակ նկարազարդումներով սովորական գրքում, որը սկանավորվել է 600 dpi խտությամբ, էջի չափսը կազմում է միջինում 15 ԿԲ, այսինքն՝ մոտավորապես 100 անգամ ավելի փոքր, քան իրական ֆայլը։ Բարդ հետևի պլանի դեպքում հնարավոր է սեղմել իրական չափից 4-ից 10 անգամ։ Սակայն DjVu-ի լռելյայն կարգավորումներում օգտագործվում է «Տվյալների կորուստներով սեղմում» ֆունկցիան, այդ պատճառով էլ շատ կարևոր փաստաթղթերը պահպանելիս սովորաբար ընտրվում է «առանց կորուստների»՝ PNG, JPEG 2000, TIFF և այլ տարբերակներ։ DjVu-ում կարելի է նաև օգտագործել «տվյալների սեղմում առանց կորուստների» ֆունկցիան։ Այսպես օրինակ DjVuLibre փաթեթի CJB2 գործիքը հնարավորություն է ընձեռում սեղմել տվյալները «առանց կորուստների»։
DjVu ֆորմատում հիմնականում գործում են մի քանի տեխնոլոգիաներ, այդ թվում նար AT&T լաբորատորիայի մշակածը.
Պատկերների տեքստային ներկայացումը
խմբագրելDjVu ֆորմատը նախատեսում է «տեքստային շերտի» առկայություն, որը պարունակում է էջի տեքստը (Օգտագործվում է տեքստը հեշտությամբ փնտրելու և պատճենելու համար)։ Այն դեպքում, երբ տեքստային շերտը հասանելի չէ, տեքստ ստանալու միակ եղանակը օպտիկական նիշերի ճանաչումն է այլ ծրագրերի միջոցով։
Արտոնագիր
խմբագրելAT&T ընկերությունը վաճառել է տեխնոլոգիան LizardTech ընկերությանը, որը փորձել է օգտագործել այն իր կոմերցիոն շահերից ելնելով, բայց շնորհիվ ֆորմատի բաց լինելու[1] DjVu փաստաթղթերի ստեղծման և դիտման համար գոյություն ունի Ազատ ծրագրային ապահովում, որը հասանելի է մի շարք պլատֆորմաների։ 2008 թվականի հուլիսի 1-ին LizardTech ընկերությունը DjVu-ի կառավարումը հանձնեց Celartem մայր ընկերությանը[2],, իսկ 2009 թվականի հունիսի 10-ին Celartem ընկերությունը փոխանցեց իր DjVu տեխնոլոգիայի իրավունքները Caminova ընկերությանը[3]։.
Գոյություն ունի ազատ ծրագիր, որը թողարկվում է GNU GPL լիցենզիայով, DjVuLibre գրադարան և դիտարկիչներ և ծրագիր-կոդավորիչներ։
DjVu ֆայլերի հետ աշխատելու համար ծրագրեր
խմբագրել- Դիտում
Windows օպերացիոն համակարգի համար՝
- Caminova՝ DjVu-ի պաշտոնական հավելումը ինտերնետ դիտարկիչների համար,
- DjVuReader;
- DjVu Viewer;
- STDU Viewer;
- Sumatra PDF;
- WinDjView.
Linux օպերացիոն համակարգի համար՝
UNIX օպերացիոն համակարգի համար՝
- DjVuLibre DjView
OS X օպերացիոն համակարգի համար՝
- Caminova Official DjVu Browser Plug-in
- DjVuLibre DjView
- MacDjView Desktop Viewers
Android օպերացիոն համակարգի համար՝
- Akunin Book;
- EBookDroid;
- Orion Viewer օգտագործելով DjVuLibre.
iOS օպերացիոն համակարգի համար՝
- Stanza;
- DjVU Book Reader.
BlackBerry OS օպերացիոն համակարգի համար՝
- DjVuBB.
- Խմբագրում
- DjVuLibre;
- Document Express՝ հեղինակի պաշտոնական ծրագիրը,
- DJVU փաստաթղթում տեքստի ճանաչման (OCR) հնարավորության ավելացում փնտրելու և պատճենելու համար,
- any2djvu՝ առցանց ծառայություն, որը աշխատում է միայն անգլալեզու տեքստերի հետ[4].
- DjvuOCR՝ DJVU փաստաթղթում ավելացնում է տեքստերի ճանաչում[5].
- ABBYY FineReader՝ պահպանում է պրոյեկտը DJVU տեսքով, OCR շերտով (սկսած 10-րդ տարբերակից)
Կարդացեք նաև
խմբագրելԾանոթագրություններ
խմբագրել- ↑ Лицензия
- ↑ «Пресс-релиз LizardTech». Արխիվացված է օրիգինալից 2008 թ․ սեպտեմբերի 28-ին. Վերցված է 2014 թ․ սեպտեմբերի 25-ին.
- ↑ «Пресс-релиз LizardTech». Արխիվացված է օրիգինալից 2009 թ․ հուլիսի 16-ին. Վերցված է 2014 թ․ սեպտեմբերի 25-ին.
- ↑ «any2djvu - онлайн-конвертирование в DJVU». Արխիվացված է օրիգինալից 2011 թ․ մայիսի 22-ին. Վերցված է 2014 թ․ սեպտեմբերի 25-ին.
- ↑ сайт разработки DjvuOCR
Արտաքին հղումներ
խմբագրել- DJVU — формат для электронных библиотек. Արխիվացված 2004-11-24 Wayback Machine Алгоритмы и достоинства, программы и использование, руководства пользователя.
- Дежавю или DjVu: ликбез. Сборник статей о технологии DjVu.
- DjVu.org Англоязычный портал DjVu-сообщества.