Jump to content

DjVu

Վիքիպեդիայից՝ ազատ հանրագիտարանից
The printable version is no longer supported and may have rendering errors. Please update your browser bookmarks and please use the default browser print function instead.

DjVu (ֆր.՝ déjà vu — «արդեն տեսանելի»)՝ «պատկերների սեղմում կորուստներով» տեխնոլոգիան, որը մշակվել է հատուկ սկանավորված փաստաթղթերը (գրքեր, ամսագրեր, ձեռագրեր և այլն) պահպանելու համար, որտեղ բանաձևերի առատությունը, սխեմաները, նկարները և ձեռագիր սիմվոլները չափազանց ժամանակատար են դարձնում սիմվոլների օպտիկական նիշերը ճանաչելը։ Այն նաև արդյունավետ լուծում է, եթե կարիք կա նմուշի բոլոր նրբությունները փոխանցել, օրինակ պատմական փաստատթղթերը, որտեղ կարևոր է ոչ միայն բովանդակությունը, այլև թղթի գույնն ու որակը, մագաղաթի թերությունները, ճաքերը, ծալված տեղերի հետքերը, ուղղումները, այլ իրերով թողնված հետքերը։

Ամենասկզբից տեխնոլոգիան մշակվել է Յան Լեկունի, Լեոն Բոտի և Պատիկ Հեֆֆերնի կողմից՝ AT&T լաբորատորիայում (1996-2001 թվականներին)։ DjVu-ն էլեկտրոնային մի քանի գրադարանների հիմք է դարձել։ Այն բավականին հայտնի է և օգտագործվում է բազմապիսի փաստաթղթերի համար։

Ֆորմատը օպտիմիզացված է ցանկցով փոխանցելու այնպիսի մեթոդով, որ էջը կարելի է դիտել մինչ բեռնման ավարտը։ DjVu ֆորմատը կարող է պարունակել տեքստային (OCR) շերտ, ինչը թույլ է տալիս փնտրել որևէ բան ողջ տեքստի մեջ։ Բացի դա, DjVu ֆայլը կարող է պարունակել ներդրված ինտերակտիվ ցանկ և ակտիվ շրջանները՝ հղումներ, ինչը թույլ է տալիս իրականացնել հարմար նավարկում ողջ DjVu ֆայլի մեջ։

Օգտագործվող տեխնոլոգիաները

DjVu-ում գունավոր պատկերները սեղմելու օգտագործվում է հատուկ տեխնոլոգիա, որը պատկերը բաժանում է 3 շերտի՝ առջևի պլան, հետևի պլան և սև-սպիտակ (մեկբիթանի) երեսի։ Երեսը պահպահում է իսկական պատկերի չափսը, հենց դա էլ պարունակում է տեքստի պատկերը և այլ հստակ տվյալներ։ Հետևի պլանի չափսը, որում մնում են էջի նկարազարդումներն ու հյուսվածները, տարածք խնայելու համար փոքրացվում է։ Առջևի պլանը պարունակում է երեսի գունային ինֆորմացիան։ Առևի պլանի չափսը սովորաբար շատ ավելի է փոքրացվում։ Այնուհետև հետևի և առջևի պլանները вейвлет-преобразования օգնությամբ խտացվում են, իսկ երեսը՝ JB2 ալգորիթմով։

JB2 ալգորիթմի առանձնահատկությունն այն է, որ այն էջի վրա փնտրում կրկնվող սիմվոլներ և պահպանում է դրանց պատկերը միայն մեկ անգամ։ Մի քանի էջից բաղկացած փաստաթղթերում յուրաքանչյուր էջ օգտագործում է ընդհանուր «բառարանի» պատկերները։

Գրքերի մեծ մասը սեղմելու համար կարելի է օգտվել միայն երկու գույնից։ Այս դեպքում օգտագործվում է միայն մեկ շերտ, ինչը թույլ է տալիս հասնել սեղմման ռեկորդային աստիճանի։ Սև ու սպիտակ նկարազարդումներով սովորական գրքում, որը սկանավորվել է 600 dpi խտությամբ, էջի չափսը կազմում է միջինում 15 ԿԲ, այսինքն՝ մոտավորապես 100 անգամ ավելի փոքր, քան իրական ֆայլը։ Բարդ հետևի պլանի դեպքում հնարավոր է սեղմել իրական չափից 4-ից 10 անգամ։ Սակայն DjVu-ի լռելյայն կարգավորումներում օգտագործվում է «Տվյալների կորուստներով սեղմում» ֆունկցիան, այդ պատճառով էլ շատ կարևոր փաստաթղթերը պահպանելիս սովորաբար ընտրվում է «առանց կորուստների»՝ PNG, JPEG 2000, TIFF և այլ տարբերակներ։ DjVu-ում կարելի է նաև օգտագործել «տվյալների սեղմում առանց կորուստների» ֆունկցիան։ Այսպես օրինակ DjVuLibre փաթեթի CJB2 գործիքը հնարավորություն է ընձեռում սեղմել տվյալները «առանց կորուստների»։

DjVu ֆորմատում հիմնականում գործում են մի քանի տեխնոլոգիաներ, այդ թվում նար AT&T լաբորատորիայի մշակածը.

  • սկանավորված պատկերից տեքստի՝ ֆոնից առանձնացնելու ալգորիթմ,
  • Ֆոնի սեղմման Վեյվլետային ալգորիթմ IW44,
  • Սև-սպիտակ պատկերների սեղմման JB2 ալգորիթմ,
  • Սեղմման ունիվերսալ ալգորիթմ ZIP,
  • «Պահանջի դեպքում» սեղմածի ընդլայնման ալգորիթմ
  • Պատկերների «քողարկման» ալգորիթմ։

Պատկերների տեքստային ներկայացումը

DjVu ֆորմատը նախատեսում է «տեքստային շերտի» առկայություն, որը պարունակում է էջի տեքստը (Օգտագործվում է տեքստը հեշտությամբ փնտրելու և պատճենելու համար)։ Այն դեպքում, երբ տեքստային շերտը հասանելի չէ, տեքստ ստանալու միակ եղանակը օպտիկական նիշերի ճանաչումն է այլ ծրագրերի միջոցով։

Արտոնագիր

AT&T ընկերությունը վաճառել է տեխնոլոգիան LizardTech ընկերությանը, որը փորձել է օգտագործել այն իր կոմերցիոն շահերից ելնելով, բայց շնորհիվ ֆորմատի բաց լինելու[1] DjVu փաստաթղթերի ստեղծման և դիտման համար գոյություն ունի Ազատ ծրագրային ապահովում, որը հասանելի է մի շարք պլատֆորմաների։ 2008 թվականի հուլիսի 1-ին LizardTech ընկերությունը DjVu-ի կառավարումը հանձնեց Celartem մայր ընկերությանը[2],, իսկ 2009 թվականի հունիսի 10-ին Celartem ընկերությունը փոխանցեց իր DjVu տեխնոլոգիայի իրավունքները Caminova ընկերությանը[3]։.

Գոյություն ունի ազատ ծրագիր, որը թողարկվում է GNU GPL լիցենզիայով, DjVuLibre գրադարան և դիտարկիչներ և ծրագիր-կոդավորիչներ։

DjVu ֆայլերի հետ աշխատելու համար ծրագրեր

Դիտում

Windows օպերացիոն համակարգի համար՝

Linux օպերացիոն համակարգի համար՝

UNIX օպերացիոն համակարգի համար՝

  • DjVuLibre DjView

OS X օպերացիոն համակարգի համար՝

  • Caminova Official DjVu Browser Plug-in
  • DjVuLibre DjView
  • MacDjView Desktop Viewers

Android օպերացիոն համակարգի համար՝

iOS օպերացիոն համակարգի համար՝

BlackBerry OS օպերացիոն համակարգի համար՝

  • DjVuBB.
Խմբագրում
  • DjVuLibre;
  • Document Express՝ հեղինակի պաշտոնական ծրագիրը,
DJVU փաստաթղթում տեքստի ճանաչման (OCR) հնարավորության ավելացում փնտրելու և պատճենելու համար,
  • any2djvu՝ առցանց ծառայություն, որը աշխատում է միայն անգլալեզու տեքստերի հետ[4].
  • DjvuOCR՝ DJVU փաստաթղթում ավելացնում է տեքստերի ճանաչում[5].
  • ABBYY FineReader՝ պահպանում է պրոյեկտը DJVU տեսքով, OCR շերտով (սկսած 10-րդ տարբերակից)

Կարդացեք նաև

Ծանոթագրություններ

  1. Лицензия
  2. «Пресс-релиз LizardTech». Արխիվացված է օրիգինալից 2008 թ․ սեպտեմբերի 28-ին. Վերցված է 2014 թ․ սեպտեմբերի 25-ին.
  3. «Пресс-релиз LizardTech». Արխիվացված է օրիգինալից 2009 թ․ հուլիսի 16-ին. Վերցված է 2014 թ․ սեպտեմբերի 25-ին.
  4. «any2djvu - онлайн-конвертирование в DJVU». Արխիվացված է օրիգինալից 2011 թ․ մայիսի 22-ին. Վերցված է 2014 թ․ սեպտեմբերի 25-ին.
  5. сайт разработки DjvuOCR

Արտաքին հղումներ