Hierarchia Chomskiego

hierarchia klas języków formalnych
(Przekierowano z Hierarchia Chomsky'ego)

Hierarchia Chomskiego – stworzona przez Noama Chomskiego hierarchia klas języków formalnych.

Zestawy inkluzyjne opisane przez hierarchię Chomskiego

Hierarchia składa się z czterech klas:

Język należy do danej klasy wtedy i tylko wtedy, gdy jest możliwe zbudowanie gramatyki formalnej, która generuje dany język, a której reguły nie wykraczają poza ograniczenia dla danej klasy.

Każdy język określonej klasy należy jednocześnie do każdej klasy poniżej, czyli:

  • Każdy język regularny jest także bezkontekstowy.
  • Każdy język bezkontekstowy jest także kontekstowy.
  • Każdy język kontekstowy jest rekurencyjnie przeliczalny[1].

Zostało także udowodnione, że istnieje teoretyczny algorytm, który jest w stanie przekształcić daną gramatykę formalną w leżącą niżej w hierarchii[2].

Języki regularne (typu 3)

edytuj

Język regularny to język, który można wygenerować za pomocą gramatyki liniowej – takiej, która po lewej stronie reguł ma pojedyncze nieterminale, po prawej zaś słowa zawierające co najwyżej jeden nieterminal (jeśli znajduje się on na początku lub na końcu każdego słowa – jest to odpowiednio gramatyka lewostronnie lub prawostronnie liniowa). Poprawne reguły to na przykład:

 
 
 
 
 
 

Języki bezkontekstowe (typu 2)

edytuj

Język bezkontekstowy to język, który można wygenerować za pomocą gramatyki bezkontekstowej, która po lewej stronie reguł ma pojedyncze nieterminale, po prawej zaś dowolne słowa, np.:

 
 
a także dowolne reguły gramatyk regularnych.

Języki kontekstowe (typu 1)

edytuj

Język kontekstowy to język, który można wygenerować za pomocą gramatyki kontekstowej, której produkcje są postaci   gdzie   i   są dowolnymi słowami, A jest symbolem nieterminalnym,   – niepustym słowem.

 
 
 
 

Dodatkowo pozwala się na regułę postaci   tzn. z symbolu startowego w słowo puste, ale tylko w przypadku jeżeli słowo startowe nie występuje po prawej stronie żadnej reguły.

Nie każda reguła języków bezkontekstowych jest poprawną regułą języków kontekstowych. Reguły postaci   są dozwolone tylko w tych pierwszych.

Języki rekurencyjnie przeliczalne (typu 0)

edytuj

Język rekurencyjnie przeliczalny to język, dla którego istnieje gramatyka typu 0, której produkcje są postaci   gdzie   i   są dowolnymi słowami.

Zależności między klasami

edytuj

Ponieważ (z poprawką na zależność między gramatykami bezkontekstowymi a kontekstowymi) gramatyka typu o mniejszym numerze dopuszcza wszystkie reguły gramatyk o numerze większym, klasy języków kolejnych typów zawierają się w sobie. Zawierania te są ostre, tzn. istnieją języki bezkontekstowe, które nie są regularne, kontekstowe, które nie są bezkontekstowe, oraz rekurencyjnie przeliczalne, które nie są kontekstowe.

Znaczenie

edytuj

Hierarchia Chomskiego wydziela 4 klasy języków, ale możliwe jest stworzenie wielu innych klas, przez odmienne ograniczenia na postać reguł czy inne właściwości języka. Trzy z czterech klas są dość ważne – klasa języków rekurencyjnie przeliczalnych ma dokładnie taką moc jak maszyny Turinga, języki bezkontekstowe odpowiadają niedeterministycznym automatom ze stosem, regularne zaś automatom skończonym.

Przypisy

edytuj

Bibliografia

edytuj
  • Martin D. Davis, Ron Sigal, Elaine J. Weyuker: Computability, Complexity, and Languages. Morgan Kaufmann Publishers, 1994. ISBN 1-4933-0034-2.