počítačová lingvistika vs. zpracování přirozeného jazyka
oblasti počítačové lingvistiky
morfologie (tvarosloví), syntaxe (skladba), sémantika (význam), formalismy (syntaktické), korpusová lingvistika, strojový překlad, rozpoznávání/generování mluvené řeči, vyhledávání informací v textu, dialogové systémy
historie
morfologie
další pojmy
morfologická typologie jazyků
přístupy ke zpracování morfologie
Two-Level Morphology
morfologie založená na vzorech
česká morfologie
činnosti využívající morfologii
Částečná morfologická desambiguace založená na pravidlech
značkování (POS tagging)
skryté Markovovy modely (HMM)
kontrola překlepů
systém ASIMUT
systém Mozaika
používají se dva hlavní datové typy
závislostní strom
složkový strom
neprojektivní konstrukce
Q-systémy
-DANS-
, -HORS-
, -ET-
, -NON-
, …předchůdci transformační gramatiky
transformační gramatika
tree adjoining grammars
kategoriální gramatiky
X/Y Y => X
Y Y\X => X
unifikační gramatiky
klíč : hodnota
funkční generativní popis
valence
kontrola gramatické správnosti
studium jazyka
jazykový korpus
charakteristika moderních korpusů
typy korpusů
konzistence korpusových anotací
Brown Corpus of Standard American English
Penn Treebank
Český národní korpus
Pražský závislostní korpus (PDT)
prosazení závislostních stromů
proč je to tak těžké?
trojúhelník strojového překladu
první generace
první úspěšný komerční systém
další významné systémy
strojem podporovaný překlad
RUSLAN
systém Česílko
PC Translator 2003
statistický překlad
metrika BLEU
základní poznámky k sémantice
lexikální sémantika
jak reprezentovat význam slov
reprezentace významu věty
anafora
anaforický vztah předchůdce – následník
Zásoba sdílených znalostí