Building Evaluation Dataset for Textual Entailment in Czech

Varování

Publikace nespadá pod Ústav výpočetní techniky, ale pod Fakultu informatiky. Oficiální stránka publikace je na webu muni.cz.

Autoři	NEVĚŘILOVÁ Zuzana
Rok publikování	2012
Druh	Článek ve sborníku
Konference	Sixth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2012
Fakulta / Pracoviště MU	Fakulta informatiky
Citace
www	https://nlp.fi.muni.cz/raslan/2012/paper03.pdf
Obor	Informatika
Klíčová slova	textual entailment; evaluation data set; Czech language; paraphrasing
Popis	Rozpoznání textového vyplývání je jednou z disciplín zpracování přirozeného jazyka. V současnosti existuje několik systémů pro rozpoznání textového vyplývání, jejichž některé moduly jsou jazykově závislé. Navíc rozsáhlé datové soubory pro vyhodnocení úspěšnosti takových programů jsou témař výhradně připraveny pro zpracování angličtiny. Popisujeme metody, pomocí kterých je možné získat testovací data pro český systém pro rozpoznání textového vyplývání. Použili jsme metody pro automatickou extrakci faktů, založené na extrakci vzorů z korpusu. Navíc jsme zahrnuli testy čtenářské gramotnosti pro děti i studenty středních škol. Hlavní přínos tohoto čllánku spočívá v klasifikaci obtížnosti jednotlivých úloh v rozpoznání textového vyplývání.
Související projekty:	Temporální aspekty znalostí a informací Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum