Building Evaluation Dataset for Textual Entailment in Czech
Autoři | |
---|---|
Rok publikování | 2012 |
Druh | Článek ve sborníku |
Konference | Sixth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2012 |
Fakulta / Pracoviště MU | |
Citace | |
www | https://nlp.fi.muni.cz/raslan/2012/paper03.pdf |
Obor | Informatika |
Klíčová slova | textual entailment; evaluation data set; Czech language; paraphrasing |
Popis | Rozpoznání textového vyplývání je jednou z disciplín zpracování přirozeného jazyka. V současnosti existuje několik systémů pro rozpoznání textového vyplývání, jejichž některé moduly jsou jazykově závislé. Navíc rozsáhlé datové soubory pro vyhodnocení úspěšnosti takových programů jsou témař výhradně připraveny pro zpracování angličtiny. Popisujeme metody, pomocí kterých je možné získat testovací data pro český systém pro rozpoznání textového vyplývání. Použili jsme metody pro automatickou extrakci faktů, založené na extrakci vzorů z korpusu. Navíc jsme zahrnuli testy čtenářské gramotnosti pro děti i studenty středních škol. Hlavní přínos tohoto čllánku spočívá v klasifikaci obtížnosti jednotlivých úloh v rozpoznání textového vyplývání. |
Související projekty: |