Detecting Annotation Errors in a Corpus by Induction of Syntactic Patterns


Publikace nespadá pod Ústav výpočetní techniky, ale pod Fakultu informatiky. Oficiální stránka publikace je na webu

NEPIL Miloslav

Rok publikování 2003
Druh Článek ve sborníku
Konference Text, Speech and Dialogue: Sixth International Conference, TSD 2003
Fakulta / Pracoviště MU

Fakulta informatiky

Obor Informatika
Klíčová slova error detection; morphological tagging; relational rule induction; syntactic patterns
Popis This paper brings a new method for acquisition of syntactic patterns capable of detecting errors in annotated corpora. These patterns are acquired semi-automatically, by means of an inductive logic programming (relational data mining) system followed by a human expert supervision. The patterns acquired have been used for automatic detection and subsequent manual correction of the annotation errors found in DESAM, a morphologically annotated corpus of written Czech.
Související projekty:

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.

Další info