Slovotvorné vztahy v českém WordNetu
Autoři | |
---|---|
Rok publikování | 2007 |
Druh | Konferenční abstrakty |
Fakulta / Pracoviště MU | |
Citace | |
Popis | V článku popisujeme obohacení českého WordNetu o derivační vztahy tvořící slovotvorná hnízda nebo (v jiné terminologii) sémantické podsítě. Derivační vztahy v češtině jsou natolik pravidelné, že je můžeme přidat do českého WordNetu téměř automaticky. K získání slovotvorných hnízd využíváme derivační verze morfologického analyzátoru Ajka, který v sobě obsahuje formální pravidla popisující základní a produktivní slovotvorné vztahy. Dále pracujeme s nástrojem, derivačním webovým rozhraním, které umožňuje získávat dvojice fundující : fundovaný na velkých souborech dat. To umožňuje poloautomaticky odvozovat potřebné tvary pomocí substantivních derivačních sufixů a slovesných prefixů a na tomto základě pak lze vhodně rozhodovat o sémantické povaze jednotlivých derivací. Zatím jsme zpracovali cca 22 českých substantivních derivačních sufixů a cca 16 slovesných prefixů, dospěli jsme tu k souboru 14 derivačních vztahů, které jsou charakterizovány sémanticky, přičemž použité značkování zachycuje sémantické kategorie vyjadřované jednotlivými derivačními vztahy, i když v některých případech rozdíly mezi nimi spočívají jen v přináležitosti ke slovnímu druhu. |
Související projekty: |