Finding Semantically Related Words in Large Corpora

Varování

Publikace nespadá pod Ústav výpočetní techniky, ale pod Fakultu informatiky. Oficiální stránka publikace je na webu muni.cz.
Autoři

SMRŽ Pavel RYCHLÝ Pavel

Rok publikování 2001
Druh Článek ve sborníku
Konference Text, Speech and Dialogue, 4th International Conference, TSD 2001
Fakulta / Pracoviště MU

Fakulta informatiky

Citace
www http://nlp.fi.muni.cz/publications/tsd2001_smrz_pary/
Obor Počítačový hardware a software
Klíčová slova natural language processing; large corpus; semantically related words
Popis The paper deals with the linguistic problem of fully automatic grouping of semantically related words. We discuss the measures of semantic relatedness of basic word forms and describe the treatment of collocations. Next we present the procedure of hierarchical clustering of a very large number of semantically related words and give examples of the resulting partitioning of data in the form of dendrogram. Finally we show a form of the output presentation that facilitates the inspection of the resulting word clusters.
Související projekty:

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.

Další info