Informace o projektu
Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum
(LINDAT-Clarin)
- Kód projektu
- LM2010013
- Období řešení
- 11/2010 - 12/2015
- Investor / Programový rámec / typ projektu
-
Ministerstvo školství, mládeže a tělovýchovy ČR
- Velké infrastruktury pro výzkum, vývoj a inovace
- Fakulta / Pracoviště MU
- Fakulta informatiky
- Spolupracující organizace
-
Ústav pro jazyk český AV ČR, v. v. i.
Univerzita Karlova
- Odpovědná osoba Ing. Jana Kalinová, Ph.D.
- Odpovědná osoba prof. Ing. Jan Tříska, CSc.
Projekt LINDAT-Clarin bude napojen na projekt Clarin, ESFRI projekt (FP7-RI-2122230) pro jazykovou infrastrukturu v humanitních vědách (Common Language Resources and Technology Infrastructure)
Uzel Clarin bude realizován čtyřmi partnery projektu. Toto ZSPO bude realizovat organizačně i technologicky veškeré funkce uzlu (Centrum "A" v terminologii Clarin) pro budoucí asociaci Clarin-ERIC, a bude pověřeno výkonem funkcí MŠMT v Clarin-ERIC (kromě pravomocí rozhodovacích). Navrhovaným sídlem této ZSPO je budova sekce informatiky MFF UK na Malostranském náměstí 25, 11800 Praha 1.
Národní úkoly při tvorbě a dodávání jazykových dat, úkoly vzdělávací a výzkumné budou plnit jednotlivé zakladatelské organizace v jejich stávající struktuře. Organizačně budou jednotlivá pracoviště podporovaná z prostředků LINDAT-Clarin oddělena v rámci těchto organizací.
Publikace
Počet publikací: 91
2013
-
Towards taggers and parsers for Slovak
Human Language Technologies as a Challenge for Computer Science and Linguistics. Proceedings of the 6th Language and Technology Conference, rok: 2013
-
Type-based Search of Idiomatic Expression
Seventh Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2013, rok: 2013
-
Typos in Czech Corpora
Seventh Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2013, rok: 2013
-
Web Application for Semantic Network Editing
Seventh Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2013, rok: 2013
-
Web Spam
Proceedings of the 8th Web as Corpus Workshop (WAC-8) @Corpus Linguistics 2013, rok: 2013
-
百億語のコーパスを用いた日本語の語彙・文法情報のプロファイリング
Rok: 2013
2012
-
A database of semantic clusters of verb usages
Proceedings of the 8th International Conference on Language Resources and Evaluation (LREC 2012), rok: 2012
-
Adaptation of Czech Parsers for Slovak
RASLAN 2012 Recent Advances in Slavonic Natural Language Processing, rok: 2012
-
Behaviour of the Czech Suffix -ák – A Case Study
Proceedings of Recent Advances in Slavonic Natural Language Processing, RASLAN 2012, rok: 2012
-
Building a 70 billion word corpus of English from ClueWeb
Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12), rok: 2012