Informace o projektu
Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum (LINDAT-Clarin)

Informace

Projekt nespadá pod Ústav výpočetní techniky, ale pod Fakultu informatiky. Oficiální stránka projektu je na webu muni.cz.

Kód projektu

LM2015071

Období řešení

1/2016 - 12/2019

Investor / Programový rámec / typ projektu

Ministerstvo školství, mládeže a tělovýchovy ČR

Velké infrastruktury pro výzkum, vývoj a inovace

Fakulta / Pracoviště MU

Fakulta informatiky

Spolupracující organizace

Akademie věd České republiky
Univerzita Karlova

Odpovědná osoba prof. RNDr. Jan Hajič, Dr.

Západočeská univerzita v Plzni

Projekt LINDAT-Clarin je koncipován jako český „uzel“ mezinárodní sítě Clarin (Common Language Resources and Technology Infrastructure. Centrum LINDAT-Clarin bude tedy v českém jazykovém prostředí zaměřeno na sběr jazykových dat a především jejich anotaci (tj. formální manuální, poloautomatickou a automatickou jazykovou analýzu). Sběr a anotace budou probíhat v takovém rozsahu, kvalitě a technologické přípravě (specifikace, schémata, formáty), která bude přímo využitelná jak v humanitní oblasti (jazykovědný a mezioborový výzkum, kde přirozený jazyk hraje podstatnou roli), tak i pro výzkum a vývoj v oblasti jazykových technologií za použití moderních statistických a hybridních metod.
Náplň práce centra a jeho výsledky se dotýkají řady oborů – v humanitních vědách to jsou jazykověda obecná a pro jazykověda zabývající se konkrétními jazyky, zejména češtinou, dále překladatelství, lexikografie, sociolingvistika, částečně i obory příbuzné (psychologie, sociologie, knihovnictví, neurovědy, cognitive science) s významným přesahem do informatiky (computer science, computational linguistics), matematiky (statistika a pravděpodobnost), a elektrotechniky (zpracování akustického signálu).

Publikace

Počet publikací: 39

2019

A Distributional Multi-word Thesaurus in Sketch Engine

JAKUBÍČEK Miloš RYCHLÝ Pavel

Článek ve sborníku

Proceedings of the Thirteenth Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2019, rok: 2019
Automatically Created Noun Explanations for English

STARÁ Marie

Článek ve sborníku

Proceedings of the Thirteenth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2019, rok: 2019
Automating dictionary production: a Tagalog-English-Korean dictionary from scratch

BAISA Vít BLAHUŠ Marek CUKR Michal HERMAN Ondřej JAKUBÍČEK Miloš KOVÁŘ Vojtěch MEDVEĎ Marek MĚCHURA Michal RYCHLÝ Pavel SUCHOMEL Vít

Článek ve sborníku

Proceedings of the 6th Biennial Conference on Electronic Lexicography, rok: 2019
Discriminating Between Similar Languages Using Large Web Corpora

SUCHOMEL Vít

Článek ve sborníku

Proceedings of the Thirteenth Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2019, rok: 2019
Evaluation and Error Analysis of Rule-based Paraphrase Generation for Czech

BURGEROVÁ Veronika HORÁK Aleš

Článek ve sborníku

Proceedings of the Thirteenth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2019, rok: 2019
Neural Tagger for Czech Language: Capturing Linguistic Phenomena in Web Corpora

NEVĚŘILOVÁ Zuzana STARÁ Marie

Článek ve sborníku

Proceedings of the Thirteenth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2019, rok: 2019
SiLi Index: Data Structure for Fast Vector Space Searching

HERMAN Ondřej RYCHLÝ Pavel

Článek ve sborníku

Proceedings of the Thirteenth Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2019, rok: 2019
SkELL Corpora as a Part of the Language Portal Sonaveeb: Problems and Perspectives

KOPPEL Kristina KALLAS Jelena KHOKHLOVÁ Maria SUCHOMEL Vít BAISA Vít MICHELFEIT Jan

Článek ve sborníku

Proceedings of the 6th Biennial Conference on Electronic Lexicography, rok: 2019
Structured Information Extraction from Pharmaceutical Records

BAMBUROVÁ Michaela NEVĚŘILOVÁ Zuzana

Článek ve sborníku

Proceedings of the Thirteenth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2019, rok: 2019
VerbaLex - Comprehensive Dictionary of Czech Verb Valencies

HLAVÁČKOVÁ Dana HORÁK Aleš PALA Karel

Článek v odborném periodiku

Korpus - gramatika - axiologie, rok: 2019, ročník: 2019, vydání: 19

Informace o projektuProjekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum (LINDAT-Clarin)

Informace

Publikace

2019

Informace o projektu
Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum (LINDAT-Clarin)