Český národní korpus

Český národní korpus (ČNK) je soubor jazykových korpusů, různě vybraných a uspořádaných sbírek elektronicky zaznamenaných textů pro češtinu. Slouží jako datová základna pro vědecké studium psané i mluvené češtiny, pro tvorbu jazykových slovníků, počítačových překladačů a korektorů a podobně. ČNK buduje a spravuje Ústav Českého národního korpusu při Filozofické fakultě UK v Praze.[1] Ředitelem ústavu byl Mgr. Michal Křen, Ph.D. a po něm je ředitelem Mgr. Michal Škrabal, Ph.D.[2]

Software

Jako korpusový manažer je užíván otevřený software NoSketch Engine, jehož autorem je docent Pavel Rychlý z Centra zpracování přirozeného jazyka na Fakultě informatiky Masarykovy univerzity.[3] Tento software dovoluje prohledávání a správu korpusů a skládá se ze dvou hlavních modulů – korpusového manažeru Manatee a jeho webového grafického rozhraní Bonito. ČNK ovšem místo Bonita využívá vlastní software KonText[4].

Odkazy

Reference

  1. https://wiki.korpus.cz/doku.php/cnk:uvod#kdo_tvori_cesky_narodni_korpus
  2. Ústav: Lidé [online]. [cit. 2023-10-11]. Dostupné online. 
  3. RYCHLÝ, Pavel. Manatee/Bonito - A Modular Corpus Manager. 1st Workshop on Recent Advances in Slavonic Natural Language Processing (RASLAN 2007). 2007, roč. První, s. 65–70. Dostupné online. ISBN 978-80-210-4471-5. (anglicky) 
  4. Tomáš Machálek (2020): KonText: Advanced and Flexible Corpus Query Interface. In: Proceedings of LREC 2020, s. 7005–7010. Dostupné online.

Související články

Externí odkazy

  • Vstupní stránka ČNK
  • NoSketch Engine
Pahýl
Pahýl
Tento článek je příliš stručný nebo postrádá důležité informace.
Pomozte Wikipedii tím, že jej vhodně rozšíříte. Nevkládejte však bez oprávnění cizí texty.
Čeština
Bohemistika
Variety češtiny
Lexikografie
Gramatika

Fonologie
Pravopis
Příručky

Autoritní data Editovat na Wikidatech
  • LCCN: no2005122116
  • NLI: 987007597455605171