Багатомовні корпуси Інституту славістики Польської академії наук – CLARIN-PL. Польсько-литовський паралельний корпус "2" та Польсько-український паралельний корпус

dc.contributor.authorЛевчук, Павло
dc.contributor.authorРошко, Данута
dc.contributor.authorРошко, Роман
dc.date.accessioned2021-01-22T20:39:51Z
dc.date.available2021-01-22T20:39:51Z
dc.date.issued2020
dc.description.abstractУ статті описано групу Clarin-PL, яка є польським представництвом Європейської дослідницької інфраструктури CLARIN ERIC. Представлено завдання та цілі інфраструктури CLARIN ERIC та групи Clarin-PL. Як приклади подано окремі мовні засоби та ресурси, розроблені групою Clarin-PL. Особливу увагу присвячено тим багатомовним ресурсам, головна роль у побудові яких належить команді Інституту славістики Польської академії наук (ІС ПАН), зокрема це два розширені багатомовні корпуси сучасних текстів Polish-Lithuanian Parallel Corpus "2" i Polish-Ukrainian Parallel Corpus. Схарактеризовано провідну роль ІС ПАН у побудові групою Clarin-PL багатомовних корпусів. Окреслено нові, вже розпочаті та заплановані завдання, пов’язані з побудовою багатомовних ресурсів Clarin-PL.uk_UA
dc.description.abstractBackground. This article describes the Clarin-PL consortium, which represents the Polish contribution to the CLARIN ERIC European research infrastructure. The aims and tasks of both CLARIN ERIC and Clarin-PL are presented. Purpose. Presentation of the achievements of researchers from the Institute of Slavic Studies of the Polish Academy of Sciences in the field of creating and developing multilingual corpora, including tagging and parallelizing texts. Methods. The team of the Institute of Slavic Studies of the Polish Academy of Sciences adopted common assumptions for the construction of multilingual corpora of the Slavic and Baltic languages. Namely, the corpora contains selected modern texts that represent all functional styles to the greatest extent. Mutual translations are preferred. Results. The article presents a description of selected multilingual resources created by Clarin-PL and made available online via the Clarin-PL website, which a team from the Institute of Slavic Studies of the Polish Academy of Sciences (IS PAN) played a key role in creating. These resources are two expanded multilingual corpora of parallel contemporary texts: the Polish-Lithuanian Parallel Corpus 2 and the Polish-Ukrainian Parallel Corpus. Due to the fact that IS PAN played a leading role in the development of the multilingual corpora in the Clarin-PL consortium, it was decided to present an outline of corpus linguistics development in IS PAN. Discussion. The European Clarin-ERIC infrastructure is steadily developing. Scattered resources (previously created and newly emerging) are combined into a coherent whole. The Polish Consortium Clarin-PL primarily creates and develops resources and tools for the Polish language. The aim of these works is to provide the recipient with the highest possible quality of corpora compatible with constantly changing standards, allowing for the versatile use of tools.en_US
dc.identifier.citationЛевчук П.. Багатомовні корпуси Інституту славістики Польської академії наук – CLARIN-PL. Польсько-литовський паралельний корпус "2" та Польсько-український паралельний корпус / Павло Левчук, Данута Рошко, Роман Рошко // Мова: класичне - модерне - постмодерне. - 2020. - Вип. 6. - С. 146-170. - https://doi.org/10.18523/lcmp2522-9281.2020.6.146-170uk_UA
dc.identifier.issn2616-7115
dc.identifier.urihttps://doi.org/10.18523/lcmp2522-9281.2020.6.146-170
dc.identifier.urihttps://ekmair.ukma.edu.ua/handle/123456789/19294
dc.language.isoukuk_UA
dc.publisherДух і Літераuk_UA
dc.relation.sourceМова: класичне - модерне - постмодернеuk_UA
dc.statusfirst publisheduk_UA
dc.subjectCLARIN ERICen_US
dc.subjectClarin-PLen_US
dc.subjectпаралельні корпусиuk_UA
dc.subjectпольсько-український паралельний корпусuk_UA
dc.subjectпольсько-литовський паралельний корпусuk_UA
dc.subjectстаттяuk_UA
dc.subjectParallel Corpusen_US
dc.subjectPolish-Lithuanian Parallel Corpusen_US
dc.subjectPolish-Ukrainian Parallel Corpusen_US
dc.titleБагатомовні корпуси Інституту славістики Польської академії наук – CLARIN-PL. Польсько-литовський паралельний корпус "2" та Польсько-український паралельний корпусuk_UA
dc.title.alternativeMultilingual corps institute of slavic studies, Polish Academy of Sciences – Clarin PL. Polish-Lithuanian Parallel Corpus “2” and Polish-Ukrainian Parallel Corpusen_US
dc.typeArticleuk_UA
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Bahatomovni_korpusy_Instytutu_slavistyky_Polskoi_akademii_nauk_CLARIN-PL. Polsko-lytovskyi_paralelnyi_korpus_2_ta_Polsko-ukrainskyi_paralelnyi_korpus.pdf
Size:
559.87 KB
Format:
Adobe Portable Document Format
Description:
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
7.54 KB
Format:
Item-specific license agreed upon to submission
Description:
Collections