Abstract:
Cучасні корпуси текстів природних мов, щоб виконувати покладені на них функції, крім розмітки на рівні первинних даних, тобто формального опису структури документа, повинні бути анотованими, чи доповненими, лінгвістичною анотацією. Традиційно у корпусній лінгвістиці під лінгвістичною анотацією розуміють а) довільну лінгвістичну інформацію про лінгвально релевантні одиниці текстових даних, подану через формальний код, б) практику введення формалізованої лінгвістичної інформації в електронний текст і в) наявність такої інформації у тексті.