В Україні почали створення корпусу кримськотатарської мови: внесли вже понад 700 матеріалів

У межах роботи над Національним корпусом кримськотатарської мови фахівці опрацювали понад 700 матеріалів кримськотатарською мовою, розробили словник лематизації для запуску модуля з пошуку слів на онлайн-платформі.

Про це інформує УНН, посилаючись на Telegram Мінреінтеграції.

Деталі

У межах реалізації Стратегії розвитку кримськотатарської мови на 2022-2032 роки Мінреінтеграції ініціювало створення Національного корпусу кримськотатарської мови (НККМ), онлайн-платформи для дослідження мови, що працюватиме на даних із текстових матеріалів кримськотатарською.

З жовтня 2022 року фахівці зібрали друковані та електронні тексти кримськотатарською мовою для їх подальшого імпорту на платформу Sketch Engine. Зазначається, що за майже пів року вони опрацювали та внесли до каталогу понад 700 матеріалів, серед яких твори кримськотатарських авторів, журнали, газети, підручники, документи міжнародних організацій, субтитри фільмів тощо.

Окрім цього, у межах роботи над НККМ розробили словник лематизації.

"Мається на увазі створення реєстру (бази даних) слів з позначенням їх початкової форми та мовних характеристик (частина мови, рід, число тощо). Це потрібно для запуску модуля з пошуку слів на онлайн-платформі Нацкорпусу. Розробка відповідного програмного забезпечення триває", — йдеться в повідомлення.

Проєкт реалізовують за підтримки Мінреінтеграції, швейцарсько-української Програми EGAP, що виконується Фондом Східна Європа, та Київського національного університету імені Тараса Шевченка.

Джерело

Новости Крыма