Українська національна велика мовна модель (LLM) побачить світ у формі бета-тестування весною 2026 року. Фінансування розробки здійснює Київстар, а навчання моделі спирається на сімейство моделей Gemma від Google.

Українська національна LLM (велика мовна модель) з’явиться у бета-тестуванні навесні 2026 року, як поінформував у середу перший заступник прем’єр-міністра – міністр цифрової трансформації Михайло Федоров у Telegram, поділившись інформацією про поточний етап розробки, повідомляє УНН.
Національна LLM буде доступна для бета-тестування навесні. Завдання України – потрапити в першу трійку країн за розвитком штучного інтелекту у світовому масштабі. Одним з найзначніших кроків є запуск власної великої мовної моделі, яка тренується на унікальних українських даних
– зазначив Федоров.
Хто здійснює розробку національної LLM
“Створення LLM потребує значних ресурсів, а під час війни всі кошти повинні бути спрямовані на оборону. Тому Київстар виступає технічним партнером проєкту. Компанія надає фінансову підтримку розробці національної великої мовної моделі, а згодом передасть її державі”, – підкреслив віцепрем’єр.
За його словами, українська LLM буде навчатися на основі сімейства моделей Gemma від Google – нашого стратегічного партнера. “Це передові технології, які ми адаптуємо до української мови та реалій”, – зауважив він.
“Якість розробки національної LLM перевірятиме група незалежних експертів з різних сфер, які оцінюватимуть модель на: технічну досконалість; етичність та безпеку для користувачів; володіння українською мовою; розуміння національного контексту”, – оголосив Федоров.
Який поточний етап розробки
“Зараз триває найважливіша частина роботи – збір інформації для навчання LLM. Для високої якості даних з інтернету недостатньо, тому співпрацюємо з державними установами, медіа, університетами та іншими організаціями – це терабайти унікальної інформації”, – поділився Федоров.
Одночасно, за його словами, формується “правова база, щоб відповідально використовувати дані, які нам надають для тренування моделі”.
Крім того, він повідомив, що “група експертів вже працює над створенням критеріїв оцінки – тестів для мовної моделі, які допоможуть вимірювати та покращувати її якість”. Це, як пояснив віцепрем’єр, “дозволить утримувати фокус на ефективності та надійності мовної моделі”.
Коли очікувати на вихід української LLM
У січні 2026 року ми вже матимемо: початкову базу текстів для тренування LLM; вдосконалений токенізатор – інструмент, який розбиває слова на частини, щоб LLM опрацьовувала мову швидше та ефективніше; власні критерії оцінки для визначення якості. Весною 2026 року плануємо розпочати бета-тестування. А ім’я для української LLM оберуть самі українці – у січні запустимо голосування в “Дії”. Перетворимо Україну на AI-first державу
– резюмував Федоров.
Додатково
Минулого року в березні, оголошуючи про початок розробки, Федоров стверджував, що запуск національної LLМ дасть поштовх масовому виробництву українських ШІ-інструментів. За його словами, тисячі ШІ-продуктів базуються на LLM – віртуальні помічники, такі як ChatGPT, генератори тексту, як Notion AI, інструменти для програмування, такі як GitHub Copilot.
