Facebook Pixel

Коли відкриють дані та проведуть перепис населення – інтерв’ю з головою Держстату

Дані Державної служби статистики – основний інструмент для бізнесу, щоб він зрозумів стан економіки України. Протягом останніх двох років після повномасштабного вторгнення росії Держстат не публікує дані щодо багатьох економічних показників. Це ускладнює українським аналітикам створення прогнозів та досліджень, яких потребують українські компанії.

У Держстаті пояснюють це безпекою та створенням ускладнень для розвідки росії, українські аналітики наполягають, що це лише відмовка і установа публікує неважливі для розвідки дані.

The Page вирішив поговорити з головою Держстату Ігорем Вернером, щоб зрозуміти подальшу стратегію публікування даних. А також поцікавитися, як проходить реформа відомства, чому новий опублікований сайт вийшов незручним і чи буде Держстат рахувати кількість українців після масової хвилі міграції.

Евакуація даних Держстату після російського вторгнення

Як через вторгнення постраждали ресурси Державної служби статистики та що з цього вдалося відновити? Як працював орган на ранньому періоді повномасштабного російського вторгнення два роки тому?

Насамперед, у нас було налагоджено виробництво «безперервного циклу» – уряд звернувся до нас з переліком показників, за якими ми надавали дані уряду на щоденній основі. Проте росія почала наступи на всі міста, де розташовані територіальні органи Держстату – головні управління статистики в областях, Чернігів, Суми, Херсон, Миколаїв, Запоріжжя, Харків, Сєвєродонецьк, Бахмут.

З початку повномасштабного вторгнення росії Держстатом було прийнято рішення щодо введення в дію схеми резервування процесів збирання і обробки. В територіальних органах статистики, які знаходилися в зоні обстрілів або активних бойових дій, процеси збирання і обробки були задубльовані на ті регіони, де не відбувалося активних воєнних дій.

Тобто, умовно, інформацію з Чернігівщини збирали десь там, припустимо, в Тернопільській області. Я намагаюся зрозуміти, як це відбувається.

Інформація збиралась на відповідній території, але оброблялась вже в іншому місті. Я не буду казати, де. Певні потужності центрального апарату, Головного управління регіональної статистики були продубльовані на інші територіальні органи. Це своя, внутрішня хмара.

Ми використали ці потужності, щоб не втратити управління процесами виробництва офіційної державної статистичної інформації. Ба більше, навіть на територіях, які потрапили в зону активних обстрілів, люди ходили і збирали надважливу інформацію. Це насамперед були ціни, зокрема, на паливо. Якщо згадати ситуацію на початку війни, то в березні-квітні 2022-го це був ключовий показник. Загалом ми збирали ціни за 30 позиціями і надавали урядові для моніторингу ситуації по всій країні.

При цьому у нас була вказівка не піддавати ризику життя працівників. У Херсоні взагалі діяло «статистичне підпілля». Вони були фактично окуповані з перших днів, але весь період окупації статистики збирали певну інформацію і погодженими каналами передавали на адресу резервного органу. А вже там безпосередньо обробляли і передавали на адресу Держстату.

Голова Державної служби статистики Ігор Вернер. Фото: Пресслужба Держстату

Голова Державної служби статистики Ігор Вернер. Фото: Пресслужба Держстату

Ми втратили Сєвєродонецьк – будівля управління постраждала під час обстрілів, а також територіальний підрозділ в Бахмуті. Але це лише місця розташування управлінь статистики, самі дані з перших днів війни були передані в пункти резервування. Там були розгорнуті додаткові потужності для обробки і зберігання інформації.

Як це виглядало? Мені розповідали, що Державна служба статистики дуже залежить від паперового формату ведення даних.

Ви трішечки заручниця сталого стереотипу про українську статистику, який чомусь розганяється. Насправді це зовсім не так.

Для Держстату було ключовим зарезервувати інформацію, перекинути наші електронні бази, всі, щоб вони були в резерві. Ми були повністю готові до знищення фізичних носіїв. У нас все в електронному вигляді насправді, і для нас папір не був проблемою взагалі.

Я хочу подякувати статистикам Польщі, Литви, Норвегії. Вони в березні і квітні 2022 року підставили нам плече. Коли нам не вистачало серверів, Держстат звернувся до європейських колег, і вони миттєво відповіли і допомогли.

Новий сайт Держстату та співпраця з EPAM: що змінилося

Тоді перейдемо до цифровізації. Офіційно цю реформу оголосили у квітні 2023 року. Перші її видимі результати стали доступні у вересні 2023 року, коли проводилося опитування щодо зайнятості населення в «Дії». Можна більше деталей про те, як трансформувався Держстат вже? Та щодо результатів першого опитування в «Дії» – воно було вдалим чи невдалим?

У Держстаті завжди був рух на цифровізацію. Він, можливо, був повільний і непомітний суспільству, тому що широко не комунікувався. А що бачить суспільство? Бачить старий сайт. Нічого не змінюється. Значить, що? Не змінюється і Держстат. Ми це розуміємо.

Старий вебсайт Державної служби статистики. Скріншот зроблений редакцією The Page

Старий вебсайт Державної служби статистики. Скріншот зроблений редакцією The Page

Після запуску Держстатом безкоштовного програмного забезпечення для респондентів у нас почався притік людей, яким було зручніше подавати статистику в електронному вигляді. Потім за підтримки Європейського Союзу у нас був, на жаль, невдалий досвід зі створення порталу – колеги, які виграли тендер, не змогли створити новий портал.

Оскільки проєкт не вдався, ми хотіли дати людям зручний доступ до даних, тому створили мобільний додаток «Статистика в смартфоні». Ми також наситили наборами відкритих даних портал відкритих даних Data.gov.ua.

Тому, коли Михайло Альбертович Федоров очолив цифрову реформу Держстату, було чітке розуміння, що змінювати. Михайло Альбертович поставив амбітну мету перетворити Держстат на ІТ-компанію, зберігаючи при цьому всі вимоги до виробництва офіційної статистики та її якості. У 2021 році була сформована концепція цифрової трансформації Держстату. Далі компанією EPAM було взято на себе вивчення майбутньої перебудови бізнес-процесів.

А тепер щодо онлайн-опитування. Коли ми проводили обстеження робочої сили онлайн, ми насамперед перевіряли гіпотезу, скільки людей можна залучити до звітування виключно в інтернеті, чи буде це репрезентувати всю Україну. Отримані результати не дозволяють нам дійти висновку щодо повної репрезентативності, отже вебопитування потрібно поєднувати з традиційним методом.

І тепер ми беремо період з червня 22-го до зараз.

Відтоді у процесі цифрової трансформації реалізовано першу чергу проєкту з розробки інформаційної системи статистичного виробництва органів державної статистики (Sigma), призначеної для реалізації повного циклу статистичного виробництва на основі інтеграції процесів збирання, збереження, оброблення, аналізу й поширення інформації та запустили BETA-версію нового порталу.

Приклад банку даних на новому сайті Державної служби статистики. Скріншот зроблений редакцією The Page

Приклад банку даних на новому сайті Державної служби статистики. Скріншот зроблений редакцією The Page

Ми вже почали впровадження інформаційної системи Sigma, яку будували весь 2023 рік, а також підготовку державних статистичних спостережень до переведення їх функціонування в цій системі.

За це я хочу подякувати Фонду Східна Європа, уряду Швейцарії і Михайлу Альбертовичу, який залучив донорів для фінансування цього проєкту.

Нова система будується за принципом: інформація на вході – чорна скриня, вона ж Sigma – інформація на виході – і наш портал, який бере цю інформацію для поширення. Було обрано певний період, за який поки що на бета-версію порталу переносяться дані. Ми відпрацювали технологію перенесення цих даних, яка передбачає кілька ступенів перевірки для того, щоб уникнути помилок при перенесенні.

Sigmа – величезна інформаційна система. Вона базується на хмарних технологіях, з використанням технологій Microsoft Azure, там також представлені технології Azure Data Factory, Jupyter Notebook, Power Automate. До речі, система будується за технологією Agіlе.

Зараз ми мігруємо дані з центрального рівня – по Україні. На другу чергу будуть мігруватися дані регіонального рівня і потім – дані в ретроспективі.

Це ключова мета Держстату – бути сервісом для користувачів і держави. Ми сервіс з надання офіційної статистики. І тому пісню замовляє користувач. Якщо користувач каже, що так йому зручно, то треба робити так, як йому зручно. І це позиція Держстату. На жаль, ми не все можемо реалізувати поки що.

Ви описуєте процеси дуже грамотно, але аналітики розкритикували новий сайт Держстату через незручність. Мені інтерфейс також був незручний та незрозумілий, дані важко шукаються. Виглядало, що новий сайт презентували геть сирим.

Перше враження, яке склалося у широкої спільноти, воно, можливо, адекватне щодо бета-версії. Але ж це бета, розумієте? Тобто це не повноцінний новий портал. Проєкт передбачає, що ми робимо певний MVP, його ставимо, збираємо недоліки і удосконалюємо.

Це платформа, до розробки якої поки що менеджери статистичних продуктів не залучались. Ми надавали свою експертизу колегам з EPAM. Водночас користувачами було виявлено багато недоліків. Але ж для цього й існує комунікація з користувачами, яку ми, я сподіваюся, будемо підтримувати.

У нас є розуміння того, що Держстат є сервісом для користувача, і у Михайла Альбертовича таке саме розуміння, що ми є сервісом. Отже, ми не можемо давати той сервіс, який не буде сприйматися кінцевими користувачами.

Єдиний державний вебпортал відкритих даних data.gov.ua. Фото: пресслужба Мінцифри.

Єдиний державний вебпортал відкритих даних data.gov.ua. Фото: пресслужба Мінцифри.

А як щодо перебудови процесів всередині Держстату?

У 2023 році компанія EPAM провела навчання для фахівців Держстату. Ми перейшли на проєктний підхід: кожне державне статистичне спостереження розглядається зараз як проєкт. Над кожним проєктом працює окремий менеджер статистичного проєкту і методолог статистичного проєкту. Їх доповнюють ті, кого ми назвали «фантастична четвірка»: оператор даних, аналітик даних, BI-аналітик і інженер з якості даних. Цих ролей у нас апріорі не було, і вони ще не закріплені штатним розписом.

Щоб залучити кваліфікованих IT-фахівців, було прийнято рішення створити Державну установу «Центр обробки статистичних даних». На рівні постанов він був створений ще у 2022 році, але фізична робота з його створення, пошуку кадрів, розгортання його можливостей проведена протягом 2023 року.

Зараз ми набираємо у Центр людей та проводимо їм онбординг. Сподіваємося, що протягом цього року нам вдасться укомплектувати ще кілька «фантастичних четвірок» на центр обробки статистичних даних. З використанням цієї проєктної схеми будемо переводити державні статистичні спостереження в Sigma.

Коли цей процес має завершитися, на вашу думку?

У нас немає часу на тривалий процес. Але мені важко відповісти зараз, скільки це триватиме. Поясню: ми взяли 5 спостережень і перевели їх у Sigma. Чотири з них переводить EPAM, одне – «фантастична четвірка» Держстату, яку EPAM навчив. Ми фактично допрацьовуємо систему на ходу, постійно шукаємо нові рішення.

Усі спостереження, які зараз заводяться у Sigma, вони фактично зазнають реінжинірингу без шкоди для методології. Але переведення цих спостережень в систему ще триває, тому я не можу сказати, скільки це буде.

Голова Державної служби статистики Ігор Вернер. Фото: Пресслужба Держстату

Голова Державної служби статистики Ігор Вернер. Фото: Пресслужба Держстату

Але що ми зробили зараз? Зараз ми вже стартували роботу з опису статистичних спостережень для міграції у Sigma. Цей процес ми стандартизували, ми використовуємо Confluence для опису всіх державних статистичних спостережень.

Тобто державне статистичне спостереження в Confluence описується за певними шаблонами, що дозволяє розібратися в ньому фахівцям зі статистики та ІТ. І ми плануємо цю роботу завершити по 100% спостережень до кінця червня цього року.

Потім розглядаємо питання про зовнішній консалтинг. Щоб не ми всередині оцінювали ці спостереження, а зовнішній консалтинг подивився і виніс свій вердикт. Ось це вам не треба, а це вам таки треба. Але щоб зробити такий аналіз, треба все описати.

Все це – extra time, extra money, extra resources. А де їх взяти, якщо у нас їх було мало? Я дуже дякую Михайлу Альбертовичу та компанії EPAM, що вони нас навчають. Зараз пройшло велике навчання по SDMX – це ключовий формат в основі обміну даних у Sigma. Нам допомагає з навчанням вся світова спільнота.

Наша реформа – це не просто «зараз сайт поставимо і все». Ми плануємо до червня-липня 2024 року закінчити формування достатньої кількості «фантастичних четвірок».

Таке враження, що у Держстаті не було серйозних змін, доки пан Федоров і EPAM не долучилися до процесу. Невже без них не можна було?

Михайло Альбертович – це не лише лідер змін. Це ще довіра інвесторів. Не було грошей. Держстат завжди фінансувався за залишковим принципом. Нам дали гроші лише на проєкт пробного перепису у 2019 році.

У 2014 році за кошти Світового банку було реалізовано проєкт з побудови інтегрованої системи статистичної інформації. У 2021 році Держстат був у процесі перемовин зі Світовим банком щодо другої черги проєкту. Нам потрібно було знайти кошти для подальшого розвитку. Тоді прийшов Михайло Альбертович і залучив інших донорів.

Гроші Світового банку були б кредитом, кошти теперішнього проєкту є грантом.

Віцепрем'єр-міністр України, міністр з питань цифрової трансформації Михайло Федоров та заступниця міністра Валерія Іонан. Фото: пресслужба Мінцифри.

Віцепрем'єр-міністр України, міністр з питань цифрової трансформації Михайло Федоров та заступниця міністра Валерія Іонан. Фото: пресслужба Мінцифри.

Коли Держстат відкриє всі дані

Після вторгнення Держстат закрив взагалі всі дані. Зараз відкрита тільки частина. І в аналітиків дуже великі дискусії стосовно того, чи відновлювати їх чи ні. В експертів з кібербезпеки є свої правила. Якщо, умовно, дані були опубліковані раніше, то ворог, в принципі, всю інформацію зібрав і немає сенсу їх закривати. Але до Держстату є дуже великі претензії, чому вони закрили частину даних і не відкривають їх. Що ви з цим збираєтесь робити?

Перше – тут безпекова складова. Я думаю, вона зрозуміла, що це «біла» розвідка. І не треба, наприклад, про вантажообіг, про промислове виробництво в режимі реального часу звітувати для того, щоб наш ворог розумів, де і що у нас знаходиться, куди спрямовувати свої ракетні атаки і запускати шахеди.

Ми принципово не припинили виробництво показників ВВП та індексу споживчих цін. Тобто ми публікуємо два ключові показники, які дозволяють оцінювати Україну міжнародним інвесторам, нашим партнерам, уряду.

У березні 2022 року був прийнятий закон, який дозволяє суб'єктам господарювання не подавати звітність до кінця воєнного стану і протягом 90 діб після закінчення воєнного стану. Я хочу подякувати всім респондентам, які продовжили подавати звітність до органів державної статистики в ініціативному порядку.

Тобто ми не можемо до них зараз звертатися з вимогою. Ми можемо просто комунікувати з ними і просити, якщо буде їх добра воля, щоб вони нам подали цю звітність. І більшість підприємств подає цю звітність. Це нам дає змогу на основі статистичних методів дораховувати певні показники.

Інфографіка Держстату щодо показника інфляції станом на січень 2024 року. Фото: Facebook сторінка відомства

Інфографіка Держстату щодо показника інфляції станом на січень 2024 року. Фото: Facebook сторінка відомства

Але, наприклад, щодо показника з оплати праці: наразі вибірка з урахуванням поданих звітів є репрезентативною лише на рівні всієї України, але вона не є репрезентативною вже для Києва і для областей. Всю Україну на ній зібрати можна, а щодо областей вже ми інформацію не отримуємо.

Саме тому ми публікуємо лише один показник по всій Україні. А якщо треба інформацію вже комусь в області, ми пропонуємо використовувати ті дані, які є в нас на січень 2022 року. Ми не можемо видавати ту інформацію, яка, фактично не є статистикою, не відповідає вимогам об'єктивності статистичної інформації.

Ми внесемо законопроєкт із пропозицією змін до правил звітування на розгляд Кабінету Міністрів. Якщо уряд його схвалить, то внесе до Верховної Ради. Цим проєктом передбачається поновити звітування для тих регіонів, які не включені до переліку регіонів, де тривають бойові дії.

Тобто там, де немає таких активних бойових дій, буде поновлено обов'язок щодо подання статистичної та фінансової звітності. Ми будемо мати змогу отримати ту інформацію від респондентів, якої нам не вистачає. Але, враховуючи міркування безпеки, – це не значить, що ми її опублікуємо.

Зовнішня торгівля товарами за 2023 рік. Джерело: Facebook Держстату

Зовнішня торгівля товарами за 2023 рік. Джерело: Facebook Держстату

Ну росіяни знайшли до вторгнення всю інформацію, яку могли про нас знайти у відкритих джерелах без Держстату, наскільки мені казали наші спеціалісти з кібербезпеки.

Ну так тоді ми можемо листами відправляти цю інформацію прямо, наприклад, в Міністерство оборони російської федерації? Не треба полегшувати ворогу роботу. Я поважаю думку експертів, але ми відкриємо всю інформацію після війни. Ми будемо обмежувати інформацію, виходячи з норм чинного законодавства з урахуванням того, чи може вона завдати шкоди державі та мирному населенню.

Щодо промислових показників зрозуміло. Але зараз на сайті немає оновлень даних щодо населення, наприклад. Є тільки міграція за 2022 рік, за один місяць, і все.

Що значить міграція? Для того, щоб десь когось додати, треба десь його зняти. А інакше буде що? Українців знову буде 52 мільйони. І це не є статистикою. Ми можемо дати смертність і народжуваність, але «врятувати» нас може лише новий перепис.

Паралельно з пробним переписом у 2019 році ми зробили першу спробу оцінки чисельності за допомогою даних операторів мобільного зв'язку – методологія була напрацьована Держстатом спільно з Інститутом демографії та соціальних досліджень імені М.В. Птухи НАН України, який очолює Елла Марленівна Лібанова. За це я хочу подякувати їй особисто і Володимиру Георгійовичу Саріогло.

Після того ми спільно доопрацювали цю методику. Завдяки фінансовій підтримці Представництва Фонду народонаселення в Україні ми отримали дані від операторів за 2021 рік та порівняли їх зі статистичними даними Держстату щодо населення.

У результаті дійшли висновку, що ми можемо їх використовувати для оцінки чисельності населення. І на базі цього ми вже отримали дані за 2022 рік повністю, помісячні. І ми розрахували оцінку чисельності для всієї України і для областей, для районів, навіть до рівня територіальних громад.

Але, наприклад, у мене є картки всіх трьох операторів. Яка гарантія, що мене не порахують як три особи?

Ми провели дослідження з використання населенням номерів операторів мобільного зв'язку – скільки телефонів, скільки мобільних карток, якому мобільному оператору ви надаєте перевагу, скільки вам років, скільки карток у дітей. Тобто ми щодо всіх верств отримали певні дані.

Ми виробили коефіцієнти на базі цих даних та отримали певну оцінку чисельності населення за 2022 рік. Але ми не змогли порахувати чисельність тих, хто виїхав за кордон. Цифра у 9-10 мільйонів не відповідає дійсності.

Фото: Getty Images

Фото: Getty Images

Коли буде новий перепис населення

А традиційний перепис? Чи будуть його робити, чи там немає коштів?

Держстат буде наполягати на проведені перепису. Відповідно до розпорядження Кабінету Міністрів перепис мав відбутися у 2023 році. Але до Закону України «Про Всеукраїнський перепис населення» було внесено зміни, які визначають, що перепис не проводиться протягом воєнного стану і протягом 6 місяців після його закінчення.

Це відповідає міжнародним рекомендаціям, ну і який перепис під час війни? Відповідно до цього закону було прийнято нове розпорядження Кабінету Міністрів, яким доручено Держстату внести пропозиції щодо проведення перепису протягом 6 місяців після закінчення воєнного стану.

Ну але якщо воєнний стан буде тривати 10 років? Бо ніхто не знає, коли ця війна закінчиться.

До закінчення воєнного стану у нас будуть відбуватися обстріли, безконтрольні міграційні процеси. Я не хочу прогнозувати негативних явищ. За міжнародними рекомендаціями, взагалі перепис не рекомендується проводити в період певних нестабільностей і період масових міграційних процесів.

До цих процесів навіть входить період відпусток. Минулий перепис проводився на початку грудня 2001 року. Чому? А тому, що це більш сталий такий період, бо люди повертаються на Різдво, повертаються заробітчани. У цей момент можна отримати найбільш об’єктивну інформацію – коли період найбільшої сталості і найменшої міграції.

Тому під час війни важко спрогнозувати будь-що. Проте ми готуємось до того, щоб проводити перепис з використанням даних, які містяться в реєстрах.

Який і коли буде перепис населення, зараз мені важко сказати. Держстат буде вносити пропозиції залежно від того, коли закінчиться воєнний стан, від стану реєстрів, від стану економіки.

Тоді ми будемо вносити Уряду пропозиції щодо методів проведення перепису. Якщо до того моменту нам вдасться максимально просунутися на шляху до проведення перепису за реєстрами, можливо, буде якийсь комбінований метод з максимальним використанням інформації, що може міститися в реєстрах.

Скоріш за все це буде комбінований метод, з максимальним залученням до перепису людей шляхом заповнення відповідної переписної документації через мережу інтернет та використанням наявних даних в реєстрах. І лише там, де це неможливо, проведення обходу населення. Наприклад, людина не має доступу до інтернету або з певних причин не може заповнити переписну документацію.

Раз ми зачепили міграцію, то це дуже хороший кейс. Елла Марленівна казала, що ніяким даним не можна довіряти – нашим аналітикам також потрібні державні дані, а не лише дані ООН, наприклад. Який тип дослідження щодо міграції ви думали робити?

Ми розуміємо, що відновлення України взагалі неможливо без отримання об'єктивної інформації щодо населення. Держстат не бачить іншого об'єктивного варіанту, ніж проведення перепису.

Дані в реєстрах поки що неповні, потрібно провести їх верифікацію. Ми будемо використовувати ці дані і робити з них базу, але з першого разу провести перепис виключно за реєстрами не вдасться.

Найімовірніше, нам доведеться робити традиційний перепис за комбінованим варіантом – інтернет-раунд, дані реєстрів і плюс традиційний раунд (обхід). Ми будемо агітувати, щоб люди переписалися через інтернет. Але розуміємо, перепишуться не всі і переписувачі мають пройти за адресами, щоб переписати решту населення для отримання об’єктивних даних.

Приєднуйтесь до нас в соцмережах!
Подякувати 🎉