Перепис 2020: за європейським чи "совковим" сценарієм?
З кожної тисячі гривень доходів держбюджету 1,6 грн іде на збір статистичних даних. У 2019 році на цю мету Україна планує витратити 1,7 млрд грн.
Як і від кожної податкової гривні, ми всі чекаємо від цих вкладень найбільш ефективного результату. Чого для цього бракує?
У лютому (ще до виборів) було ухвалено Програму розвитку державної статистики до 2023 року, яка стримано, але чесно перелічує проблеми.
Сайт є застарілим і незручним. Користувачі не можуть отримати дані. Зокрема, мікродані (анонімізовані дані в розрізі окремих респондентів), що є безцінним матеріалом для державотворців і науковців, є недоступними.
Зростає рівень відмов респондентів від участі в опитуваннях.
З таким діагнозом ми зустріли 2019 рік. Рік цейтноту у розробці принципових реформ соціальної сфери, що неможливо без якісної статистики.
Рік запуску перепису-2020. Рік політичних змін в епоху пост-правди, коли реальні факти здобуваються з комунікацій як криваві діаманти з родовищ Сьєрра-Леоне.
І цей важкий рік дав декілька підказок про те, чому при зрозумілому діагнозі ми все-таки не стаємо ефективнішими. Це найкраще демонструють дві свіжі, схожі між собою історії.
Перша історія – це історія реформи прожиткового мінімуму. Цього року уряд розглядав кілька амбіційних моделей змін; тема була надпріоритетною як політично, так і фіскально.
Але розробити таку реформу набагато важче без доступу до мікроданих про умови життя домогосподарств, обсяг та структуру їхніх доходів та видатків.
Ці дані дозволяють вивчити розподіл цих показників за типами домогосподарств, типами населених пунктів, і таким чином доказово визначити чи спрогнозувати вплив альтернативних варіантів реформи на рівень соціальної захищеності та на розподіл економічного зростання в суспільстві в цілому.
Ці дані збирає Держстат шляхом щоквартальних вибіркових обстежень. Такі обстеження коштують досить дорого, в тому числі через доплату респондентам за участь в опитуванні.
Держстат публікує певний перелік узагальнених показників, але не надає доступу до анонімізованих мікроданих, тобто даних в розрізі кожного респондента, оброблених таким чином, щоб неможливо було визначити персональну інформацію про жодну людину.
Саме мікродані потрібні дослідникам, аналітикам та розробникам політик, бо саме вони дозволяють проводити статистичне моделювання.
Затверджена урядом Програма розвитку держстатистики чітко визначає, що Україна тримає курс на відкриття анонімізованих мікроданих.
Вони повинні стати доступними – це наш офіційний девіз. Фобії розкриття особистих даних залишились в минулому, фахівці отримали знання і підтримку міжнародних організацій в підходах до анонімізації. Це – перший кривавий діамант.
Правда про можливість безпечного поширення мікроданих без ризику для персональної інформації існує в знаннях фахівців і урядових документах. Але її інколи важко здобути, а головне – отримати без викривлень з боку зацікавлених сторін.
Попри задекларований курс змін, наразі реально отримати ці дані не може ніхто. Їх не може отримати ані наукова спільнота, ані Світовий Банк, ані Мінфін.
Офіційне пояснення полягає у неготовності до передачі даних саме на цьому етапі, потреба у часі та ресурсах, щоб налагодити процес анонімізації, необхідність внести цю діяльність у відповідні плани та документи.
Ми втрачаємо величезні можливості від використання даних, зібраних за значні бюджетні кошти. І ми втрачаємо їх не через неясність маршруту змін, а через відкладання цих змін до умовного моменту ідеальної готовності.
Друга історія – історія перепису-2020 і дебату про формат його проведення. Уряд озвучив ідею використання реєстрових даних, низка фахівців виступила на користь традиційного тотального опитування.
Ще один кривавий діамант – це розуміння позиції ООН та світової фахової спільноти. Ця позиція є більш нюансованою, аніж проста вимога перепису кожні 10 років. І її можна видобути з чисельних технічних документів, доступних онлайн.
Як для діамантів, цей видобуток потребує певного зусилля і ускладнюється тим, що чимало конфліктуючих між собою сторін зацікавлені в використанні цих фактів в маніпулятивний спосіб.
Отже, згідно з рекомендаціями ООН, повний перепис всього населення країни принаймні один раз на 10 років залишається мінімальною вимогою, що вважається необхідною як для внутрішніх цілей кожної країни, так і для міжнародних порівнянь.
Але починаючи з 1970-х років методологія і філософія проведення загальнонаціональних переписів еволюціонувала не менше, ніж технології в інших галузях.
І головна сучасна тенденція – це саме відхід від безпосередніх опитувань і перехід на реєстровий збір інформації.
Практику реєстрових переписів розпочали нордичні країни. Однак уже під час проведення перепису у 2000 році її підхопило декілька Європейських країн, а у 2010 році реєстрові переписи або їх проміжну реєстрово-традиційну версію застосовували більшість з 56 країн-членів Європейської економічної комісії ООН (UNICE) (яка також включає країни Північної Америки, Центральної Азії та Ізраїль.
При підготовці офіційних рекомендацій щодо переписів 2020 р. (що розпочалась після переписів 2010 р), UNICE створила окрему робочу групу з цього питання і у 2018 р. випустила окрему настанову щодо використання реєстрів та адміністративних даних при проведенні переписів.
Перехід на реєстрові переписи – це не просто залучення нової і дешевшої технології, а повна зміна філософії переписів як такої.
Основною перевагою реєстрового підходу є не стільки його низька вартість, скільки можливість налагодити постійне відстеження параметрів населення в реальному часі (радше ніж один раз на десятиріччя).
Як зазначають датські статистики, перший реєстровий перепис 1981 року став останнім опублікованим переписом в Данії.
З тих пір, Данія здійснює офіційний перепис кожні десять років лише для того, щоб виконати міжнародні зобов’язання.
Для цілей розробки внутрішньої політики система реєстрового збору популяційної статистики фактично позбавила ідею перепису змісту і важливості.
Важливо розуміти, що реєстровий збір інформації – це не створення ідеального реєстру.
Це сучасний алгоритм аналізу і порівняння великої кількості баз даних з метою відстеження реальних параметрів населення.
Цей алгоритм дозволяє моделювати справжній склад населення виходячи з "ознак життя" людини в декількох реєстрах і зводити ймовірність помилок та подвійних включень до мінімуму.
Розвиток технологій аналізу великих даних стрімко підвищує прицільність цих методів, в той час як рівень помилок і виключень при традиційних опитуваннях щороку зростає (в тому числі – через зростаючий рівень відмов респондентів від участі у безпосередніх опитуваннях скрізь у світі).
Також важливо розуміти, що реєстровий збір інформації не означає відмову від збору даних про показники, що не можуть обліковуватись адміністративно.
Усі країни, що перейшли на реєстровий облік населення, продовжують і розвивають збір інших даних – але через репрезентативні вибіркові дослідження.
І хоча для побудови вибірок справді важлива інформація про величину генеральної сукупності (все населення), здобути цю інформацію інколи набагато ефективніше саме через адміністративні дані, бо помилка там може виявитись меншою, аніж при традиційному форматі (адже ризики невірного охоплення є в обох сценаріях).
Якою є ситуація в Україні? Програма розвитку держстатистики до 2023 чорним по білому описує майбутнє: перегляд традиційних підходів збору даних, подальший перехід на вибіркові (а не тотальні) спостереження, розширення практики використання альтернативних джерел інформації, адміністративних та реєстрових даних, застосування методів моделювання в процесі обробки даних та використання сучасних технологій збору даних.
Данський ідеал – це не жарт і не профанація, це офіційна мрія українських фахівців.
Сьогодні основним аргументом щодо вибору методології перепису 2020 є неготовність до реєстрового чи комбінованого підходу саме зараз, саме на цьому етапі.
Реєстри – занадто фрагментовані, суспільство не готове до відмови від радянського примусового збору даних про національність, уже почалась підготовка до набору додаткових кадрів для тотального опитування.
Незалежно від того, яким буде перепис-2020, з точки зору ефективності витрачання коштів до всіх причетних наразі стоїть два ключових питання:
– що ми зробили за останнє десятиріччя, а особливо – за час існування відповідних настанов UNICE та програми розвитку держстатистики – для переходу на постійний реєстровий облік українського населення і прощання з практикою традиційних переписів;
– що ще можна зробити, щоб не втратити нагоду хоча би якогось руху у цьому напрямку у 2020 році.
То чого нам бракує для ефективної закупівлі збору статистичних послуг за бюджетні кошти? Довготермінове бачення змін є зрозумілим, технічно узгодженим і політично пріоритизованим навіть попри зміну урядів у важкі часи (адже програма розвитку статистики приймалась ще до виборів).
Але зміни гальмуються наративом неготовності. Не стільки самою неготовністю, скільки значимістю, яку цей аргумент набуває в нашій реальності.
Будь-хто, хто хоч колись і трохи причетний до будь-якої реформи, засвідчить, що стан готовності до змін не настає ніколи.
Ми були не готові до запровадження ЗНО, до об’єднання громад, до нової системи фінансування первинки, до монетизації субсидій.
Наратив неготовності парадоксально віддаляє нас від того, щоб коли-небудь дізнатись правду, чи був у нас шанс.
Бо ми витрачаємо безцінні хвилини до можливого старту на демонізацію цільової моделі. Цей наратив створює ілюзію, що ми рухаємось у хибному напрямку і ставить під загрозу довготерміновий прогрес як такий.