Big Data для Росстата

ургэу

Фото: Пресс-служба УрГЭУ

Цифровизация стремительно меняет все сферы нашей жизни, в том числе – и систему государственной статистики, без которой не обходятся ни макроэкономические прогнозы, ни разработка или исполнение бюджета. Когда статистика станет «человекоориентированной», зачем Росстату данные ретейлеров и мобильных операторов и как искусственный интеллект может помочь в расчёте индекса потребительских цен и переписи населения, рассказал глава ведомства Павел Малков на открытой лекции в Уральском государственном экономическом университете.

Как заставить цифры «говорить»?

Уральский государственный экономический университет выбрали в качестве площадки для онлайн-лекции не случайно – в вузе работает кафедра информационных технологий и статистики. Кроме того, качественное оборудование позволяет организовывать трансляции мероприятий, не ограничивая количество участников физическими размерами аудитории. Слушателями лекции в режиме онлайн стали более тысячи студентов и преподавателей ведущих вузов страны и просто тех, кто интересуется статистикой.

Павел Малков начал с исторического примера: итоги Всесоюзной переписи населения 1979 года были опубликованы в открытом доступе всего одним томом и ограниченным тиражом, остальные 18 книг были выпущены с грифом «для служебного пользования». Сегодня, когда у каждого есть доступ практически к любой информации, официальная статистика должна быть доступной для каждого и не говорить языком голых цифр, а переосмысливать их, интерпретировать и объяснять просто и понятно. Но растёт не только спрос – растут требования к глубине и скорости предоставления (и соответственно – сбора и обработки) информации. Эти задачи обозначены в Стратегии развития Росстата до 2024 года. И решают их с помощью цифровых технологий.

ургэу
Во время лекции спикер рассказал об истории и современном состоянии статистики в России. Средний возраст сотрудника центрального аппарата государственной статистики составляет 43,1, а в территориальных органах – 46,3 года. И у статистики – «женское лицо» Фото: Пресс-служба УрГЭУ

– Административные данные активно используются уже сейчас, – рассказал Павел Малков. – Так, на основе данных из Пенсионного фонда РФ рассчитывается 25 важнейших показателей (численность работников предприятий, их заработная плата и так далее). Вся демографическая статистика строится на основе данных из единого реестра ЗАГС. Из Федеральной налоговой службы мы получаем информацию с неструктурированными данными с контрольно-кассовой техники. Учимся обрабатывать её с помощью искусственного интеллекта – это позволит рассчитывать изменение потребительских цен. К началу следующего года планируем представить первые результаты этой работы.

Начинает Росстат работать и с другими источниками больших данных (Big data). Например, данные кредитных организаций могут использоваться для анализа расходов граждан и оценки туристических потоков. Данные операторов мобильной связи – для оценки численности населения: эта работа будет идти в рамках переписи. Источниками интересной информации могут быть агрегаторы услуг по бронированию гостиниц, сервисы каршеринга и другие ресурсы, которые ранее не использовались.

По словам главы ведомства, цифровые технологии помогают расширить формы подачи информации для разных целевых аудиторий. Год назад у Росстата появился новый сайт, его развитием занимается специальная рабочая группа. Кроме того, что у пользователей теперь гораздо больше возможностей для быстрого и удобного поиска информации, на портале публикуется всё больше инфографики, а для экспертного сообщества разрабатываются и скоро будут запущены отдельные информационные панели с аналитическими выводами.

Изменился даже характер взаимодействия со СМИ.

– Раньше ответ давался в недельный срок, сейчас на вопросы журналистов отвечаем день в день, а на самые острые – в срок до четырёх часов. Работаем по всем удобным для журналистов каналам. Это привело к тому, что частота упоминаний о Росстате в СМИ выросла в 3,5 раза, а статистические данные дают не просто так, а с пояснениями, – сказал Павел Малков.

В ближайшее время искусственный интеллект планируется использовать при работе с обращениями граждан.

ургэу
По словам Павла Малкова, цифровизация в статистике началась ещё 10 лет назад. Сегодня 50% малых и 80% крупных предприятий страны сдают отчётность в электронном виде. остальные пока сдают отчётность «по старинке» – на бумаге. Фото: Пресс-служба УрГЭУ

«Зачем нам большие данные?»

После лекции было задано несколько десятков вопросов. На большинство из них глава Росстата успел ответить.

Большой блок вопросов был посвящён образованию. Студенты спрашивали, как молодёжь из регионов может поучаствовать в проектах Росстата, какие новые подходы используются при подготовке кадров в сфере статистики, какие навыки нужны студенту, чтобы быть успешным статистиком.

Несколько человек поинтересовались тем, как Росстат использует зарубежный опыт. В том числе при подготовке к Всероссийской переписи.

-Международной повестке посвящён отдельный раздел в стратегии развития Росстата. Мы участвуем в международных мероприятиях и проектах по развитию систем статистики, наращиваем контакты с зарубежными коллегами. – ответил Павел Малков.- Мы привносим в нашу работу все лучшие практике, которые есть в мире, делимся с коллегами собственными наработками и проводим выверку показателей по России в международных базах данных. В предстоящую перепись мы собрали все лучшие цифровые практики последних переписей населения в разных странах. Переписчики пойдут с электронными планшетами, вся информация будет собираться в единой информационной системе, переписаться можно массой удобных способов. Впервые, как я уже говорил, мы будем работать с данными мобильных операторов.

Целевой аудиторией Росстата являются не только студенты, но и преподаватели Уральского государственного экономического университета. Они поделились с главой ведомства собственным опытом использования статистических данных в работе и также задали ряд вопросов – например, по развитию статистики инноваций (этих данных пока не хватает) и состоянию муниципальной статистики.

По словам Павла Малкова, по обоим направлениям сейчас идёт работа.

Что касается инноваций, то выделять их автоматически пока не получается – в Росстате ищут варианты, как это сделать.

-Пока у нас очень мало показателей с муниципальными разрезами,- ответил он. – Где-то не хватает данных, где-то просто не рассчитываются определённые показатели. В стратегии Росстата до 2024 года обозначили развитие муниципальной и региональной статистики в числе ключевых приоритетов, в ближайшее время количество показателей с муниципальными разрезами будет увеличиваться.

Посмотреть лекцию можно здесь.

Областная газета Свердловской области