Борис Овчинников: "Обонятельные" запросы"

время публикации: 04 августа 2020 г., 20:51 | последнее обновление: 04 августа 2020 г., 20:51

Борис Овчинников

Syda_Productions / DepositPhotos

"В продолжение разговора про "обоняние" как ключевое слово, статистика запросов по которому отражает динамику и сравнительную силу эпидемии коронавируса. У каждого города (из тех, в которых уже была заметная вспышка) своя динамика запросов", - пишет аналитик на своей странице в Facebook.

"На приведенном здесь графике для каждого города показаны две характеристики:

1) дата, на которую пришелся пик запросов ("Яндекс" показывает динамику только по месяцам и неделям, но не по дням; однако вероятную дату пика можно оценить примерно через сопоставление показателей рекордной недели с предыдущей и последующей - если например количество запросов на неделе перед рекордной и после рекордной примерно одинаковое, значит максимум скорее всего пришелся на середину рекордной недели; если рекордная неделя лишь чуть выше предыдущей и сильно выше последующей - значит, максимум был ближе к началу рекордной недели);

2) интенсивность пика - определяемую через долю запросов со словом "обоняние" от всех запросов к "Яндексу" из данного города на пиковой неделе (можно ожидать, что интенсивность пика запросов будет коррелировать не с общей силой эпидемии, определяемой через долю переболевших в населении, а именно с интенсивностью эпидемии на пике - с долей одновременно болевших; при равной высоте пика запросов больше переболевших следует ожидать в том городе, где рост и снижение запросов были более пологими, и пик шире). Чтобы не перегружать график еще больше, я показываю только города с интенсивностью пика 0,008% и больше.

Тут уместно несколько слов про качество и надежность данных. Первое: большинство пиков ярко выраженные. Медианная разница между частотой запросов на пиковой неделе и в среднем за 2 недели до и после пика - 1,7 раза. Медианная разница между основным пиком и максимальным значением за периоды, отстающие от основного пика более чем на 2 недели, - 1,5 раза. И это с учетом фонового уровня (несвязанные с эпидемией запросы про обоняние + общая для всей России "медийная" компонента), если его вычесть, то разница между пиком и остальными периодами будет намного более выпуклой.

Второе: помимо силы эпидемии, на соотношение относительного количества запросов про "обоняние" на пиках в разных городах может влиять множество других факторов - частота упоминания (на пике эпидемии) потери обоняния как симптома коронавируса в местных СМИ и неформальных коммуникациях; накопленная к моменту вспышки осведомленность населения о симптомах коронавируса; возрастной состав интернет-аудитории (притом не всей, а той примерно половины, которая пользуется "Яндексом"); различия в преобладающей лексике (количество запросов про потерю запахов или "не чувствую запахи" в %% от количества запросов про обоняние варьируется от 11% в Архангельске до 37% в Махачкале); возможные различия между "популяциями" вируса и, соответственно, частотой появления тех или иных симптомов; возможные различия - обусловленные культурой, средой обитания или климатом - по важности обоняния как органа чувств и т.д. Однако среди этих факторов я не вижу ни одного, который мог бы давать отклонения больше, чем примерно х1,3. Различия между городами по высоте пика намного больше - так что все же я считаю, что сравнение городов по частоте запросов про обоняние на локальных пиках индикативно для сравнения пиковой интенсивности эпидемии в этих городах.

Приведенный график - это такая хронология: где и когда прошел локальный для данного города пик количество запросов про "обоняние". И я предполагаю, что это совпадает или почти совпадает с пространственной хронологией самой эпидемии, с датами прохождения соответствующими городами пиков по количеству новых заболевших.