Kirill Pankratov (neznaika_nalune) wrote,
Kirill Pankratov
neznaika_nalune

Categories:

О доказательствах двугорбого неверблюда и статистических соломинках

В этом посте я делаю попытку подвести итоги дискуссий о фальсификациях выборов с чисто количественной, статистической точки зрения. Я не буду утомлять читателей графиками - мы за последние дни видели их немало. Ряд блоггеров проделали огромную работу по анализу статистических данных прошедших выборов (вот один хороший пример такого анализа). Множество хороших графиков, аргументов и ссылок можно найти в журналах oude_rus, kireev, schegloff и других.

Итак, были ли на этих выборах массовые фальсификации? Да, на основании всего обьёма данных на этот вопрос можно ответить утвердительно с вероятностью очень близкой к 100%. Я видел аргументы (но не детальный анализ, подобный вышеупомянутым) отвергающие предположения о массовых фальсификациях. Но на основании всего обьёма известных мне данных, ни одно из этих альтернативных обьяснений не может быть принято.

Точный обьём фальсификаций вряд ли можно установить, но различные варианты анализа позволяют говорить о примерно 10-15% (от общего числа проголосовавших) "лишних" голосов за Единую Россию. Т.е. настоящий результат голосования за ЕдРо по всей стране находится в районе 35-38% (по некоторым оценкам - ещё ниже). Достаточно простые оценки примерно совпадают с результатами детального анализа, что свидетельствует о валидности этих результатов (хотя и не является строгим доказательством этого). Как упоминал Киреев, это принципиально меняет результат. Из партии прямого большинства ЕдРо при честных выборах стало бы партией которой необходима коалиция с другими. В любом случае речь идёт о почти 10 млн голосов. Это очень много, и не позволяет говорить об "отдельных недостатках" и "перегибах на местах".

Сомневающиеся в фальсификациях ставили ряд вопросов. Например, "а почему распределение голосов должно быть нормальным"? Строго говоря, не обязано быть нормальным. Более того, если бы оно выглядело очень гладкой гауссианой, это так же вызывало подозрение. Распределение является суммой голосований по множеству регионов, между которыми могут быть существенные различия. Случайные отклонения вокруг любого достаточно однородного процесса по законам статистики неизбежно ведут к распределению близкому к нормальному. Когда общий результат - сумма многих процессов с различными показателями среднего и дисперсии, этот результат будет более сложным, но по форме всё равно напоминающим размытое облако, хоть и отличающееся от "колоколообразной" формы.

Но когда оно отличается очень сильно, принципиально, в частности имеет вид двух чётко выраженных максимумов, между которыми статистическая плотность гораздо ниже - эта ситуация требует специального обьяснения. Ведь, несмотря на региональные особенности, в большой и неоднородной стране множество факторов в целом должны сглаживать эти пики и уменьшать "провал" между максимумами. Границы округов и участков часто не совпадают с естественными социально-демографическими градиентами. В особенности трудно обьяснить очень большие различия на многих соседних участках, с близкими социально-демографическими характеристиками. Наиболее простым и непротиворечивым обьяснением этой бимодальности распределения голосов за ЕР, является предположение о том что на некоторых участках искажения были минмальны, а на других - очень велики; в зависимости от того допустила ли избирательная комиссия эти фальсификации или нет. Я не вижу ни одного альтернативного обьяснения такой бимодальности, которое бы проходило простые статистические тесты.

Второй фактор. Может ли быть положительная корреляция между явкой и голосованием за одну партию? Практика показывает что это случается довольно редко. Если она и есть, то, как правило, слабая - сотые доли. Эта корреляция может быть вызвана региональными и демографическими неоднородностями, степенью политической конкуренции и "накалом борьбы" в разных регионах. Но сама корреляция голосования с явкой всегда намного слабее чем региональные различия в результатах голосования. Сам факт политической конкуренции ослабляет эту корреляцию (например, если одна партия ведёт активную агитацию за явку своих сторонников на отдельном участке, скорее всего другие партии тоже проявят активность в этом месте). Множество региональных и демографических факторов действует в разные стороны и размывает связь между явкой и результатами, так же ослабляя эту корреляцию.

В случае голосования за "Единую Россию" эта корреляция очень велика, фактический проближаясь к единице. Такая сильнейшая корреляция требует убедительного обьяснения. Достаточно простая и непротиворечивая гипотеза - о массовом "вбросе" и приписках голосов за ЕР, что одновременно увеличивает и явку и процент ЕР (но при том что вбросы очень неравномерно распределены по участкам и регионам) - хорошо обьясняет эту корреляцию. Ни одну другую гипотезу, которая могла бы обьяснить это явление так же убедительно и непротиворечиво, я придумать не могу.

Ещё один тонкий, но важный момент. Когда голосование состоит из нескольких выборок, сильно различающихся по общему количеству, статистических аномалий почти всегда следует ожидать в отношении малых процентов (т.е. в нашем случае за партии типа "Яблока" или "Патриотов"). Во-первых, просто по закону больших чисел; во-вторых - из-за многих вполне понятных обьективных обстоятельств: например, именно для небольших партий их поддержка наиболее акцентируется региональными социально-демографическими вариациями, и именно у них проявится неоднородность электоральных усилий (это вопрос концентрации ограниченных ресурсов, таланта и энергии отдельных активистов, etc.). Для самой большой партии все эти эффекты должны быть сглажены.

Мы же наблюдаем полностью противоположную картину: самые кричащие аномалии проявляются в распределении голосов крупнейшей партии (ЕдРа), в то время как статистика для мелких партий выглядит более естественной и гладкой. Обьяснить это явление чем-то помимо фальсификаций и "вбросов", очень и очень сложно.

Помимо чисто количественных данных, в сети за последние дни появилось множество свидетельских показаний, подтверждающих фальсификации: от простых избирателей, официальных наблюдателей, партийных активистов, журналистов и т.д. Далеко не все представленные "неопровержимые доказательства" выглядят убедительно, но некоторые из них - да, сделаны качественно и вызывают большое доверие. Вот пример такой качественной работы наблюдателя, к которой очень трудно придраться. В целом всё это ложится в ту же картину: фальсификации были, прямые и массовые. Немало людей пыталось пресечь их; многие делали это неумело, но среди всего этого вполне достаточно независимых фактоидов подтверждающих данные статистики.

Слишком много разных релевантных факторов которые можно рассмотреть по итогам голосования, и ВСЕ они работают в одну сторону: подтверждая что массовые фальсификации имели место. Каждый из этих факторов по отдельности, может быть, и не является неопровержимым доказательством массовых фальсификаций, но в совокупности они не оставляют место никакой другой интерпретации событий.

Как человек много лет работающий с количественной информацией (в том числе статистической), я доверяю собственной накопленной интуиции в данном вопросе. И, чисто обьективно, полностью отвлекаясь от политических предпочтений, на основании всего набора данных и сопутствующих им фактов, я могу сделать единственный, абсолютно однозначный вывод. Ни одна статистическая гипотеза, кроме гипотезы массовых (но неравномерно распределённых) фальсификаций, не может обьяснить полученный результат. Это, как говорится, beyond the reasonable doubt в суде присяжных, причём с большим запасом.

Я призываю читателей отнестись к этим выводам спокойно, без истерик и политического запала. Все правительства врут своим гражданам. По моему мнению, например, американское правительство (в вопросах не касающихся непосредственной процедуры выборов) врёт своим гражданам в среднем больше чем российское. Я не сомневаюсь, что немало из тех кто громче всех кричит "держи вора", получив такую возможность, ударились бы в не меньшие фальсификации, исходя из "революционной целесообразности" или своеобразно понимаемой "справедливости". И всё же - делайте выводы сами. Хотите ли вы позволить своей власти такой прямой и массовый обман? Постараюсь высказаться на эту тему в последующем посте.
Subscribe

  • Пермь больного человека

    Заметка в "Ленте" Добыча нефти в США обернулась экологической катастрофой по мотивам статьи в "Гардиан" How Texas’s zombie oil wells are creating…

  • "Going postal" - Кучно пошло

    Очередные пострелушки - теперь в Индианаполисе, в офисе Fedex, 8 убитых.…

  • Апрельская зима по расписанию

    16 апреля 2021 - более 10 см снега. Повторяется прошлогодняя история почти день в день, тогда было 18 апреля. И примерно так почти каждый год в…

  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 51 comments
Previous
← Ctrl ← Alt
Next
Ctrl → Alt →
Previous
← Ctrl ← Alt
Next
Ctrl → Alt →

  • Пермь больного человека

    Заметка в "Ленте" Добыча нефти в США обернулась экологической катастрофой по мотивам статьи в "Гардиан" How Texas’s zombie oil wells are creating…

  • "Going postal" - Кучно пошло

    Очередные пострелушки - теперь в Индианаполисе, в офисе Fedex, 8 убитых.…

  • Апрельская зима по расписанию

    16 апреля 2021 - более 10 см снега. Повторяется прошлогодняя история почти день в день, тогда было 18 апреля. И примерно так почти каждый год в…