Nov. 8th, 2016

dpervukhin: (Default)
Оригинал взят у [livejournal.com profile] kouprianov в Выборы в Государственную Думу 2016-09-18: частоты последних цифр

Рисовал не к развернувшейся дискуссии, а к лекции одной, но, вижу, пришло время повесить. Частоты последних цифр числа, выражающего количество проголосовавших на участке (сумма действительных и недействительных бюллетеней) в результатах выборов в Государственную Думу Российской Федерации (2016-09-18). Ожидаемая частота 0.1. Смотрим на Хи-квадрат:
для России в целом (серые точки): X-squared = 138.88, df = 9, p-value < 2.2*10^-16,
для регионов группы 3 (красные): X-squared = 162.24, df = 9, p-value < 2.2*10^-16,
для регионов группы 0 (зеленые): X-squared = 40.635, df = 9, p-value = 5.829*10^-6,
для С. Петербурга (голубой): X-squared = 20.211, df = 9, p-value = 0.01665.

Замечу, что по пути от наиболее подозрительных регионов к наименее подозрительным частотные отклонения падают, хотя и остаются довольно значительными (но вот Петербург, к слову, уже не переваливает за уровень значимости 0.01, только за жалкий 0.05).

О группах регионов см. одну из моих предыдущих записей. В общем, мне кажется, что имитационная модель, построенная при помощи толпы студентов М. Соколовым, не отражает свойств моделируемого объекта (совокупность участковых, окружных и территориальных избирательных комиссий). Возможно, потому что в избиркомах мало студентов (да и вообще там с образованием, боюсь, не очень, если в массе смотреть). Или потому что они пока не ставят себе задачи придумать самые необычные числа. (Кстати, из дискуссии вынесло замечательное чтение про попытку взлома системы Спорт-лото).

UPD: некоторые тчки не видны, поскольку немного или много налезают друг на друга.


last_digits

This entry was originally posted at http://kouprianov.dreamwidth.org/330464.html Comment wherever you wish.
dpervukhin: (Default)
Оригинал взят у [livejournal.com profile] kouprianov в Выборы в Государственную Думу 2016-09-18: частоты последних цифр - 2

По совету мудрого corbulon попробовал посмотреть, что будет, если записать количество бюллетеней в семиричной системе счисления. Гипотеза состоит в том, что отклонения в этом случае не будут отличаться от случайных, поскольку никто не ориентируется на семиричную систему счисления, когда рисует результаты (подробно все изложено тут: http://trv-science.ru/2012/03/13/pro-arifmetiku-i-nemnozhko-pro-vybory/ ). Как и ожидалось, хихиквадрат получился незначимым:

Для России в целом: X-squared = 2.4186, df = 6, p-value = 0.8775
Для регионов группы 0: X-squared = 7.3672, df = 6, p-value = 0.2882
Для регионов группы 3: X-squared = 6.2678, df = 6, p-value = 0.3939
Для Петербурга: X-squared = 3.4536, df = 6, p-value = 0.7501

А картинка в сравнении с предыдущей получилась неописуемой красоты. Специально перерисовал в одном масштабе, чтобы было видно, насколько в одном случае разброс даже визуально больше, чем в другом. Слева теоретически ожидаемая частота, естественно, 1/10, справа -- 1/7.

last_digits.base_07_vs_base_10

This entry was originally posted at http://kouprianov.dreamwidth.org/330661.html Comment wherever you wish.
Page generated Jul. 21st, 2017 08:49 pm
Powered by Dreamwidth Studios