Вялые Записки Скучного Человека

журнал Бориса Овчинникова

Previous Entry Share Next Entry
фальсификация международного масштаба (или Они не читали Драгунского)
barouh

На днях по всему миру разошлись результаты опроса YouGov про Most admired people. Меня сразу смутили результаты, но только сейчас я случайно заметил прямые доказательства фальсификаций результатов. Следим за цифирками

1. Обратите внимание: в топ-10 по Китаю разница между 9-м и 10-м местами 0,22% (1,29%-1,07%). У 7-го и 8-го одинаковые результаты - на 0,43% больше, чем у 9-го. Заметьте - 0,43% примерно в 2 раза больше, чем 0,22%. А скажем между Обамой и Путиным разница снова 0,22%
Такая тяга к 0,22% неслучайна: если чуть помоделировать результаты, то окажется, что все проценты по Китаю кратны 0,2146%. Это означает, что 100% соответствуют 466 ответам. То есть в Китае на вопрос о вызывающем наибольшее восхищение политике ответило всего 466 человек, из которых 5 проголосовали за Брюса Ли, 6 за Пэн Лиюань (певица и по совместительству генерал-майор жена председателя КНР Си Цзиньпина), по 8 человек за Майкла Джордана и Стивена Хокинга, и так далее. За Путина 40 человек, за Обаму 41 человек, за Гейтса 88. Все просто и реконструируемо
Из общего ряда выбивается только Си Цзиньпинь (муж той самой певицы и главный человек в Китае с марта прошлого года). У него 9,06% голосов, согласно отчету YouGov. Но: при делении целого числа на 466 нельзя получить 9,06%! Если поделить 42, то получим 9,013%. Если поделить 43, получим 9,227%

ОК, может быть случайная опечатка? Проверим

2. И в локальный китайский топ-10, и в общемировой топ-30 попали 3 китайца - уже упомянутые Пэн Лиюань и Си Цзиньпинь, а также самый богатый китаец Ли Кашин (Li Ka-shing). В китайском топе миллионер опережает певицу ровно в 2 раза - 3,22% против 1,29%. И мы уже знаем, что в абсолютных числах это соответственно 15 и 6 ответов.
"Удивительное" совпадение - в мировом рейтинге разница между ними опять ровно в 2,5 раза: 1,05% и 0,42%. Логично предположить, что эта пропорция сохранилась в силу того, что за пределами Китая ни один человек не назвал ни Ли, ни Пэн.

Если этих людей называли только в Китае, то дальше мы можем посчитать (поделив например 1,05% на 3,22%), что доля китайских ответов в общемировых результатах YouGov составляет 32,6% (+/- 0,2%) - что примерно пропорционально численности населения (спасибо leonidstorch, который первым предположил это - я сначала не поверил, но цифры подтверждают правоту этой догадки).
Проверим на третьем китайце. Результат Си Цзиньпиня в целом по миру - 2,86%. Если предположить, что все это - голоса респондентов из самой Поднебесной, то тогда надо поделить на 0,326 и получить что-то около 8,8% (от 8,72% до 8,83%). Но YouGov говорит, что в Китае у Си Цзиньпиня 9,06% - которые при умножении на 0,326 должны были бы дать 2,95%. Нестыковочка

И в этом месте есть теоретически два возможных объяснения:
1) можно предположить, что доля Китая в общих результатах не 32,6%, а около 31,5% или даже меньше, и что Ли Кашина и Пэн Лиюань называли некоторые респонденты за пределами Китая (а Цзиньпиня - не называли). Тогда цифры могут сойтись - но только вы можете поверить, что жена президента КНР и главный китайский миллиардер в мире более известны, чем сам президент КНР?

Я не могу. И эта версия все равно не объяснит нам, как получилось 9,06% при делении на 466 (см. п. 1)
2) может все проще? Когда посчитали результаты по Китаю, то оказалось, что у Обамы и Цзиньпиня поровну - по 8,8%. Но нехорошо получается - что же это, заморский президент китайцам столь же мил, как и родной лидер? Решили чуток накинуть, чтобы не разжигать. Второпях забыли две вещи: что результаты должны быть кратны 0,2146% и что пропорциональную прибавку надо дать китайскому лидеру в общемировых результатах

Короче, очень некрасивая история получается. Ручная корректировка результатов. Я не знаю, кто и на каком уровне в YouGov устроил такую пакость - пусть сами разбираются

А дальше установленный факт фальсификации результатов опроса по Китаю порождает вопросы про результат Путина. Давайте посчитаем: у Путина в Китае 8,58% - при умножении на 32,6% (на самом деле 32,5%) это дает 2,8% общемирового рейтинга. А в целом по миру у Путина результат 3,8%. Если вычесть Китай, то по остальным странам у Путина всего 1,5-1,6% - место в конце первой десятки (и то почти исключительно благодаря России). То есть своим успехом (третьим местом) Путин обязан в первую очередь результатам опроса по Китаю.

Но если результаты по Китаю фальсифицированы в пользу местного лидера, то где гарантия, что результат Путина в этой стране - настоящий? Это как с российскими избиркомами - после того, как несколько раз поймал их на безусловных фальсификациях, появляются основания и многие прочие странности результатов выборов объяснять ловкостью рук многочисленных чуровых


  • 1
Гм, 466 ответа не близо треть 13895.
Далее они сами говорят /в методологии/:
китайци голосовали за Мао и маме и отца.

Насколько я понимаю, сначала опрашивалось по 1000 человек в каждой стране (2000 в Британии), а потом результаты перевзвешивались согласно численносии населения страны - так что один китаец оказался равен 50 англичанам :)

Ну а 466 ответов, а не 1000, потому что остальные затруднились или за Мао и родителей

Ещё может быть не 466, а 932. Но Цзиньпиню это всё-равно не поможет. ;)
Тем более что мировые 2.86% при делении на 0,325 дают ровненько те самые предположенные Вами 8.80%.

Edited at 2014-01-15 02:46 am (UTC)

Может быть любое число, кратное 466 - но с ничтожно малой вероятностью

Например, вероятность, что это 932 - 1/512: если всего было ответов 932, значит у всех 9 человек в топе (Цзиньпиня исключаем из анализа) четное количество ответов. Вероятность такого совпадения - 1/2 в девятой степени

Кстати для меня лично певица и
милиардер более т.с. 'популярни' чем
Председател, так сложилось ).

А с Биллом Гейтсом всё хорошо, как думаете?

Может и плохо. Там на самом деле много странностей

Например, я не верю, что в России из всех западных звезд восхищение вызывает только Анджелина Джоли

Но обсуждать отдельные странности и верить или не верить в них странно, если можно считать установленным фактом наличие фальсификаций в данном опросе

А по России получается 589 голосов. Незасчитанные тоже мама/папа, и , наверное, Ленин, Сталин и т.п.? ;)

Китайский к-нт 0,325 хорошо получается из соотношения население/сумма населений опрашиваемых стран. Если так считать и от Китая Путин получил 2,79% мирового рейтинга, то от Росии дожно быть 0,84%, а от Германии 0,05%. Итого 3,68% из 3,84%. Откуда ещё 0,16% можно взять? В других национальных топах он не числится. Но если предположить что он оказался на 11 месте всех остальных стран (и 31 в британском списке), то он бы мог набрать не больше 0,8%. Таким образом математически это возможно. И вообще получается, что благодаря парадоксу Симпсона в мировой топ30 могла бы попасть личность, не попавшая ни в один из национальных топов. ;)


Тата (который индийский магнат) не попал в индийский топ-10 - но попал в общемировой топ-30

А Путин получается за пределами России и Китая получил ~0,21%? Т.е. около 0,5%, если пересчитать на долю опрошенных не из России и Китая

Ах, да. Там же почти везде национальные топы10, а мировой и британский - топы30. Это уже не так забавно. :)

Пересчитанных на не Китай и не Россию у меня получилось 0,33%. Если нигде не ошибся...
А вообще по разным странам там ещё странности встречаются. Например взять Великобританию. С 14 по 30 позицию указывают на то, что там цифры отличаются на 1. Наилучшая сходимость результата получается при 875 голосах. Но при этом выбивается Дэвид Бэкхем, у которого при 17 голосах получается почему-то 1,95%, тогда как у следующего Аттенборо при таких же 17 голосах 1,94%. ;) Ну понятно, что при простой сортировке второй окажется первым.
Такая-же история, например, с Германией, где добавив сотые доли процента отсортировали в нужном кому-то порядке поставили Елизавету (а как же!), потом Гагу и лишь затем Джоли. И ведь не додумались добавить тысячные доли, идиоты! Тогда бы и отсортировалось всё как надо, и "ушей" не было бы видно. ;) Но это-то, конечно, мелочи по сравнению с Цзиньпинем. Ещё немного поковыряю, может что-то ещё вылезет.


Дополнение 1.
С Германией даже смешнее получилось. Кроме Лизаветы, Гаги и Джоли был кто-то четвёртый, который остался на 11 месте с 0,79%. Кто-то решил что он менее достоин этих первых троих.
Таким же образом подняли в США Хилари Клинтон на 10 место, предпочтя её двум другим кандидатам.

Дополнение 2.
При красивой подгонке цифр по Австралии (585 голосов) выбивается Обама - вместо 12.39% получается 12.31.
В Египте (679 голосов) выпячивается Абдель-Фаттах аль-Сиси: вместо 19.46 получается 19.44%.
Во разных местах вылазят неточные округления из-за которых позиции недополучают (или переполучают) по 0,01%.
Заметные нестыковки (совсем не бьются) Индия и Индонезия...




Edited at 2014-01-15 03:09 pm (UTC)

Великолепно! Люблю такие вещи. Вот это видели? http://pollotenchegg.livejournal.com/170604.html

Видел

Вообще выявление наименьшего кратного в результатах опросов - популярная забава
Как справедливо заметили у меня в комментариях в ФБ, фальсификаторам и халтурщикам надо просто не выпендриваться и округлять до целых процентов. Тогда фиг чего посчитаешь про количество ответов

(другой способ спрятать концы в воду - перевзвешивать ответ, хотя на случайное число в пределах скажем от 0,8 до 1,2)

И еще: http://www.ng.ru/ideas/2013-12-27/5_top100.html - если вчитаться в правила, очевидно, что средние баллы должны квантоваться по 1/26 (около 0,04), чего не наблюдается, да и отсутствие совпадений в баллах настораживает.

Мало информации, чтобы однозначно сомневаться
Можно было ставить только целые оценки, или полбалла или вообще десятые тоже принимались?
Выставлялась одна интегральная оценка или несколько оценок по разным параметрам?
Каждый эксперт оценивал каждого в списке?
Можно ли было затрудниться, не оценивать человека - и как учитывались такие случаи?

Совсем не факт, что на входе для каждого кандидата было по 26 целых чисел

Все-таки кажется, что только целые оценка. О нескольких оценках от одного человека ничего не говорилось, да и кому это надо... А вот пустые клетки в таблице "эксперты-политики" могли быть, это, конечно, искажает картину.

А, вот еще: http://www.ng.ru/ideas/2013-09-02/5_top100.html - в августовском выпуске ВСЕ баллы кратны 0,02 (везде цифра сотых четная). И в большинстве случаев между соседями разница ровно в один шаг.

Ой, какие они идиоты. При 26 экспертах кратность 0,02 - это красиво. И нулевое количество совпадений тоже радует

Начиная с 13-го места, там только в 3 случаях (из 86!) разница не 0,02, а 0,04
Пропущены позиции после Кулистикова (50-ый), Кадырова (61-ый) и Герасимова (98-ой)

В 2008, кажется, в "Что? Где? Когда?" лучшего знатока определяли голосованием на сайте. Цифры как сейчас помню:

1 место - 36,36%
2 место - 27,27%
3-4 места - по 18,18%

94%, что голосовало 11 человек! 5%, что 22... Нет бы только целые проценты написать для приличия.

спасибо. хороший пост. но почему вы думаете что в китае проголосовали именно 466 человек? могло быть и 4660 - искомая кратность сохранилась бы.

Даже 932 человека (466х2) - маловероятный расклад. Чтобы при 932 ответах наименьшее кратное оказалось бы равно 466 надо, чтобы у каждого из 10 (9) участников рейтинга было бы четное количество голосов. Вероятность этого 2 в 9-ой или 10-ой (если считать Цзиньпиня) степени. Небольшая вероятность, мягко говоря

Для 4660 вероятность и вовсе микроскопическая

  • 1
?

Log in

No account? Create an account