Стас Яныч ★★★• 04.01.2013 23:40
Без малого четверо суток действия новой голосовалки. Итоги подводить, может быть рано, но все тенденции явно себя проявили.
В новых оценках анекдотов по среднему баллу единиц перед запятой ни с плюсами ни с минусами нет. В историях, говорят, что-то такое было. Прошу запомнить это важное обстоятельство, теперь далее.
Благодаря анекдоту № 10 (https://www.anekdot.ru/id/617977 ), присланному сегодня прямо с Уралмаша заслуженным фрезерофщиком Аркашей, можно посмотреть, а как же теперь оцениваются далеко не лучшие и не худшие анекдоты свежих выпусков. Просто такой же анекдот был здесь до реформации инструмента оценок всего 3 недели назад.
Сегодня всего за 7 часов - 131 человек поставили ему свои оценки. Средний балл (-0.084)
Из них (смеялись 45 - не смеялись 69, увидели новое 30 - увидели старое 17) Итого: 161 нажатие пальцев от 131 человека, т.е. (+75 и -86).
Если кто хочет посчитать, сколько людей смеялось/несмеялось и сколько из них увидели новое/старое, всё очень просто - флаг в руки и 5 линейных уравнений с пятью неизвестными. Итог, приведённый к прежней пятибалльной шкале, выглядит так:
8 оценок по -2, 63 по -1, 7 по 0 (-1+1 и +1-1), 38 по +1, 15 по +2.
Сравним с итогом оценок того же текста старым инструментом ( https://www.anekdot.ru/scripts/stats.php?id=614404 ).
Всего за 3 недели 127 человек Средний балл -0.102
43 оценки по -2, 12 по -1, 20 по 0, 19 по +1, 30 по +2
Получается, что в новой голосовалке и для очень средних текстов имеется явное стремление показателей их качества к нулю. При этом оно в несколько раз меньше, чем для сильных текстов. Все несколько сот опытов по измерению качества текстов новым инструментом за 4 дня его использования дают примерно такие же результаты: для очень средних текстов новая эффективная шкала измерения сжимается примерно на 20%, а для очень хороших текстов примерно на 50%.
По-русски говоря, мы имеем явное уравнивание измерений качества всех присланных текстов, причём, чем ярче тексты, тем сильнее они уравниваются. Если говорить проще, то новый инструмент даёт погрешность в своих показаниях, и чем дальше от нуля, тем больше.
В таких случаях обычно проводят с новым инструментом наладочные работы, либо отправляют его на доработку, либо вовсе от него отказываются и продолжают работать со старым.
У нашего нового инструмента есть явные плюсы (о которых я уже говорил), поэтому его доведение до ума (примерные направления такой доработки я уже описывал) лично мне представляется наиболее перспективным. Налаживать в данном случае особенно нечего, просто отказываться от нового, значит, потерять явно полезные инновации, а продолжать им пользоваться - просто глупо.
Если Диму интересует моё личное мнение, то основные ошибки были в определении смысла вопросов, на которые могут ответить посетители. А так же незавершённость работ по обработке полученных результатов. Собственно, таких работ видимо и не было. Рейтнговать тексты надо либо отдельно по предлагаемым показателям, либо сделать один главным (нравится), а второй уточняющим (смешно). А иначе весь смысл двух разных оценок сам себя убивает, что мы сейчас и видим.
Извините за сумбур, просто меня тоже жена ждёт.