понедельник, 14 сентября 2009 г.

Медиана (в статистике)

[тормоз]

Помня старую шутку про среднюю температуру по больнице, я задумался, каким образом правильно вычислять средние значения CTR для статистики в рекламном движке Daos? Естественно, оказалось, что всё уже придумано, и продумано замечательно.

Из Википедии

Предположим, что в одной комнате оказалось 19 бедняков и один миллиардер. Каждый кладет на стол деньги из своего кармана. По пять долларов кладет каждый бедняк, а миллиардер — $1 млрд. В сумме получается $1 000 000 095. Если мы разделим деньги равными долями на 20 человек, то получим $50 000 004,75. Это будет среднее арифметическое значение суммы наличных, которая была у всех 20 человек в этой комнате.

Медиана в этом случае будет равна $5 (полусумма десятого и одиннадцатого, срединных значений ранжированного ряда). Можно интерпретировать это следующим образом. Разделив нашу компанию на две равные группы по 10 человек, мы можем утверждать, что в первой группе каждый положил на стол не больше $5, во второй же не меньше $5. В общем случае можно сказать, что медиана это то, сколько принес с собой средний человек. Наоборот, среднее арифметическое же совершенно неподходящая характеристика в нашем случае, поскольку выходит, что каждый, будь то бедняк или миллиардер, имел приблизительно $50 000 004,75.

Подозреваю, что радостные чиновники, рапортующие о средних з/п в наших регионах знают про медиану, но пользуются средним арифметическим :)

А вот в Daos средние значения CTR будут рассчитываться по медиане (квантилю 0,5). Зачем? Чтобы когда объявление уходит из ротации, отправлять рекламодателю разный текст в зависимости от результатов. Хорошие значения — похвалить, плохие — рекомендовать в следующий раз хорошенько подумать над текстом. Правильно ведь? По-моему, это правильно.

Эй, умник! Что смотришь? Кликай, про тебя ведь написано ;)
Реклама в бомжеленте.

Помогите детям!

[http://brokenbrake.biz/2009/09/14/mediana]