Систематична помилка відбору - статистичне поняття, яке показує, що висновки, зроблені стосовно до якої-небудь групи, можуть виявитися неточними внаслідок неправильного відбору в цю групу.


1. Помилки відбору результатів

Можуть включати попередній або наступний відбір з превалюванням або виключенням деяких видів. Це може бути, звичайно, різновидом наукового шахрайства, маніпуляцією даними, але набагато частіше є добровільним оманою, наприклад, внаслідок використання невідповідного інструмента.

Наприклад, в епоху використання плівки для фотографування неба незалежний спостерігач виразно прийшов би до висновку, що кількість блакитних галактик явно більше, ніж кількість червоних. Не тому, що блакитні галактики більш поширені, але лише внаслідок того, що більшість плівок більш чутливі до блакитній частині спектра. Той же незалежний спостерігач зробив би прямо протилежний висновок зараз, в епоху цифрової фотографії, тому що матриці цифрових фотоапаратів більш чутливі до червоної частини спектру.


2. Типи систематичних помилок

Існує велика кількість можливих систематичних помилок, основні типи:

2.1. Простір

  • Вибір першої та останньої точки в серії. Наприклад, для того, щоб максимізувати заявлений тренд, можна розпочати серію з року з незвичайно низькими показниками і закінчити роком з найвищими показниками.
  • "Своєчасне" закінчення, тобто тоді, коли результати укладаються в бажану теорію.
  • Відділення частини даних на основі знань про всій вибірці і потім застосування математичного апарату до цієї частини як до сліпої (випадкової) вибірці. См. Районована вибірка, en: cluster sampling, Помилка влучного стрільця.
  • Вивчення процесу на інтервалі (в часі або просторі) довжиною свідомо меншою, ніж потрібно для повного уявлення про явище.

2.2. Дані

  • Викреслювання якихось "поганих" даних у відповідності з правилами, хоча б ці правила і йшли врозріз з попередньо оголошеними правилами для цієї вибірки.

2.3. Учасники

  • Попередній відбір учасників, або, приміром, розміщення оголошення про набір добровольців для участі у випробуваннях серед певної групи людей. Наприклад, для доказу, що куріння ніяк не шкодить результатам фітнесу, можна розмістити в місцевому фітнесцентре оголошення для набору добровольців, але курящих набирати в майстеркласів, а некурців серед початківців або в секції бажаючих скинути вагу.
  • Викидання з вибірки учасників, що не дійшли до кінця тесту. У програмі схуднення ми розглядаємо докладні графіки скидання ваги як доказ правильності методики, але в ці графіки не включені не дійшли до кінця учасники, порахували, що на них ця методика не працює (так звана систематична помилка вижив).
  • Систематична помилка самоотбора. Тобто група людей для вивчення формується частково з власної волі, так як не всі опитані побажають брати участь в тесті.

3. Усунення систематичної помилки

У загальному випадку неможливо виділити систематичну помилку вибірки тільки на основі статистичних методів, хоча, як показано в роботі нобелівського лауреата Джеймса Хекмана ( англ. James Heckman ), В деяких спеціальних випадках існують працюючі стратегії.

Відомою є фраза - розповіді про розум і доброту дельфінів засновані на розповідях втомлених плавців, яких вони штовхали до берега, але ми позбавлені можливості почути розповідь тих, кого вони штовхали в інший бік.