Часовой пояс: UTC + 3 часа [ Летнее время ]




Начать новую тему Ответить на тему  
Автор Сообщение
joop
  Проектирование выборки
СообщениеДобавлено: 30.11.05 17:56 

Зарегистрирован: 07.04.03 20:21
Сообщения: 116
Откуда: г. Москва
Коллеги! Обсуждая тему про средний доход, затронулась тема организация выборки исследования, и я не удержался создать отдельный топик

Наверное неправильно начинать тему сразу с объема выборки, но все таки.
Для рассчета объема выб. совокупности я пользовался следующими калькуляторами выборки:
[...]
[...]
(заметить надо, что они работаю только для простых случайных выборок)
и вот что меня насторожило (возможно из-за того что в статистике я не шибко соображаю):
Моя ЦА (она же генеральная совокупность) - 1.2 млн чел.
При уровне значимости 95% (что стандартно для большинства исследований) и 5% доверительном интервале (что вполне меня устраивает) я получаю объем выборочной совокупности в 384 чел!!!!
Нонсенс! Никто ведь с такими выборками не работает... В чем здесь ошибка или моё заблуждение?
Вернуться к началу
 
 
Алексей Катаев
 
СообщениеДобавлено: 30.11.05 18:04 
Администратор
Аватара пользователя

Зарегистрирован: 11.11.02 16:55
Сообщения: 2204
Откуда: АУП-Консалтинг
Этапы разработки выборочного плана (плана выборки):
1. Определение соответствующей совокупности в соответствии с поставленными целями исследования.
2. Получение «списка» совокупности для установления контура выборки.
3. Проектирование выборочного плана – определение состава и объема выборки.
4. Определение методов доступа к совокупности.
5. Достижение нужной численности выборки.
6. Проверка выборки на соответствие требованиям.
7. В случае необходимости формирование новой выборки.

Все множество изучаемых объектов (потребители, конкуренты, магазины и др.) в целом называется генеральной совокупностью или просто совокупностью. Иногда совокупность является достаточно малой по своей численности и можно изучить все ее составляющие. Чаще всего для экономии времени и средств проводится изучение только части совокупности, называемой выборкой. Выборка – группа элементов совокупности, призванная олицетворять собой совокупность в целом.

При формировании состава выборки используются вероятностные (случайные) и невероятностные (неслучайные) методы. Выборка называется вероятностной, если все единицы совокупности имеют известный шанс (вероятность) быть включенным в выборку. Вероятностные методы формирования выборки включат в свой состав: простой случайный отбор, систематический отбор, кластерный отбор и стратифицированный отбор.

Невероятностные методы формирования выборки включают: отбор на основе принципа удобства, отбор на основе суждений, формирование выборки в процессе обследования и формирование выборки на основе квот.

Для определения объема выборки на практике используют следующие подходы:
- произвольный подход, основанный на применение «правила большого пальца» (например, бездоказательно устанавливается размер выборки в 5% от совокупности)
- определение объема выборки на основе неких заранее оговоренных условий (например, заказчик исследования знает, что при изучении общественного мнения выборка составляет 1000 – 1200 человек, и рекомендует придерживаться данной цифры);
- определение объема выборки, исходя из бюджета исследования;
- определение объема выборки на основе статистического анализа (определяется минимальный объем выборки исходя из определенных требований к надежности и достоверности получаемых результатов).

Наиболее теоретически обоснованный подход к определению объема выборки основан на расчете доверительных интервалов.

При организации сбора данных выделяют три альтернативных подхода: сбор осуществляется силами предприятия, либо специально созданной временной группой, либо осуществляется заказ сбора данных у специализирующихся на этом компаний.

Кроме ошибок выборки, связанные с методом формирования выборки и размером выборки, существуют невыборочные ошибки. Их можно разделить на следующие пять групп:
1) все типы ошибок, условленные тем, что не все респонденты выборки дали ответы; 2) ошибки сбора данных; 3) ошибки обращения с полученными данными; 4) ошибки анализа собранных данных; 5) ошибки интерпретации полученных результатов.

Невыборочные ошибки можно также классифицировать на ошибки: лиц, осуществляющих сбор данных, и респондентов. Кроме того, невыборочные ошибки подразделяются на преднамеренные и непреднамеренные.

Контроль преднамеренных ошибок интерьеров осуществляется двумя способами: путем надзора за их работой (например, сопровождение контролирующими лицами, прослушивание телефонных опросов) и путем проверки выполненной работы (например, проверка согласованности ответов респондента, повторные контакты с респондентами).

Уменьшение непреднамеренной ошибки интерьеров осуществляется путем проведения ориентационных сессий и путем разыгрывания ролей (интервьюер – респондент).

Контроль преднамеренных ошибок респондентов направлен на снижение числа случаев лжи и отказов участвовать в обследовании. Для уменьшения непреднамеренных ошибок респондентов, в первую очередь, необходимо тщательно прорабатывать вопросники и инструкции к ним.

_________________
С уважением,
Алексей Катаев
[...]
Вернуться к началу
 
 
Александр Горшунов
 
СообщениеДобавлено: 30.11.05 18:58 
Ведущий консультант
Аватара пользователя

Зарегистрирован: 07.03.03 12:34
Сообщения: 18377
Откуда: г. Львов, Украина
Нет! Жооп! Вы не ошиблись. Действительно при соблюдении ваших условий задачки размер выборки составит 384 жертвы. Арихметику не перешибешь. Почему с таким выборками не работают? Ларчик просто открывался:
1. Исл. компании нужно поддерживать уровень рентабельности. Тобишь содержать себя, интервбюеров и прочее. При относительно небольшой стоимости анкеты этого можно добиться увеличением оборота (тобишь опросить 1500 челов и тем самым обосновав стоимость услуги - вы ж фиг 15 тыщ вечнозеленых за 300 анкет фиг заплатите).
2. Ген.совокупность то у вас 1,2 млн. челов. Но попробуйте их построить в ряд и отобрать из них 384 жертв. А фиг у вас что из этого выйдет :) этот миллион разбросан в безобразном порядке и отловить его можно методом проб и ошибок из гораздо большего числа населения, а значит размер вашего Контура Выборки начинает нагло расширяться и соответственно расширяется и сама выборка.

Вот такие дела с выборками :)

_________________
С уважением,
Александр Горшунов
Вернуться к началу
 
 
joop
 
СообщениеДобавлено: 01.12.05 18:16 

Зарегистрирован: 07.04.03 20:21
Сообщения: 116
Откуда: г. Москва
Я вот еще что подумал.
А не должен размер выборки соотносится со сложностью моих вопросов в анкете (если мы говорим о массовом опросе)?

Например. У меня довер. интервал 10%. В закрытом вопросе анкеты 5 вариантов ответов. На один интересующий меня вариант ответило 10%. 10% плюс минус 10% - не катит.
Т.е. наколько я понимаю, при формировании выборки должны обязательно быть гипотезы о доле признаков в генер совокупности. Так?

p.s. какой же я дурень, что прогуливал лекции по методам ((((((((
Вернуться к началу
 
 
Александр Горшунов
 
СообщениеДобавлено: 01.12.05 19:00 
Ведущий консультант
Аватара пользователя

Зарегистрирован: 07.03.03 12:34
Сообщения: 18377
Откуда: г. Львов, Украина
Хм.... вопрос соотношения выбоки и вопросов воощето, как правило, не стоит. Ибо это дело пришло из мат.статистики где просто изучается некоторое кол-во повтторений какого либо явления и на основе этих повторений делается вывод (например, N раз кидаем монетку - вопросов нат нет по определению). Предполагается, что если при соблюдении поставленных вами условий 10 % от 1.2 млн. сказало что оно делает действие "А", это значит что вы можете утвержадать, что в 95 % случаев 120 тысч. челов плюс минус 5 % соответствующих вашим критериям совершат действие "А" (тьфу нагородил словоблудие :))

Про долю признаков в гипотезах я чегой то не понял. Это что?

_________________
С уважением,
Александр Горшунов
Вернуться к началу
 
 
Flagman
 
СообщениеДобавлено: 02.12.05 07:58 
Аватара пользователя

Зарегистрирован: 26.08.05 06:35
Сообщения: 360
Откуда: Красноярск
Размер выборки и сложность анкеты ни как не связаны, так как если вы сделайте сложную анкету и на нее не захотят отвечать, то хоть 300, хоть 1000 - это все не качественные анкеты.
Вернуться к началу
 
 
joop
 
СообщениеДобавлено: 02.12.05 12:26 

Зарегистрирован: 07.04.03 20:21
Сообщения: 116
Откуда: г. Москва
2Flagman

Недавно вычитал, что один из определяющих объем выборки критериев - сложность проверяемых гипотез, которая ,в свою очередь ,определяется сложностью измерения входящих в нее переменных, что вроде как и есть сложность вопросов в анкете , если мы говорим поро массовые опросы.

2Александр

Сам еще не до конца понял про долю признаков.. Разберусь - напишу
Вернуться к началу
 
 
Александр Горшунов
 
СообщениеДобавлено: 02.12.05 14:33 
Ведущий консультант
Аватара пользователя

Зарегистрирован: 07.03.03 12:34
Сообщения: 18377
Откуда: г. Львов, Украина
Я тоже не понял, но могу предположить - это то, что мы уже обсуждали:
Если ваша ГС - все взрослое население деревни (города, земного шара) то организовать отлов взрослых не шибко проблематично, следовательно наши 384 респов сойдут
Если мы вводим дополнительный признак (возраст, доходы и т.п.) то ловить стает более проблематично, обязательно в числе отловленных будут те кои не соответствуют нашим признакам, значит кол-во выборцев надо увеличить, чтоб выкинумши несоответствующих оставить 384 анкеты.

_________________
С уважением,
Александр Горшунов
Вернуться к началу
 
 
joop
 
СообщениеДобавлено: 02.12.05 14:38 

Зарегистрирован: 07.04.03 20:21
Сообщения: 116
Откуда: г. Москва
Я понял вроде. Т.е. генеральную совокупность надо подбирать, учитывая заранее все признаки, с которыми мы собираемся работать впоследствии. Но часто бывает проблематично их выявить при отборе респондентов. Поэтому и объемы выборки чаще больше, чем считают нам стат. калькуляторы. Так?
Вернуться к началу
 
 
Александр Горшунов
 
СообщениеДобавлено: 02.12.05 16:21 
Ведущий консультант
Аватара пользователя

Зарегистрирован: 07.03.03 12:34
Сообщения: 18377
Откуда: г. Львов, Украина
Это мое предположение на тему вопроса, не факт, что оно совпадает с мнением того, кто формулировал вопрос про долю признаков :)

_________________
С уважением,
Александр Горшунов
Вернуться к началу
 
 
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  

Часовой пояс: UTC + 3 часа [ Летнее время ]


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 0


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
cron



Powered by phpBB © 2001, 2007 phpBB Group
© АУП-Консалтинг, 2002 - 2023