Часовой пояс: UTC + 3 часа [ Летнее время ]




Начать новую тему Ответить на тему  
Автор Сообщение
SAORGA
  Re: Статистическая обработка, корреляция данных.
СообщениеДобавлено: 11.02.17 00:05 

Зарегистрирован: 19.01.17 06:37
Сообщения: 11
ALEXIN писал(а):
SAORGA!
Информации по нормальному распределению для Excel — в Интернете много, думаю легко справимся. К примеру:
1) Нормальное распределение в Excel [...]
2) Как построить график с нормальным распределением в Excel [...]как-построить-график-с-нормальным-рас/

Осталось дело за Вами, подготовить первичные массивы исходных данных (числа столбиком) по линьке зябликов. Подождём, когда закончите с переездом.


Как я и говорил, я могу скинуть только пару лет. Давайте я одну пару так скину, чтобы стало понятно, о чем я говорю.
Вот в этом файле слева идет отлов по осени, справа - по весне и лету. Но лето нас сейчас не интересует, его я для наглядности добавил. В центре вниз идут графики сначала по распределению внутри сезонов, а потом уже по соотношению в отдельных сезонах. В самом низу показано, как меняется процентное соотношение. Вот я и хочу сначала узнать достоверность тренда на верхних графиках, узнать коэффициент корреляции между датой поимки и полнотой (а судя по тренду, зависимость есть) и попробовать оценить статистически значимость линьки в выживаемости птиц.


Вложения:
Пример.xlsx [61.17 КБ]
Скачиваний: 84
Вернуться к началу
 
 
ALEXIN
  Re: Статистическая обработка, корреляция данных.
СообщениеДобавлено: 11.02.17 02:45 

Зарегистрирован: 11.06.12 07:57
Сообщения: 1698
SAORGA!
Скачал: Пример.xlsx [61.17 КБ]
Там 914 замеров, большая работа.
Пока вникну пройдёт примерно пару дней, потом напишу.
Вот эти значения:
14.10 - 0,7
14.10 - 1
14.10 - 0,6
17.10 - 0,6
17.10 - 0,7
18.10 - 0,8
19.10 - 0,9
19.10 - 0,4
19.10 - 0,7
Слева: дата, понятно.
А справа, пусть 0,7 - степень линьки?
Вернуться к началу
 
 
SAORGA
  Re: Статистическая обработка, корреляция данных.
СообщениеДобавлено: 11.02.17 15:46 

Зарегистрирован: 19.01.17 06:37
Сообщения: 11
ALEXIN писал(а):
SAORGA!
Скачал: Пример.xlsx [61.17 КБ]
Там 914 замеров, большая работа.
Пока вникну пройдёт примерно пару дней, потом напишу.
Вот эти значения:
14.10 - 0,7
14.10 - 1
14.10 - 0,6
17.10 - 0,6
17.10 - 0,7
18.10 - 0,8
19.10 - 0,9
19.10 - 0,4
19.10 - 0,7
Слева: дата, понятно.
А справа, пусть 0,7 - степень линьки?


Да. Если просто, то это процент перелинявших перьев на участке БВКВМ (не так важно, что это за участок, это уже сугубо моя специализация) ). Там 10 перьев. 1 - перелиняли все 10, 0,5 - половина и так далее.
Пока попробую повозиться с источниками. Буду вам крайне благодарен, если у вас получиться внести ясность в мою статистику. Если я пойму все на примере этой пары лет, то смогу и на все остальные это перенести.
Вернуться к началу
 
 
ALEXIN
  Re: Статистическая обработка, корреляция данных.
СообщениеДобавлено: 12.02.17 01:41 

Зарегистрирован: 11.06.12 07:57
Сообщения: 1698
SAORGA!
Открыл новую книгу Эксель.
Затем скопировал два столбца по осенней линьке. Далее, чтобы не запороть тут же скопировал столбец БВКВМ отдельно, ещё раз.
Затем вручную заполнил Е3:Е12, как: 0,1; 0,2… 1,0.
Потом: введем формулу: =ЧАСТОТА(D3:D914;E3:E12), смотрите картинку. Затем выделим диапазон ячеек F3:F12. Нажмем клавишу F2 (именно клавишу!), а затем нажмем клавиши CTRL+SHIFT+ENTER. Формула введется как формула массива. Получим: {=ЧАСТОТА(D3:D914;E3:E12)} с заполнение ячеек F3:F12
[...]

Изображение

Обязательно надо нажимать только клавиши CTRL+SHIFT+ENTER, никакой ОК от Эксель не помогает. Сам когда-то потерял около пяти часов впустую. Ладно, все равно научитесь, заодно потренируетесь.

Далее выделяете ячейки Е3:F12 — два столбца. Заходите на вкладку ВСТАВКА выбирает ГИСТОГРАММА. И всё! Получится как у меня. Заголовочный текст сами напишите, у меня: Осенняя линька у зябликов.

Изображение

Кто имеет сноровку уложится в 5-7 минут, а с обучением заново потянет на 3-4 часа.

Смотрите вложение:
Вложение:
Осенняя линька у зябликов.xlsx [33.89 КБ]
Скачиваний: 66


Почти 60% работы сделано. Пойдем дальше в дебри. Ждите, напишу.
Вернуться к началу
 
 
ALEXIN
  Re: Статистическая обработка, корреляция данных.
СообщениеДобавлено: 12.02.17 15:13 

Зарегистрирован: 11.06.12 07:57
Сообщения: 1698
SAORGA!
Пока бегло сделал гистограмму, смотрите выше. Можете сами подправить детали: цвет, ширину полос, разметку оси абсцисс и т. д.
Цитата:
Что такое БВКВМ?
БВКВМ — большие верхние кроющие второстепенных маховых. [...]

Пользовался только двумя ссылками:
1) Как построить график с нормальным распределением в Excel [...]как-построить-график-с-нормальным-рас/
2) Анализ распределения с помощью функции ЧАСТОТА в Excel
[...]

Теперь немного отклонимся в теоретические дебри.
Цитата:
3 Сигма [...]
Задать значение сигма вы можете в диапазоне от 1 до 3. Также допустимы значения с двумя знаками после запятой, например 1,55. Уменьшая или увеличивая сигму вы влияете на расчет границ прогноза. Чем больше сигма, тем шире рассчитанные границы.

Правило 3 сигм гласит, что вероятность попадания очередного случайного значения в доверительный интервал с заданным значением три сигма составляет 99.7%.

В соответствии с правилом 3-х сигм:
• 3 сигма — вероятность попадания очередного фактического значения в доверительный интервал составят 99,7%, или 300 к 1, или существует 0,3% вероятности выхода за границы.
• 2 сигма — вероятность попадания очередного значения в границы составляет ≈ 95,5 %, т.е. шансы примерно 20 к 1, или существует 4,5% вероятность выхода за границы.
• 1 сигма — вероятность ≈ 68,3%, т.е. шансы примерно 2 к 1, или существует 31,7% вероятность того, что очередное значение выйдет за приделы доверительного интервала.

Также удобные для практики значения сигма:
• 1,64 сигма — 10% вероятность выхода за предел (1 шанс из 10);
• 1,96 сигма — 5% вероятность выхода за пределы (1 шанс из 20);
• 2,6 сигма — 1% вероятность выхода за пределы (1 шанс из 100);

Введя нужное значение сигма и рассчитав границы прогноза, вы получите интервал, в рамках которого будет располагаться очередное значение прогнозируемой величины.

Можно попробовать силы здесь, если Вас заинтересует: "Как рассчитать доверительный интервал в Excel. Правило трех сигм." [...]
Вернуться к началу
 
 
SAORGA
  Re: Статистическая обработка, корреляция данных.
СообщениеДобавлено: 12.02.17 16:13 

Зарегистрирован: 19.01.17 06:37
Сообщения: 11
ALEXIN писал(а):
SAORGA!
Открыл новую книгу Эксель.
Затем скопировал два столбца по осенней линьке. Далее, чтобы не запороть тут же скопировал столбец БВКВМ отдельно, ещё раз.
Затем вручную заполнил Е3:Е12, как: 0,1; 0,2… 1,0.
Потом: введем формулу: =ЧАСТОТА(D3:D914;E3:E12), смотрите картинку. Затем выделим диапазон ячеек F3:F12. Нажмем клавишу F2 (именно клавишу!), а затем нажмем клавиши CTRL+SHIFT+ENTER. Формула введется как формула массива. Получим: {=ЧАСТОТА(D3:D914;E3:E12)} с заполнение ячеек F3:F12
[...]


Понял. Только не совсем понял, чем полученный график отличается от того, что сделал я. Он же точно такой же по распределению.

По поводу сигм. Это ведь нужно для прогнозирования результатов, так? Если да, то мне это не нужно. Мне бы просто достоверность тренда узнать и корреляцию между датами и полнотой.
Вернуться к началу
 
 
ALEXIN
  Re: Статистическая обработка, корреляция данных.
СообщениеДобавлено: 12.02.17 18:08 

Зарегистрирован: 11.06.12 07:57
Сообщения: 1698
SAORGA!
Вот зашел на вкладку "Вставка" и выбрал "Статистическую гистограмму", картинка ниже.

Изображение

По ходу познакомился с формулой Скотта, для вычисления гистограмм. Этот метод использует автоматически рассчитанную сигму (стандартное отклонение) в Excel.

Изображение


Вложение:


SAORGA писал(а):
Мне бы просто достоверность тренда узнать и корреляцию между датами и полнотой.

Сейчас прочёл. Смысл пока доходит сумрачно. Буду писать простыми словами.
У Вас были проблемы с математикой. Я тоже никогда не строил гистограммы в Excel, на основе нормального распределения. Подумалось как так, очень любопытно! Чего уж скрывать.

Сейчас мы можем однозначно сказать про расчёты Автора: да, это 100 %-е нормальное распределение! Раньше затруднялись.
Цитата:
Корреля́ция, корреляционная зависимость — статистическая взаимосвязь двух или нескольких случайных величин. При этом изменения значений одной или нескольких из этих величин сопутствуют систематическому изменению значений другой или других величин.

Надо ещё поразмышлять о том: "просто достоверность тренда узнать и корреляцию между датами и полнотой". Размыто в восприятии.

Дело новое, пока даже не знаю: чем линька осенью должна отличаться от весенней? Никогда не работал орнитологом.
Вернуться к началу
 
 
SAORGA
  Re: Статистическая обработка, корреляция данных.
СообщениеДобавлено: 13.02.17 16:45 

Зарегистрирован: 19.01.17 06:37
Сообщения: 11
ALEXIN писал(а):
SAORGA!

Сейчас мы можем однозначно сказать про расчёты Автора: да, это 100 %-е нормальное распределение! Раньше затруднялись.
Цитата:
Корреля́ция, корреляционная зависимость — статистическая взаимосвязь двух или нескольких случайных величин. При этом изменения значений одной или нескольких из этих величин сопутствуют систематическому изменению значений другой или других величин.

Надо ещё поразмышлять о том: "просто достоверность тренда узнать и корреляцию между датами и полнотой". Размыто в восприятии.

Дело новое, пока даже не знаю: чем линька осенью должна отличаться от весенней? Никогда не работал орнитологом.


То есть, это стопудовое нормальное распределение? А то что значения сдвинуты вправо, это не проблема? По нормальному распределению Гаусса большинство значений же должно быть в середине диапазона. Или я что-то путаю?

Про тренд. Тренд на графике по распределению птиц осенью показывает, что чем дальше в сезоне поймана птица, тем у нее обычно меньше полнота линьки. Вот достоверность этого и хотелось бы узнать.
Про корреляцию. Как коррелируют дата с полнотой линьки внутри сезона. Ну, то есть, есть ли зависимость между датой поимки осенью и полнотой линьки, или же это случайные не связанные значения.
Про "между сезонами". Как я и говорил, моя основная цель работы: узнать, как влияет полнота линьки на шанс птицы выжить зимой. По умолчанию считается, что чем "полнее" птица перелиняла, тем больше у нее шансов. Это логично, ведь у нее более новое не изношенное оперение. Участок БВКВМ берется для удобства, но его полнота линьки коррелирует с остальными участками, это уже доказано другими авторами. Вот и хочется как-нибудь узнать эту зависимость.
Линька осенью и весной не должны отличатся. Просто зимой обычно "отмирают" те птицы, которые хуже полиняли. Естественный отбор в своей красе. Последний график в моем файле как раз показывает, что процентное соотношение после зимы меняется в пользу птиц с более полной линькой. Но этого не достаточно, надо как-нибудь еще в процентах или коэффициентах показать это, не только графически. И вот тут у меня проблемы.
Вернуться к началу
 
 
ALEXIN
  Re: Статистическая обработка, корреляция данных.
СообщениеДобавлено: 13.02.17 22:15 

Зарегистрирован: 11.06.12 07:57
Сообщения: 1698
SAORGA писал(а):
Участок БВКВМ берется для удобства, но его полнота линьки коррелирует с остальными участками, это уже доказано другими авторами. Вот и хочется как-нибудь узнать эту зависимость.

Самую первую осеннюю линьку поделите на три периода, примерно по 20 дней.
Начинается ловля зябликов 21.08.2005 и заканчивается 19.10.2005 года, как раз 60 дней (10 + 31 + 19). Затем определите частоты по каждой выборке.Результат можно будет увидеть, наложив разноцветные гистограммы друг на друга. Займёт около 40 минут времени.

Попробуйте, ничего сложного. Потом решим: куда дальше идти? Наверно, также нужно проверить весеннюю линьку 2006 года.
Вернуться к началу
 
 
SAORGA
  Re: Статистическая обработка, корреляция данных.
СообщениеДобавлено: 14.02.17 17:06 

Зарегистрирован: 19.01.17 06:37
Сообщения: 11
ALEXIN писал(а):
SAORGA писал(а):
Участок БВКВМ берется для удобства, но его полнота линьки коррелирует с остальными участками, это уже доказано другими авторами. Вот и хочется как-нибудь узнать эту зависимость.

Самую первую осеннюю линьку поделите на три периода, примерно по 20 дней.
Начинается ловля зябликов 21.08.2005 и заканчивается 19.10.2005 года, как раз 60 дней (10 + 31 + 19). Затем определите частоты по каждой выборке.Результат можно будет увидеть, наложив разноцветные гистограммы друг на друга. Займёт около 40 минут времени.

Попробуйте, ничего сложного. Потом решим: куда дальше идти? Наверно, также нужно проверить весеннюю линьку 2006 года.


Не уверен, что понимаю, для чего это. Можно же попробовать коэффициентом все рассчитать, вроде.

Я так и попробовал, кстати. Воспользовался одним из ваших источников и посчитал коэффициент корреляции с помощью Эксель. Корреляция имеется, достоверная. Так что я удовлетворен. Думаю, это и достоверность тренда подтверждает. Осталось понять, как узнать значимость полноты линьки в виживаемости птиц в этой статистике.
Вернуться к началу
 
 
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  

Часовой пояс: UTC + 3 часа [ Летнее время ]


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:



Powered by phpBB © 2001, 2007 phpBB Group
© АУП-Консалтинг, 2002 - 2024