?

Log in

No account? Create an account

Предыдущий пост Поделиться Пожаловаться Следующий пост
Проблема с матрицей
Веселый
chispa1707
Опробовал несколько вариантов. Итогом всегда становится матрица:

- либо годы с разновидностями регионо-катаклизмов;
- либо число совпадающих катастроф в разных парах лет;
- либо коэффициент корреляции между годами или блоками лет;
- либо доля совпадений (из максимально возможного) в разных парах лет

Последняя мне особенно нравится. Выглядит так:



Вручную мне даже удалось разыскать в одном из типов матриц разные типы гиперкатастроф.
Неизвестно, реальны они или продублированы, но каждый тип объективно наделен собственными уникальными свойствами.
Внутри группы коррелирует мощно, а вот с соседними группами - чрезвычайно слабо.



Однако ручной способ не годится; он лишен доказательной силы.
Ищу математический способ выудить связи между датами (они будут выглядеть древообразно) и выбрать наиболее мощные ветви.

Хорошо здесь то, что всегда есть численное выражение мощности связи:
- либо число разных регионо-катастроф, приходящихся на год;
- либо число совпадающих катастроф в паре лет;
- либо доля совпадений (из максимально возможного) в разных парах лет;
- либо коэффициент корреляции между годами или блоками лет.

Скажем, вот серии коррелирующих лет с коэффициентом корреляции более 0,85.
Учитывая, что сильной считается корреляция 0,7, это прекрасный, надежный результат.
(сверяю я их в данном случае по реакции каждой пары лет на ВСЕ ДРУГИЕ катастрофические годы)
Зеленым я выделил внутрисерийные связи, переходящие в межсерийные связи, и они отнюдь не массовые. Есть любимчики.
Если кто понимает, как это обработать или хотя бы, как это называется, буду признателен за подсказку.
Предполагаю, что это пересекающиеся множества. Вроде как банальная вещь.



  • 1
Вы похожи на дровосека - топорофоба! %))
Невозможно заниматься вашей темой не погрузившись в статистические методы!
Убежден, что Вам необходимо их освоить хотя бы на базовом уровне!
Я посоветую курс: https://stepic.org/course/%D0%9E%D1%81%D0%BD%D0%BE%D0%B2%D1%8B-%D1%81%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D0%BA%D0%B8-76/syllabus
В качестве инструмента для применения стат.методов наверняка подойдет и Excel.

А все нормально с методикой в первой картинке? пара 1448-1623 на ней обозначена 0,8 , при этом по моим данным из Вашей таблицы в 1448 году зафиксировано 14 событий, в 1623 - 5, общих событий действительно 4, т.е. 80 процентов от 1623 года. Пара 1462-1618, общих событий всего 2, при этом в 1462 году всего 3 события, а в 1618 - 17. 2 это действительно 2/3 от 3. Пара 1456-1629 , 17 и 6 событий, общих аж 4 - снова 0,67. При этом в первом случае для 19 событий всего получаем 0,8, во втором для 20 - 0,67 и в третьем для 23 - 0,67 , хотя третий случай, на мой взгляд, должен бы иметь большую значимость при дальнейшем рассмотрении. Если подсчитать относительное количество совпадений на общее количество событий в паре, то получится в первом случае 0,21, во втором 0,1 , в третьем 0,154. Первая пара действительно самая мощная, зато вторая значительно слабее остальных.

Edited at 2016-01-04 08:27 (UTC)

Я РЕШИЛ, ЧТО МАКСИМАЛЬНО ВОЗМОЖНОЕ ЧИСЛО СОВПАДЕНИЙ - меньшее число из двух.
На это и опирался. Годится?

Слишком часто, мож без цемента строили поэтому и последствия катастрофические - чуть трусануло и все в руинах?

Должен был быть какой-то закон на ту тему что тот кто первый после катаклизма пришел того право собственности и признается.
В этом случае с одной стороны общепризнанный прецедент катастрофы интересен много для кого так как есть что делить. С другой стороны, причины многих войн можно пересмотреть, например Р-Я, Крымская война могла быть за передел неких территорий ставших ничейными после региональной катастрофы.


Edited at 2016-01-04 14:45 (UTC)

>Итогом всегда становится матрица

"Матричный" (он же широкий) вид не всегда удобен. В нем мы загоняем данные в плоское, двумерное представление. "Длинное" представление может быть более удобным. Длинное - это если в нашем случае в каждую строку забить сразу оба года, ну и всякие вычисляемые штуки. Мы так получаем многомерное представление.
Я тут выбрал пары годов с самым высоким отношением количества совпадений к суммарному количеству событий в паре, выбрал наибольшие, отсортировал по количеству совпадений. Неожиданно получилось интересно. Четырнадцатый век мне показался явно сформированным из самого себя, 17 и 15.
Count - количество совпадений в паре, base базовый год в паре, year второй, kf - количество совпадений к количеству событий в паре годов, sdvig - количество лет между годами в паре.

count base kf year sdvig
9 1438 0.6428571 1676 238
8 1439 0.5714286 1676 237
8 1370 0.5333333 1439 69
7 1606 0.5384615 1676 70
7 1361 0.5833333 1438 77
7 1360 0.5833333 1438 78
6 1606 0.7500000 1611 5
6 1606 0.5454545 1613 7
6 1605 0.6000000 1610 5
6 1605 0.8571429 1611 6
6 1605 0.6000000 1613 8
6 1439 0.5454545 1483 44
6 1384 0.5454545 1439 55
6 1384 0.6000000 1480 96
6 1384 0.7500000 1483 99
6 1383 0.5454545 1439 56
6 1383 0.6000000 1480 97
6 1383 0.7500000 1483 100
6 1382 0.5454545 1480 98
6 1382 0.6666667 1483 101
6 1374 0.5454545 1439 65
6 1373 0.5454545 1439 66
6 1372 0.5454545 1439 67
6 1371 0.5454545 1438 67
6 1371 0.6000000 1439 68
6 1363 0.6000000 1382 19
6 1363 0.6666667 1383 20
6 1363 0.6666667 1384 21
6 1031 0.6000000 1043 12
5 1605 0.5555556 1664 59
5 1374 0.5555556 1383 9
5 1374 0.5555556 1384 10
5 1374 0.5555556 1483 109
5 1373 0.5555556 1383 10
5 1373 0.5555556 1384 11
5 1373 0.5555556 1483 110
5 1372 0.5555556 1383 11
5 1372 0.5555556 1384 12
5 1372 0.5555556 1483 111
5 1371 0.5555556 1382 11
5 1371 0.6250000 1383 12
5 1371 0.6250000 1384 13
5 1371 0.6250000 1483 112
4 1778 0.5714286 1933 155
4 1774 0.5714286 1818 44
4 1371 0.5714286 1424 53
4 1371 0.5714286 1449 78
4 1371 0.5714286 1450 79
4 1128 0.6666667 1371 243
4 1128 0.5714286 1372 244
4 1128 0.5714286 1373 245
4 1128 0.5714286 1374 246
4 1128 0.5714286 1605 477
4 1128 0.6666667 1611 483
4 1128 0.5714286 1664 536
3 1306 0.6000000 1321 15
3 1262 0.6000000 1477 215
3 1163 0.7500000 1421 258
3 541 0.6000000 556 15
3 531 0.6000000 760 229
3 501 0.6000000 541 40
3 344 0.7500000 558 214

Edited at 2016-01-04 19:49 (UTC)

Да, это вариант.
Я тоже подумываю развернуть это дело в столбец. Но мне нужны и межсерийные связи. Это останавливает.
Пока не решил, что делать.

  • 1