?

Log in

No account? Create an account

Предыдущий пост Поделиться Следующий пост
Обработка массивов
Веселый
chispa1707
На сегодня в базе из 120 тысяч событий проиндексировано порядка 100 тысяч.
Катастрофы проиндексированы на 100 % и очень точно. Хуже всего с изобретениями.
Обычно это выглядит так: Д. Шмидт изобрел паровой свисток" - а где это случилось, и на кого этот Д. Шмидт работал, не сообщается.

Часть событий проиндексирована криво - в самом начале ошибся.
Исправляю, вымарывая Францию (26 тысяч), Британию и индекс ru - для России у меня есть индексы губерний, что надежнее.
Ну, и выбрасываю редкие индексы, например, сберкассы, свидетельств о которых всего 13.
В целом индексов набирается под 400 тысяч, из которых в работу допускаю до 200 тысяч.

Я бы сказал, что главное, к чему можно придти этим путем, сделано. Матрица налицо.
Прямо сейчас в работе кусок хронологии с 1448 по 1861 год. 130 тысяч событий в 50 тысячах ячеек.
Матрица почти квадратная: 416 индексов в 413 годах.
Часть ячеек пусты, в других стоит до десятка однотипных событий. Упрощению поддается.

Вот так это выглядит.



Обкатал функцию КОРРЕЛ. Недоволен.
Вот она мне выдала индекс корреляции 0,893309233 между группой "Сражения" и событиями в штате Миссури.
Индекс хороший - лучше не надо.
Но сражения у меня плотно стоят по всей шкале, начиная с 1448 года, а Миссури впервые упоминается в 1673 году, а массированно - только в 19 веке.
Эксель считает это хорошей корреляцией, а я - нет.

Прямо сейчас у меня около 4 тысяч пар индексов со значением корреляции более 0,5, из которых больше тысячи пар со значением корреляции более 0,8.
То есть, можно сопоставить порядка тысячи пар рядов дат событий определенного типа, в расчете выйти на какой-то результат.
Но как это сделать, не понимаю.

У кого-нибудь математики знакомые есть? Чтоб хотя бы проконсультироваться.
А в идеале и обсчитать.


  • 1
Мат. статистика это ровно то, что надо.
Вот так выглядят мои базы данных.
https://yadi.sk/i/4cPp_Zc8kJKC8
Файл старый, многое поменялось, но суть видна.
Каждая строка - событие или ряд событий.
Я его индексирую по времени (год, день календаря), месту (страна, штат, регион) и типу события: здесь П это пожары, а У - ураганы. В новых базах иначе, но не суть.
***
После обработки я получаю таблицу. По вертикали - год, а по горизонтали серия индексов, характеризующих события, обычно их штук 4-8.
***
В последнее время стал объединять ВСЕ события во всех регионах, происшедшие в году, в надежде найти новые связи.
***
Что получено?
Основное: я увидел наличие сдвига в цикл Урана в периоде, когда группы событий откидывались в прошлое на 83, 167 и 251 год назад. Особенно это касается географических открытий - купцы и МИДы именно так застолбили за собой право владения.
***
Теперь стоит задача реконструкции, возвращения событий на те места, где им место. Но для начала я пытаюсь найти ряды событий, определенно коррелирующих. Например, серебро имеет отношению к финансированию армий. У кого монета, тот и отряды нанять может для передела торговых путей.
Спрашивайте.

Я имею ввиду данную таблицу. тут две оси, одна - шкала времени, другая -тип события(например: война , эпидемия), в ячейках - количество событий. Сама выборка составлена для одной страны( в данном случае США)??

Edited at 2016-11-12 22:06 (UTC)

Именно здесь - нет. Здесь просто факт эпидемии без привязки к местности.
Но делал и с разбросом по регионам. Тогда запись выглядит чуток иначе, например:
1867$us$nb$э$х$60$
1867 год, США, Небраска, эпидемия, холера, зафиксирована 1 марта.
Можно и по столбцам разбить, но это резко увеличивает число столбцов.
***
Есть вариант поэтапного анализа - не всей кучи сразу, а например, только цунами в связи с землетрясениями. Я так делал, получилось неплохо.

Сейчас чрезвычайно важно нащупать пути реконструкции, восстановления подлинной хронологии.

В норме каждый процесс переживает взлет и затухание.
В трад.хронологии не так: взлет, разрыв, затухание.
Сделано это во множестве мест множеством способов.

Показать это на простом графике несложно и многократно проделано. Недостает формулирования доказательств языком науки (в идеале каждое утверждение должно опираться на строго научные методы) и - основного, реконструкции.

  • 1