?

Log in

No account? Create an account

Предыдущий пост Поделиться Пожаловаться Следующий пост
Исторические пожары. Матобработка
Веселый
chispa1707
Базу можно качнуть здесь: http://www.fayloobmennik.net/6046836

Кстати о пожарах. Есть у Андрея Степаненко таблица, в которую занесены всевозможные катаклизмы, в том числе пожары. Давайте попробуем на ее основе предсказывать прошлое?
Выделим из таблицы только пожары, и пронумеруем их по порядку. Тогда можно будет сопоставить номер пожара в таблице и год, в который он произошел. Получится такая картинка:
Изображение - savepic.net — сервис хранения изображений

Видно, что на графике имеется несколько сильно отличающихся участков. Попробуем рассмотреть участок от нашей эры до 1150-х годов примерно
Изображение - savepic.net — сервис хранения изображений

Его можно описать прямой, уравнение которой приведено на картинке.

теперь рассмотрим более современный участок, с 1450-х до 1800-х:

Изображение - savepic.net — сервис хранения изображений

И этот участок хорошо описывается прямой, уравнение которой на картинке в левом углу.

Наконец самый современный участок:
Изображение - savepic.net — сервис хранения изображений

Тоже подгоняется прямой. Достаточно подставить в уравнение номер пожара по порядку, и мы получим год, в котором произошел пожар. Естественно не точно, с некоторой, не очень значительной ошибкой.

Собственно, ничего особенного во всем этом нет, это не приводит ни к каким выводам - уравнения просто описывают количество событий в период времени, упоминание о которых внесено в базу. Но, интересны места сопряжения, в которых наш самый первый график претерпевает заметный излом. 1450-е идеально ложатся на начало книгопечатания.

p.s. R-квадрат рядом с формулой — это доля дисперсии зависимой переменной, объясняемая рассматриваемой моделью зависимости, то есть объясняющими переменными.


  • 1
логично что после изобретения книгопечатания.
до того момента про пожары за 3-4 поколения забывали.
плюс концентрация населения примерно с тех времён резко пошла в гору и количество городов и крупных поселений.

>логично что после изобретения книгопечатания.

На первый взгляд да, логично. Но, если описать ситуацию простыми словами, она выглядит так:
в середине 15 века в немецком Майнсе предположительно изобретена печать наборными шрифтами и напечатаны первые инкунабулы, имитирующие рукописный текст, и немедленно для всего мира наблюдается резкий многократный рост плотности зафиксированных событий в единицу времени, причем эта плотность (количество зарегистрированных событий в единицу времени) остается неизменной в течение 400 лет, до конца 18 века.

А я, честно говоря, и методологически не согласен с автором по разделению кривой на 3 отрезка.
Корректнее было моделировать одной экспонентой.
Ну или линейно до середины 15го века, а потом - экспонентой.
Тк разбиение на 2 отрезка выглядит несколько искусственно, если смотреть на самый первый график. Классический экспоненциальный рост, который тот же Эксель с лёгкостью моделирует. И логику процесса накопления данных лучше описывает экспонента.
И "горбик" в начале 1800х вполне объясним - "Москва спалённая пожаром", да и не только она - воевали в Наполеоновскую эпоху много.
Кстати, есть такой чудный у Гугла сервис - https://books.google.com/ngrams
Показывает относительную упоминаемость по году в корпусе текстов любых слов.
Там по запросу "пожар" вообще другая картина.

А построение предсказательных моделей, собственно говоря и не было целью этих упражнений. Я там выше написал, что эти уравнения мало что значат, просто приближение каких-то кривых какой-то функцией, дающее забавную побочку в виде возможных предсказаний. И если рассмотреть не пожары а другие явления, например морозы, то получится более яркая картина с линейными кусками:
Изображение - savepic.net — сервис хранения изображений

Или наводнения:
Изображение - savepic.net — сервис хранения изображений

Здесь линейность отдельных фрагментов видна четче, но и она не принципиальна.
Меня больше интересовали точки перегиба, показывающие, с какого времени к нам стало попадать заметно больше информации о событиях. Видно, что середина-вторая половина 15 века как ключевой момент хорошо просматриваются. Этому я вижу три возможных объяснения - человеческий фактор при создании базы (ведь мы тут рассматриваем именно ее, об этом не стоит забывать конечно), реальное увеличение количества зафиксированных катаклизмов и, наконец, более полная и дошедшая до нас регистрация этих самых катаклизмов. Ну и плюс комбинации всех этих факторов, естественно.
По первому пункту - автор таблицы в особом внимании к 15 веку вроде не замечен, скорее к 18-му.
По второму мне нечего сказать.
Третий пункт укладывается в версию о начале книгопечатания, но как-то странно он с ним синхронизирован.
И на закуску график комет, выбивающийся из общей картины категорически. Даже изобретение телескопа на нем не особо заметно - в древности видели почти столько же комет невооруженным глазом.
Изображение - savepic.net — сервис хранения изображений

Edited at 2016-08-15 13:33 (UTC)

  • 1