?

Log in

No account? Create an account

Предыдущий пост Поделиться Следующий пост
О методологии науки - 1
Веселый
chispa1707
Обещаю излагать просто и по существу.
Сначала дам список методов научного познания.
1. Универсальные методы познания:
1.1. Анализ и синтез
1.2. Абстрагирование
1.3. Обобщение
1.4. Индукция и дедукция
1.4.1. Индукция
1.4.2. Дедукция
1.5. Аналогия
1.6. Моделирование
2. Эмпирические научные методы:
2.1. Эмпирическое знание
2.2. Наблюдение
2.3. Описание
2.4. Измерение
2.4.1. Прямое измерение
2.4.2. Косвенное измерение
2.5. Эксперимент
3. Теоретические научные методы:
3.1. Теоретическое знание
3.2. Метод мысленного эксперимента
3.3. Идеализация и формализация
3.3.1. Идеализация
3.3.2. Формализация
3.4. Аксиоматический метод
3.5. Гипотетико-дедуктивный метод
3.6. Восхождение от абстрактного к конкретному
3.7. Исторический и логический методы
***
Рассчитываю не на точное знание определений (буду их в упрощенном виде давать), а на здравый смысл читателя.
***
Анализ и синтез – наиболее элементарные приемы познания, и они противопоставлены один другому: анализ расчленяет целое на части, а синтез такие части соединяет. Однако противопоставление этих приемов – ошибка. Нельзя в познании синтезировать то, что не было предварительно проанализировано (разложено по полочкам). Эти два приема не равны и не противолежат, в процессе познания они последовательны: сначала анализ, и лишь затем – синтез.
***
Более того, между этими двумя приемами лежит еще один не упомянутый в списке элементарный прием – систематизация. Никто не синтезирует плутоний с воблой в силу заведомой ненужности. Сначала познаваемое анализируется (разбирается по кусочкам), затем систематизируется: плутоний – к металлам, вобла – к продуктам питания) и лишь затем – синтезируется: воблу - к пиву, а плутоний - в реактор. Синтез ДО этапа систематизации, как при игре в рулетку, даст 90 % проигрышей.
***
Хаотический синтез используется человеком (особенно детьми) только для смеха, и даже в таком синтезе человек стремится действовать системно: голову – на место головы, а хвост – на место хвоста.
***
***
Художник провел все три операции: проанализировал, разделив на части, тела известных ему живых существ, систематизировал: ноги к ногам, головы к головам, и лишь затем синтезировал – с намеренным искажением системности и при этом системно. Другой последовательности действий для познания нет, поскольку каждый последующий этап опирается на достижения предыдущего. В случае с классификацией утконоса (с позиций биологии 19 века столь же странного, как и грифон) эти три этапа разделены десятилетиями, и тем лучше видно, что без второго этапа нет третьего, а без первого – нет второго.
***
Не буду морочить головы и дам собственный, тесно увязанный список базовых методов, где каждый следующий этап познания невозможен без предыдущего.
***
0. Пребывание внутри аксиоматической картины мира. Действий нет
1. Наблюдение
2. Гипотеза
3. Анализ
4. Систематизация
5. Синтез
6. Моделирование
7. Теоретизация
8. Аксиоматизация
***
А теперь – по пунктам распишу.
***
0. ПРЕБЫВАНИЕ
Человек держит в уме абстрактную, то есть, уже познанную картину мира. Часть этого знания – животная: мы инстинктивно избегаем нападения на нас, крупных животных, боли, утопления, падения с высоты и тянемся к вкусным запахам и представителям противоположного пола. Мы не изучали этого специально, это нам дано даром, сразу.
***
Часть знания приходит с житейским опытом: человек учится прыгать, плавать, драться, флиртовать, и даже самые ученые мужи порой тратят на отношения с женщинами и своими детьми не меньше энергии, чем на работу. И, да, та картина личной жизни, что встроена в наши головы, прямо влияет на научные результаты.
***
Отдельно стоит поставить общественные представления человека. Ученый-социолог, выросший на догматах апартеида, будет встраивать это видение в каждую свою работу. Общественные аксиомы по степени воздействия на результат исследования ничуть не слабее строго научных.
***
И на самом кончике этого айсберга – собственно научная аксиоматика. Ученый прекрасно отличает гипотезу от теории и теорему от аксиомы, однако на практике большинство многократно подтвердившихся данных принимаются человеком как аксиомы - на веру. Исследование еще не началось, а влияние всей этой махины на будущий результат уже предопределено. И именно с этим багажом человек осуществляет первый этап научного познания – наблюдение.
***
1. НАБЛЮДЕНИЕ
Метеослужба наблюдает за самыми обыденными для нее процессами, не особо надеясь на научный прорыв, но это наблюдение – тоже наука, поскольку неизбежно порождает всю цепочку последующих этапов познания и в итоге, как минимум, уточняет познанное раньше.
***
Инструментальная вооруженность наблюдения непринципиальна: главное в нем – новые данные. Если данные парадоксальны, сразу пахнет переменами, но даже, если сведения самые обыденные, их количество рано или поздно перерастает в качество, а значит, и в перемены.
***
Если нет акта наблюдения, не будет и всего последующего перечня приемов. Даже когда исследователь пересматривает середку научного процесса, он опирается на данные чьих-то наблюдений.
***
Наблюдение – самый важный этап познания. Читал, как начальник археологической экспедиции выбросил в отвал найденный в средневековых слоях роскошный нуклеус, - как волос из борща. Научное познание остановлено на самом первом этапе. В 1917 году активно горели архивы Охранки. В 1872 году были сожжены госархивы Франции по 1857 год. Сфера наблюдения, соответственно, резко сузилась. Хотя с другой стороны, если нет данных, – нет и целой серии научных проблем, а значит, нет и повода менять с таким трудом созданную картину мира. «Нуклеусы» выкидывают чаще, чем мы думаем.
***
2. ГИПОТЕЗА
Данные наблюдений дают основание для выдвижения гипотезы. Гипотеза предполагает доказательства, и данные наблюдений из серии возможных доказательств – первичные.
***
Гипотеза всегда базируется на общей (всегда устаревшей) картине мира. Причина: эта картина мира пронизана миллионами доказанных логических связей, и не опираться на них означает утратить связь с собственным образом реальности. В случае с выброшенным нуклеусом была угроза именно этому образу реальности, а значит, и возможности создать хорошо защищенную гипотезу, - и включилась самоцензура.
***
3. АНАЛИЗ
Анализ — это приём мышления, который подразумевает разъединение целостного предмета на составляющие части (стороны, признаки, свойства или отношения). Если предмет наблюдения – необычный синоптический феномен, изучают все сопутствующие погодные факторы, а если – птица, идентифицированная на уровне гипотезы как черный лебедь, следует изучить его органы и образ жизни с целью убедиться, что это именно лебедь, а не новый вид.
***
Здесь хорош пример с утконосом. На этапе наблюдения «нуклеус» просто выбросили, - никто не поверил, что такое животное реально. На этапе гипотезы его отнесли к кротам, и лишь на этапе анализа органов оказалось, что это млекопитающее откладывает яйца.
***
4. СИСТЕМАТИЗАЦИЯ
Система — множество элементов, находящихся в отношениях и связях друг с другом, которое образует определённую целостность, единство. Утконоса нельзя отнести и к птицам, и к рептилиям, и к млекопитающим одновременно, требуется точно определить какой-то один класс, - иначе рухнет вся биологическая аксиоматика, построенная именно на классах. Впрочем, иногда именно так и происходит: рушится аксиоматика, и тот же теплород оказывается в прошлом.
***
На мой взгляд, научные взгляды терпят изменения, прежде всего, на этом этапе. Не в тот момент, когда в слоях средневековья находят нуклеус, не в момент выдвижения гипотезы – в такой ситуации заведомо ненадежной - и не в момент анализа всех сопутствующих нуклеусу артефактов, а на этапе систематизации проанализированных данных. Может, например, оказаться, что нуклеусов больше одного, что присутствие их в группе с другими артефактами исторически необъяснимо, а собрались эти предметы все вместе потому, что у них идентичная плотность и масса. Просто стратиграфия как наука базируется на ошибочной гипотезе о поочередном формировании слоев (ошибочность постулата была доказана фундаментальным экспериментом не позднее 1994 года). Система новых знаний о порядке формирования слоистости приводит к новой системе знаний и в археологии. Нуклеусы больше выкидывать не надо; их присутствие среди чужеродных артефактов с этого момента уже неопасно для карьеры.
***
Кстати, тот факт, что предеметы разных эпох склонны лежать вместе на так называемом "материке", археологам известен давно. Решить эту проблему пытался еще Дарвин (см. 2 том советского издания за 1936 год), предположивший, что в "самоуглублении" предметов и даже зданий повинны земляные черви. С 1994 года парадокс перестал быть парадоксом, и там, где предметы скопились на "материке", отныне следует искать следы оползня или иной причины механического разделения разнородных элементов на слои.
***
5. СИНТЕЗ
Синтез – это приём мышления, который подразумевает соединение ранее выделенных частей (сторон, признаков, свойств или отношений) предмета в единое целое.
***
Именно после систематизации данных то, что было когда-то проанализировано по частям, поучает возможность непротиворечивого соединения в одно понятийное целое. Вобла попадает в раздел промысловых рыб и пивные ларьки, плутоний – к оружейникам, а утконос – в тот же отряд, что и ехидны.
***
6. МОДЕЛИРОВАНИЕ
Найденное мной определение моделирования сильно заужено: в силу многозначности термина авторы с ним просто не справились. Для науки, на мой взгляд, моделирование процессов важнее моделирования объектов, поэтому прошедший синтез и нашедший свое место в науке новый объект обкатывают в самых разных, гипотетически родных для него процессах. Только так человек и узнает в точности, можно ли кормить утконоса кормом для рыбок, и как ведет себя плутоний в присутствии графитовых стержней. Здесь нужны все виды моделей - от чисто умственных до физически точных.
***
7. ТЕОРЕТИЗАЦИЯ
Термин часто используют как уничижительный – совершенно неоправданно. Сначала дам определение термина «теория».
***
Теория - учение, система научного знания, описывающая и объясняющая некоторую совокупность явлений и сводящая открытые в данной области закономерные связи к единому объединяющему началу.
***
Надо понимать, что в полной мере «открытые в данной области закономерные связи» проявляются не ранее этапа моделирования. Даже если исследователь угадал, с чем именно столкнулся, еще на этапе наблюдения, в полной мере связи проявят себя только на этапе моделирования процессов. И лишь после этого открытие будет готово к встраиванию в систему существующих научных знаний.
***
В тех случаях, когда новое открытие ломает существующую систему научных взглядов, встраивать его надо синхронно с корректировкой уже существующего научного багажа. Это болезненный процесс, и происходит он именно на этапе теоретизации – неизбежного и финального этапа познания.
***
8. АКСИОМАТИЗАЦИЯ
Аксиомами для человека являются не только те аксиомы, что определены так в учебниках. Все, что на опыте можно не доказывать, а просто принять на веру, человек принимает на веру. Классическая теория всемирного тяготения Исаака Ньютона это именно теория – не аксиома, однако на практике никто, ссылающийся на Ньютона в статье, не станет еще раз обосновывать ньютоновскую правоту. И так – во всем.
***
На этом этапе знание, признанное научным и прошедшее теоретизацию, переходит в разряд того, что никто не станет доказывать повторно – после автора. Есть одно - авторское – доказательство, и его хватает. Открытие встраивается в картину мира, изменяя и обогащая ее, и возникает новая аксиоматическая картина мира, с опорой на которую люди и продолжат совершать открытия и ошибки.
***
Здесь мы сами собой переходим в сектор «0. Пребывание». Цикл завершился и готов к повторению.
***
РЕЗЮМЕ
Итак, я перегруппировал научные приемы таким образом, чтобы получилась эта тесно связанная группа, в которой каждый последующий прием невозможен без реализации предыдущего.
***
0. Пребывание
1. Наблюдение
2. Гипотеза
3. Анализ
4. Систематизация
5. Синтез
6. Моделирование
7. Теоретизация
8. Аксиоматизация
***
Два из девяти введены мной, остальные семь принципиально перегруппированы. С целью оправдать именно такой набор и порядок я приведу в систему и все остальные, указанные в списке самом начале.
(продолжение следует)


  • 1
Ждём!
Отличное начало лекции!

В компьютерных науках ещё вводят два метода (там работа происходит на одном уровне абстракции, то есть то, что могут сделать компьютеры, а людям слишком рутинно):

1) Поиск. Например, поиск чёрного кубика, среди белых. Или поиск сведений в газетах и книгах о пушках. На телефонной книге легко показывается, что линейный поиск намного менее эффективен, чем поиск в отсортированных данных. Для этого нужно представить, что телефонная книга идёт не по алфавиту, а перемешана случайно. Тогда чтобы найти абонента придётся просмотреть, в среднем, половину книги (500 000 телефонов). В худшем случае пролистать всю. Стоит нам её отсортировать и поиск проходит за время не n, а log(n). То есть открываем посередине (на букве Р). Сравниваем с фамилией, если меньше Р, то открываем на букве И. В среднем, пролистав 20 листов (всего 20 вместо 1 000 000 сравнений!) мы найдём фамилию в книге, где 1 000 000 абонентов. То есть в 50 000 раз быстрее. Поэтому изобрели сортировку.

2) Сортировка.

2.1) Самый неэффективный алгоритм сортировки — это сравнить напрямую каждую пару элементов (i,j). Этим методом карты сортируют в руках. Количество операций, которые необходимо сделать для этого: n^2/2. То есть, для телефонного справочника, где 1 000 000 абонентов — это 500 млрд. перестановок. То есть, выгоднее найти 500 000 абонентов в книге, где они расположены случайным образом, чем один раз отсортировать карточным методом. Но он очень интуитивен.

2.2) Но если, 33 раза просмотреть справочник и составить 33 тома, где абоненты будут также случайно расположены, но начинаться на одну букву, то каждый том можно отсортировать после этого за время 1 000 000 операций. То есть, если кто-то затратит время на 33 просмотра справочника, выписывая в 33 книги только тех абонентов, что начинаются на одну букву, а потом каждую книгу отсортирует карточным способом, то таким образом он отсортирует и весь справочник, это будет быстрее в 15 000 раз, чем метод сортировки (2.1) и каждый человек после этого сможет искать абонентов в 50 000 раз быстрее (то есть получит тот телефонный справочник, которыми мы пользуемся, которые расположены в алфавитном порядке).

Ещё раз. То есть, если мы листая справочник 500 000 раз, один раз выпишем все фамилии начинающиеся на одну букву, то дело пойдёт в 15 000 раз быстрее. А те, кто будут новым справочником пользоваться будут находить абонентов в 50 000 раз быстрее, чем в неотсортированном.

Применение сортировки к блогу (результат поиска).

1.1) Сортировка карточным методом. Можно назвать её хаотической.

Если рассуждать об этом блоге, то здесь 8000 постов. Если их сортировать карточным методом, то есть система будет спрашивать:
1. Как Гутенберг связан с газетами? Ответом будет пост: Гутеберг < газет.
2. Как пушки связаны с медью? Ответом будет, например, пост: пушки > бронзы.
3. Как газеты связаны с медью?
4. Как медь связана со свинцом?

Думаю, если бы была такая система, то это уже было бы полезно: можно было бы заранее заготовить эти вопросы и каждому в комментариях на них отвечать. Это могло выглядеть, даже, как игра. Очень интересно было бы получать такие вопросы, как:

5. Как Синусоида Жабинского связана по хронологии с изменением эклиптики на картах?
6. Как шторм в Бенгалии связан с тамплиерами?
и т.д.

Ужасно и совершенно неочевидно, что для карточного метода сортировки таких вопросов (по 8000 постам) будет 32 000 000. То есть, в эту игру (сортировочную викторину) должны играть 4000 человек, и в итоге получится гиперблог, гораздо больше Википедии.

Но результатом будет строго отсортированная по времени нить повествования, которая будет логически связана в каждом абзаце. И эту логику можно будет даже не проверять, потому что ей будет заниматься система. На низком уровне — это будет выглядеть как таблица:

Пост сортировки; Пост из блога; Пост из блога; Результат доказательства
A; Гутенберг (#0001); Газеты (#0002); <
B; Бронза (#1003); Медь (#1111); ?
...
Z; Свинец (#2003); Медь (#3004); ?

Тут система сама будет задавать вопросы, а людям надо будет лишь искать хронологическое отношение между парой тем и только этим. Результатом будет непрерывное повествование, отсортированное по времени. То есть, чёткая и непротиворечивая последовательность постов. Уже имеющихся в блоге.

Проблема в том, что таких вопросов будет 32 000 000, это нереально.

Но, если, например, разделить блог на 8 частей, по 1000 постов. То в результате можно будет получить 8 строго отсортированных по времени книг (на каждую необходимо будет 500 000 вопросов), в сумме 4 000 000 вопросов (это меньше в 8 раз). Но мы получим 8 книг, которые стройны и непротиворечивы, где всё связано и чётко ложится на даты, но между собой эти 8 книг также будут неясным образом связаны.

1.2) Переложить сортировку исключительно на машину и использовать какой-нибудь быстрый алгоритм, но который очень сложно использовать человеку.

В таком случае система задаст не больше 100 000 вопросов (8000*LOG[8000,2]) и все 8000 постов чётко лягут на хронологическую прямую, со всеми связями. Такие методы используют бинарные деревья, то есть каждый пост будет иметь такую структуру:

Доказываю, что левая ветвь лежит на хронологии раньше, чем правая.
Левая ветвь: пост №1111 про Гутенберга.
Правая ветвь: пост №2222 про газеты.

А система будет давать приказы:
1. Создай доказательство, что пост №1234 < №3456.
2. Сделай у поста №AAAA правую ветвь с постом №BBBB.
3. Сделай у поста №ABCD левую ветвь с постом №DCBA.
4. Удали пост №CCC и сделай его правой ветвью поста №DDD.

Та же самая игра, только не 32 000 000 постов, а всего 100 000. Объём резко уменьшится за счёт уменьшения части доказательств, потому что система будет основываться в доказательствах на уже имеющихся сравнениях и не будет сравнивать то, что заведомо позже с тем, что заведомо раньше. Результатом будет книга по истории, где всё будет чётко связано, и каждая пара постов будет логически связана (доказана).

Превратить такое бинарное дерево в книгу очень просто (один из редких случаев, где компьютеры умеют синтезировать):
1. Сначала вставляется тело левой ветви.
2. Потом пост доказательства.
3. Тело правой ветви.

Если ветвь не является самим постом (в этом блоге), то для него эти три пункта повторяются и это и будет левой (или правой) ветвью. То есть итогом будет попросту книга. Это можно сделать автоматически и очень легко.

Я это в общем, уже делал, просто иначе. Вывел для каждого типа явления среднюю и средневзвешенную даты, и события сами выстроились в логичной последовательности. Минус - отсутствие строгости доказательства.

Дело не в доказательствах, а в упорядоченности. Дерево сортировки можно строить по разным критериям. Можно упорядочивать по времени и получить хронологический справочник. А можно упорядочивать так, например, чтобы умножение было позже сложения, метод Ньютона и интегрирование позже производной. То есть, их как минимум два:
1. в какой последовательности всё было в прошлом, и;
2. в какой бы последовательности автор написал бы об этом всём.

И каждый узел дерева будет выглядеть так:
1. Что в книге должно быть раньше этого поста (ссылка на другой пост в дереве).
2. Что пишем сейчас.
3. Что в книге должно быть позже этого поста (ссылка на другой пост в дереве).

Существуют только три варианта пробега по дереву. Все они дадут книгу на выходе.
1. Раньше. Сейчас. Позже. Это как простое повествование, может быть скучно.
2. Позже. Сейчас. Раньше. Это сплошная революция. То есть пишем про интегрирование, потом говорим, что понять его невозможно без дифференцирования. Объясняем метод Ньютона, но говорим, что без дифференцирования его тоже не понять. Потом дифференцирование. Но его нельзя понять без деления. Деление без вычитание. Вычитание без сложения. Но рассказываем про умножение. Что-то вроде обратной съёмки.
3. Сейчас. Раньше. Позже. Что-то вроде Войны и Мир или обычного учебника истории. Сначала уходим в древность. Потом рассказываем будущее. Только очень дробное повествование. 1800. 1700. 1900. 1750. 1950. Довольно-таки хаотично получится.

Я посчитал, что для 8000 постов, в среднем, чтобы протащить пост по дереву нужно 15 сравнений. То есть мы берём какой-нибудь пост №1234 и идём в вершину. Смотрим: раньше надо написать об этом, чем о том, что написано в вершине. Если раньше, то идём в левую ветвь и думаем о том же, но для левого узла вершины. Если влево идти некуда, то туда и помещаем наш пост. Всё. По дереву протащили. Аналогично с правыми ветвями.

Если говорить о хронологии, то вряд-ли получится протащить пост по дереву вниз, через 15 вершин целиком, его наверное придётся резать на 15 частей, и это не оставит ничего от исходного блога. Но если рассуждать в терминах: о чём бы я написал раньше, о чём позже, то очень может быть, что получится их протаскивать целиком, или с минимум правок.

Там был комментарий о том «можно ли верить редактору». Если посты протягивать целиком, то вопрос отпадает. А если они будут как в мясорубке резаться на 15 частей, то результат по-крайней мере можно будет читать от начала до конца.

По такому принципу должны строиться вообще все учебники. Но сортировку изобрели 70 лет назад. Вообще, я бы с интересом почитал и обычное повествование (от А до Я) и революционный метод (с конца на начало). Последний мог бы очень неплохо стимулировать память, а, ведь, ради этого же всё затевается: чтобы книгу мог прочитать человек далёкий от истории (вроде меня) и понять всё и сразу, а не строить иллюзии по поводу того, что что-то понял.

Что ЖЖ, что вики — не важно. Чтобы сделать дерево нужно только одно — возможность вставить ссылку на пост. Больше ничего. Затраты: 15×8000=120 000 сравнений. Это очень и очень оптимальная цифра. Получить её как-то иначе, не строя дерево, едва ли возможно.

Но в случае с вики, если работать с дампами, то можно, скажем, раз в неделю (или день) получать готовый PDF с книгой.

Вот, для наглядности, как выглядел бы блог сортировки, если поместить в него 100 постов. Тут его высота 18 (потому что первый почти последний: №7004, а на 4 уровне №5, правее которого почти всё дерево), но в среднем 15.



Если добавить 8000 постов, то будет выглядеть примерно также, только гораздо шире. То есть, 80 таких гроздей, подвешенных.

Если на все вопросы всегда отвечать: позже, то получим исходный блог в формате книги. Если всегда отвечать: раньше, то получим так как в ЖЖ: от недавних к давним. То есть, от сортировки легко избавиться, но это затруднит последующий поиск (чтение, ли).

То есть, здесь творческий вопрос только один: как протащить пост №nnnn вниз по дереву и сделать листочком, которые растут только снизу. Тогда умножение будет после сложения.

Если делать это, то не с моими постами, а с моей базой данных: там и даты в Экселе забиты, и индексы места, и индексы типа события. Мой ЖЖ надо еще руками перебирать, а там 90 % информации готово и даже рассортировано.

Единственная проблема в том, что такую систему нужно сделать (или делать это вручную), либо добавить в сортировку условие, когда два поста невозможно или очень сложно сравнить и проще отказаться от вопроса (ну, например, что раньше появилось плутоний или вобла, возможно, что таких сложных вопросов даже и не будет, или они наоборот будут достаточно интересными, или покажутся очевидными (конечно, вобла, плутоний изобрели позже) или открывать новые (обоснованные) направления в поиске).

Так, что есть способ за 100 000 вопросов сделать из этого блога линейную книгу по истории. Можно считать его альтернативой двум другим:

Вот уже три года я пытаюсь кому-нибудь из своих знакомых дать ссылку на ваш журнал, но никто (в том числе историки, которые годами не отлипают от учебников) не способен не только его прочитать, но даже открыть в браузере.

Это что касается вашего мини-блога fakexixcentury (именно на него я даю ссылку в первую очередь), который, на мой взгляд, интереснее и доступнее всего (и книг тоже). Правда, неплохо было, бы пост про Баркова убрать куда-нибудь с первой страницы.

А что касается этого блога, то здесь больше 8000 постов. Это пачка бумаги больше метра высотой (скорее всего, два).

Есть книга Фредерика Брукса «Мифический человеко-месяц» про то как в конце 60х годов в IBM при создании OS/360 документация к нему как раз была метр высотой. И был сделан вывод, что как только документация превышает метр высотой, то даже самая богатая корпорация США не способна найти метод, который позволил бы сделать так, чтобы люди эту информацию осознали. Причём, те самые люди, которые эту стопку бумаг написали. А второй вывод, который он сделал: чем больше людей эту документацию читают — тем больше её пишут и стопка бумаг становится ещё выше.

Технологии, вроде Гипертекста, всякие ссылки, интернет, Википедия (если распечатать все заголовки статей Википедии, то получится 12 000 страниц, тоже чуть больше метра) помогают хранить эту сильносвязанную информацию, но не осознавать. Человеку предоставляется свобода: перейти по ссылке или нет. И люди предпочитают не переходить.

Так, что в голову приходит два варианта:
A) Создать какой-нибудь распределённый проект по сбору постов с chispa1707 и оформить это (вместе с комментариями) в виде книги в десятки тысяч страниц. В HTML, Word или как-нибудь ещё. Потом распечатать и положить на стол. Что делать с этой стопкой высотой в два метра — неизвестно.

B) Перенести всё это на какой-нибудь вики-движок. Из преимуществ — только история изменений. Из недостатков — теряем комментарии. И возможность в любой момент сохранить это на диске, или автоматически сверстать книгу. Или серию томов по тегам. Но, поскольку, чтобы всё это перенести требуется огромное количество людей, то редакторы и станут комментаторами.

C) Создать вики-движок специально для истории, который будет автоматически превращать свою структуру в линейную датировку, которая даже может и не ложиться на годы, просто говорить что раньше, что позже. А годы присваивать постам параллельно, то есть получить статистическую строго упорядоченную по хронологии историю.

Тэги не позволяют информацию отсортировать. Они делят (в телефонном справочнике идеальные тэги от А до Я), и это помогает только в том случае, если деление производится таким набором тэгов, которые делят на несвязанные группы. А здесь метод сортировки будет обтёсывать посты на маленькие кусочки (путём роста постов доказательств), так, что всё это потом будет разложено идеально на возрастающей прямой.

3) Кластеризация. Может помогать в поиске, например, если кластеризовать камни по цвету (дать имя цвету), то разделять цветные камни будет проще. А можно использовать это для моделирования. Если кластеризовать куски земли (на основе хим.анализа, например) по количеству природных ископаемых в них, то, если этот метод кластеризации будет успешен, то он и будет моделированием. Или растановка тэгов в постах. Но кластеризация считается разделом искусственного интеллекта, поэтому человек сам расставляет тэги.

Вы меня порадовали и воодушевили. Все так и есть. Первый шаг сделан - это база данных в Экселе. И, конечно, требуется большее.

пункт B) сделан и публикуется мною на вики-сайте http://chispa.cf, где отсортированы и кластеризованы ВСЕ посты из https://chispa1707.livejournal.com и большинство комментариев к ним

после этого вопрос остался один: "доверять ли редактору, то есть мне?"

Ого! Вам доверять можно безоговорочно. Вопрос, что делать дальше. У Вас есть мысли на этот счет?

проект "степаненковщина" - большой и длительный
разные люди вкладывают по чуть-чуть
со стороны непонятно, кто чем занят

поэтому считаю все также актуальным говорить о специализированном сайте, как минимум, указывающем на ресурсы основных исследователей, а в идеале, и объединяющим их

понимать, кто чем занят нужно для того, чтобы искать помощников

вот как в случае с alpsrife:
  • ему пришли идеи A) Создать какой-нибудь распределённый проект по сбору постов... B) Перенести всё это на какой-нибудь вики-движок

  • я предлагаю ему реализацию в виде сайта http://hist.tk

  • диалог продолжится?


  • Edited at 2019-05-15 10:43 (UTC)

    Есть два ресурса, собравшие данные о нашей сфере: Ваш плюс http://www.istbat.ru/
    Ресурсы очень разные, и это хорошо.
    Я нетвердо понимаю, как что делать. Если у Вас есть идеи, силы и время, будет здорово, если сделаете то, что считаете нужным и возможным.

    что касается сайтов - это действительно технически сложно, и печально, что программисты не спешат кооперироваться ради новой хронологии

    сейчас моя задача - рассчитать изменения литосферы при смещении полюса

    Превосходная задача. Даже то, что уже сделано, превосходно.

    Есть способ как-то получить дамп базы?

    Базу сейчас отдельным постом выложу.

    То есть не базы, а mediawiki xml который.

    нужны ли пояснения к дампу базы от mediawiki?

    бекап сайта http://chispa.cf (он же http://hist.tk) хранится по адресу https://drive.google.com/drive/folders/1K17ADHdcitUip4zx6-hQUYx1FR3yGaRy?usp=sharing

    описание установки медиавики находится
    по адресу http://skills.gq/ew/installation, также могу скинуть файлы настроек

    • 1