klapauzius: (meme2)
[personal profile] klapauzius
А что, жж еще жив? Ну тогда вот.

Длинный пост (с картинками) про очередное домашнее исследование. На этот раз я взялся за любительскую историю.

Когда-то давно, читая лагерные воспоминания Евгении Гинзбург, я удивлялся столь тесному переплетению судеб различных личностей. Так, крутой маршрут свел ее с немецкой актрисой Каролой Неер, с женой Рыкова, с сестрой Камо, с женой Межлаука…

Миллионы разрозненных сведений о различных исторических событиях и персонах содержатся в разных хрониках, документах, мемуарах, и в общем и целом они нигде и никак не структурированы так, чтобы любой современный человек могбыстренько ими воспользоваться для своих насущных нужд.

Есть, конечно, специализированные картотеки, есть Википедия, но всё это сокращенное обобщение, грубо говоря, текст по основным топикам.

Представим, что кому-то хочется быстренько узнать список всех известных людей, которые были одновременно знакомы и с Пушкиным, и с Лермонтовым. Вот это уже проблема, это надо сводить пушкинистов и лермонтоведов, самому становиться специалистом, читать тонну труднодоступной литературы, просматривать картотеки, ну еще и не факт, что доберешься до всех нужных источников. При этом, хотя эти сведения, очевидно, существуют, они растворены в десятках текстах и не находятся по какому-нибудь простому запросу в гугле. Конечно, кто-то частично эту уже работу проделал http://goo.gl/CFXdvS, но ведь это единичный запрос из сотен подобных. Ну и хотелось бы иметь возможность сразу видеть источники этих сведений, быть уверенным в полноте и степени достоверности.

Или, допустим, цепь знакомств. Можно ли ее протянуть, скажем, от Сократа до того же Пушкина? По всей видимости, можно. Но чтобы ответить на этот вопрос, пришлось залезть в Википедию и часа три ее штудировать. Примерный вариант последовательности из 130 человек вышел таким:




Сократ → Платон → Аристотель → Александр Македонский → (Филипп III Арридей, Александр IV Македонский) → Кассандр → Антипатр I → (Деметрий I Полиоркет, Пирр) → Деметрий I Полиоркет → Стратоника Сирийская → Селевк I Никатор → Антиох I Сотер Антиох II Теос → Селевк II Каллиник → Антиох III Великий → Антиох IV Эпифан → (Антиох V Евпатор, Деметрий I Сотер) → Полибий → Птолемей V Эпифан → Птолемей VIII Эвергет → Птолемей X Александр I → Птолемей IX Сотер II → Птолемей XII Неос Дионис → Клеопа́тра VII Филопатор → Марк Антоний → Октавиан Август → Тиберий → Калигула → Клавдий → Нерон → Веспасиан → Домициан → Нерва → Траян → Адриан → Антонин Пий → Фаустина Младшая → Коммод → Септимий Север → Каракалла → Макрин → Диадумениан → Гелиогабал → Александр Север → Максимин I Фракиец → Гордиан II → Гордиан III → Филипп I Араб → Деций Траян → Гостилиан → Требониан Галл → (Марк Эмилий Эмилиан, Валериан I) → Галлиен → Аврелиан → (Ульпия Северина → Марк Клавдий Тацит → Марк Анний Флориан → Проб) → Марк Аврелий Кар → Диоклетиан → Галерий → Константин I Великий → Констанций II → Юлиан Отступник → Иовиан → Валентиниан I → Валент II → Феодосий I Великий → Амвросий Медиоланский → Аврелий Августин → Сикст III → Лев I (папа римский) → Гиларий (папа римский) → Симплиций (папа римский) → Феликс III (II) (папа римский) → Геласий I (папа римский) → Анастасий II (папа римский) → Симмах (папа римский) - Гормизд (папа римский) → Юстиниан I → Юстин II → Тиберий II → Маврикий (император) - Хосров II Парвиз → Кавад II → Ираклий I → Константин III Ираклий → Констант II → Константин IV → Юстиниан II → Филиппик → Иоанн VI (патриарх Константинопольский) → Григорий II → Лев III Исавр → Константин V → Лев IV Хазар → Ирина (византийская императрица) → Никифор I → Ставракий → Михаил I Рангаве → Лев V Армянин → Михаил II Травл → Феофил (византийский император) → Михаил III → Василий I Македонянин → Лев VI → Константин VII Багрянородный → Роман II (император Византии) → Анна Византийская → Владимир Святославич → Вышеслав Владимирович → Ярослав Владимирович Мудрый → Всеволод Ярославич → Владимир Всеволодович Мономах → Юрий Владимирович Долгорукий → Всеволод Юрьевич Большое Гнездо → Ярослав Всеволодович (князь владимирский) → Александр Ярославич Невский → Даниил Александрович → Иван I Данилович Калита → Иван II Иванович Красный → Дмитрий Иванович Донской → Василий I Дмитриевич → Василий II Тёмный → Иван III Васильевич → Василий III → Иван Грозный → Захарьин, Никита Романович → Филарет (патриарх Московский) → Михаил Фёдорович → Алексей Михайлович → Пётр I → Ганнибал, Абрам Петрович → Ганнибал, Осип Абрамович → (Пушкина, Надежда Осиповна) → Пушкин Александр Сергеевич.




Очевидно, впрочем, что это далеко не самая короткая и надежная, с точки зрения источников, цепочка. А как выявить самую короткую? Тут не обойтись без представления всех источников, событий и персон в виде заранее формализованных взаимосвязей и их последующей автоматизированной обработки. Но такого представления, увы, до сих пор нет.

В процессе построения связи между Сократом и Пушкиным я обнаружил, что у многих людей в Википедии прописано родство. В специальном вики-шаблоне описания персоны иногда указываются мать, отец, дети. Если члены семьи сами являются персонажами Вики, то это позволяет идти дальше и, страницу за страницей, вытаскивать цепочки родственных и брачных связей.

Ну что ж, хоть что-то, хоть как-то структурировано. Я скачал текст русской Википедии и обработал его. Оказалось, что у 30 тысяч персон (а это одна десятая всех людей, про которых есть вики-статья) те или иные члены семьи тоже попали в Википедию.

Насколько длинны эти цепочки родственных связей?

Подавляющее большинство связок тривиальны - это объединения двух-трех-четырех персон. Скажем, Александр Солженицын и его жена. Но есть, разумеется, и кластеры большого размера.

Наибольший интерес представляют длинные сети родственных взаимосвязей между историческими личностями. Оказалось, что на основе Рувики можно выделить 182 таких кластера с количеством членов от 10 человек.
Самый крупный и самый интересный из них - мегакластер на 12 тысяч человек - объединяет, преимущественно, членов монархических династий, их многочисленных потомков, а также семьи, с которыми они породнились.
В этот кластер, к примеру, входит и Карл Великий, и Рюрик, и Николай II, и Елизавета II, и даже Александр Сергеевич Пушкин.

Самый древний представитель этого кластера - Теодомер, вождь франков, он жил в 400-х годах нашей эры. Самой молодой представитель - внучка нынешней королевы Англии Елизаветы II Шарлотта, родившаяся менее года назад - в мае 2015. Она, кстати, является прямым потомком Теодомера. Между ними протянулась связь длинною в 73 поколения. Впрочем, это если идти по самой длинной цепочке прямых потомков. Можно найти между ними и более короткий путь, сократив число поколений и количество “пра” на два десятка.

К слову, Шарлотта Кембриджская является также прямым потомком Рюрика, Петра I и многих-многих других известных личностей.

Вот так выглядит схема, отображающая прямых предков Шарлотты: https://yadi.sk/i/1HgI-HKBmYrTM (более тысячи человек).

Этому мегакластеру исторически предшествует (однако, с точки зрения Вики, родственно с ним никак не связан) другой обширный кластер на 557 человек. Сюда входят, в частности, римские императоры и консулы. Этот кластер протянулся на 13 поколений. От Антигона I Одноглазого (300-е до н.э.) - полководца Александра Македонского - до Птолемея (царя Мавритании). Самой же близкой к нам по времени из этого кластера стала Домиция Лонгина, умершая в 120-х годах уже новой эры. Таким образом, два самых больших кластера отделяют друг от друга почти 300 лет.

Действительно ли на эти 300 лет прерывается родословная царствующих особ по всему фронту потомков? Существуют ли где-нибудь источники, которые позволят связать их? Может быть это просто Википедия еще не зафиксировала родственных связей между первым и вторым кластером, а какие-то историки хранят это тайное знание!

Третий по размеру кластер - это персонажи древнегреческой мифологии (216 мифических существ): родство, оказывается, бывает прописано и у сказочных персон.
Вот он, в сильно сокращенном виде (оставил лишь предков Одиссея). Здесь и далее имена персон приведены в виде названия соответствующих им вики-статей:



Раз уж зашла речь про мифологию, приведу и родственные связи между древнеегипетскими божествами, зафиксированные русской Википедией (12-й по размеру кластер - 44 божества):



Четвертый по размеру кластер - 111 человек - связывает грузинские княжеские рода. Пятый и седьмой кластеры - династии королевств и княжеств Уэльса (79 + 70 человек). Шестой - потомков Тимура, султанов и падишахов (74 человека). Восьмой кластер - это библейские персонажи (Иаков, Моисей и т. д.) - 65 человек.

Итак, видно, что когда информация о родственных связях перешла из простого текста в связную структуру, то стало возможным легко и быстро выяснять всякие интересные штуки. Например, находить кратчайшие родственные связи между персонами.




Для Петра I и Пушкина кратчайшая родственная связь выглядит так:
'Пётр I' -> 'Анна Петровна' (дочь) -> 'Пётр III' (сын) -> 'Павел I' (сын) -> 'Николай I' (сын) -> 'Михаил Николаевич' (сын) -> 'Михаил Михайлович' (сын) -> 'Меренберг, София Николаевна' (жена) -> 'Пушкина, Наталья Александровна' (мать) -> 'Пушкин, Александр Сергеевич' (отец)




Петр I был прапрапрадедом человека, который женился на внучке Пушкина.
Де Торби Анастасия Михайловна по отцу — правнучка императора Николая I, по матери — правнучка А. С. Пушкина.

А вот картинка, демонстрирующая кратчайшую родственную связь Ивана Грозного (1530-1584) и Елизаветы I (1533-1603), с которой он состоял в переписке.



Елизавета I и Иван Грозный являются прямыми потомками Маргариты Женевской и ее супруга Томаса I (графа Савойи), ну, если верить Википедии, конечно. Интересно, что, в отличие от Ивана Грозного, Елизавета I является потомком этой пары сразу по нескольким путям. Ну и, конечно, и Елизавета I, и Иван Грозный еще являются и потомками Ярослава Мудрого, но связь через Маргариту Женевскую намного короче.

Кстати, интересно, что несмотря на то, что последним из рода Рюриковичей среди российских правителей считается Василий IV Шуйский, прямые потомки Рюрика вернулись на российский престол и после его царства. Так прямым потомком Рюрика является Петр III, через своего отца - Карла Фридриха Гольштейн-Готторпского и, соответственно, ими являются и все последующие правители, вплоть до Николая II.

На выстроенной схеме родственных отношений стали мгновенно видны сотни ошибок и неточностей в заполнении Вики. Это и спутывание персон, которые в чем-то сходны по имени (например: указывается Пётр III вместо Пётр III (король Кипра)); это петли родственных связей, когда, к примеру, внук человека одновременно указан и его отцом, это и проставление родственных связей на основе бредовых источников (приходилось исправлять статьи, где ребенок рождался через десятилетия после смерти родителя, а иногда и до его рождения).


Так Ги II де Шатильон-Сен-Поль, согласно Рувики, являлся одновременно внуком и отцом Гоше III. (это далеко не единичный случай “петель”. Чаще всего они тянутся сразу через много поколений).


Очевидно, что можно легко выявлять персоны, для которых указано более двух родителей, или, например, однополых родителей. В целом же набор правил, которым должны удовлетворять родственные связи, довольно очевиден. И по каждому правилу легко можно найти примеры ошибочного заполнения Вики.
Есть также и неопределенности считывания текстовых данных. Например, вот так выглядит фрагмент генеалогического древа Калигулы (12-41гг н.э.):



Видно, что родители Калигулы были троюродными братом и сестрой. Но вот их общие прабабушка и прадедушка являются детьми сразу трех человек. Однако никакой ошибки тут нет: Луций Марций Филипп просто был приемным отцом Октавии Младшей и Октавиана Августа. К сожалению, автоматизированно выявлять такие случаи описания родственных связей довольно сложно, а иногда и попросту невозможно.

Намного эффективнее было бы изначально заносить родственные взаимосвязи не в простом текстовом виде, а при помощи специализированной надстройки, которая бы проверяла их корректность. Ну и позволяла бы, разумеется, в качестве бонуса строить любые фрагменты генеалогических деревьев, экспортировать их в открытые форматы.
На этом оставим генеалогию - она была лишь небольшим пояснением того, какие бонусы обычному человеку могло бы принести простое структурирование исторических материалов, вводимых на основе различных источников армией добровольцев.

Уверен, что тогда бы многие исторические находки были бы не уделом энциклопедистов, которым довелось прочитать некоторые редкие материалы и обнаружить в них противоречия (или дополнения), а происходили бы в результате автоматизированных формальных проверок.

Разумеется, родственные связи - это лишь жалкая часть того, что действительно стоило бы структурировать. Просто повезло, что в какой-то мере они расписаны уже сейчас.

Если бы существовал сервис, по типу Википедии, который позволял бы заносить различные варианты взаимосвязей между персонами, событиями, местами, на основе конкретных источников, то это позволило бы быстро определять историческую канву по любой стране, любому времени и любым персонам; определять, кто и на кого оказывал влияние. Можно было бы проверять различные версии событий, их последовательность; уточнять даты. Представить зафиксированные источниками сведения в виде наиболее непротиворечивой и взаимосвязанной структуры. Выявлять иерархии отношений, триггерные события и т. д. Ну и в дополнение оценивать качество источников по степени их согласованности и многое другое.

Ну раз сервиса не существует, то, наверное, пришла пора его создать :)

Date: 2016-01-11 12:23 pm (UTC)
From: [identity profile] krokusheff.livejournal.com
ще не вмерло жж

Date: 2016-01-21 09:24 am (UTC)
From: [identity profile] meggirita.livejournal.com
Пока не вмерло. Но надежда есть.

Date: 2016-01-11 04:46 pm (UTC)
From: [identity profile] juan-gandhi.livejournal.com
Это прекрасно.

Когда-то я на бумажках выписывал всех персонажей Илиады (чтоб не путать двух "братьев"); выяснилось много родственных связей.

Но такое - это прекрасно. Конечно, надо как-то создать. И питать его с вики, например. Ну или еще откуда, дополнительно.

Date: 2016-01-11 07:07 pm (UTC)
From: [identity profile] link0ff.livejournal.com
С вики питается DBpedia.org, но она еще оставляет желать лучшего - пару лет назад я пытался составить SPARQL-запрос, который сортировал бы статьи о трагикомедиях по их рейтингу в IMDB, используя доступные свойства, как например, в http://dbpedia.org/page/The_Discreet_Charm_of_the_Bourgeoisie, но не хватило имеющейся информации.

Date: 2016-01-12 07:55 am (UTC)
stas: (Default)
From: [personal profile] stas
Возможно, сейчас с https://www.mediawiki.org/wiki/Wikidata_query_service у вас получится лучше. Это тоже SPARQL, но для wikidata.org.

Date: 2016-01-11 05:53 pm (UTC)
From: [identity profile] http://users.livejournal.com/_dna/
Заграничные ребята много сделали подобного здесь
http://www.geni.com
Но это только родственные связи.
А вот знакомства - это непаханное поле, да.

Date: 2016-01-11 06:39 pm (UTC)
From: [identity profile] notabler.livejournal.com
Давайте, создавайте!

Date: 2016-01-11 07:12 pm (UTC)
From: [identity profile] link0ff.livejournal.com
DBpedia.org парсит данные из вики, например, http://dbpedia.org/page/Peter_the_Great
В wikidata.org данные вводятся вручную, например, https://www.wikidata.org/wiki/Q8479
Сравнение: http://www.semantic-web-journal.net/system/files/swj1141.pdf

Date: 2016-01-12 12:14 pm (UTC)
From: [identity profile] klapauzius.livejournal.com
По поводу wikidata - хороший проект, туда можно, очевидно, занести всё о чем я говорю, но с тем же успехом, наверное, эти данные можно заносить и прямо в википедию, создав дополнительные продвинутые шаблоны.

Проблема в том, что интерфейс викиданных не привлекает добровольцев для внесения нужной информации. Вносить данные относительно сложно, нет проверок, нет дополнительных фич, нет вообще понимания для чего это. По моему ощущению, главным пользователем этого является условный гугл для повышения качества ответов на поисковые запросы.

Под исторические взаимосвязи можно сделать удобный простой интерфейс, который в качестве бонуса позволял бы получать разные фрагменты сети, осуществлял различные виды поиска и т.д.

И, конечно, потом можно было бы все сведения скармливать и wikidata.
Edited Date: 2016-01-12 12:33 pm (UTC)

Date: 2016-01-12 03:59 pm (UTC)
stas: (Default)
From: [personal profile] stas
Шаблоны как раз скоро и будут из Wikidata данные брать. Уже начинают, собственно, работа над этим сейчас вовсю ведётся. Ну и, конечно, в обратную сторону, из шаблонов в Wikidata.

Насчёт вноса данных - это известная проблема, над ней тоже работают. Например, есть специальные игры для вноса данных:

http://tools.wmflabs.org/wikidata-game/
https://tools.wmflabs.org/wikidata-game/distributed/
ну и тут ещё куча всего:
https://www.wikidata.org/wiki/Wikidata:Tools/External_tools

Автор игр - Магнус Манске - это тот человек, который написал софт для первой версии википедии. Он как раз в последнее время над этим много работает. Работа не стоит на месте :)

Date: 2016-06-15 08:34 am (UTC)
From: [identity profile] p2004r.livejournal.com
Есть несколько аплетов на флеше реализующих методику "интеллектуальной разведки".

RelFinder и т.п. http://www.visualdataweb.org/tools.php

Date: 2016-06-15 10:00 am (UTC)
From: [identity profile] p2004r.livejournal.com
К онтологическо базе Википедии подключено (причем почти "намертво" :( мне удалось оторвать только частично и не увы не всё) несколько приложений от visualdataweb.
(Ссылку заскринило в комменте выше.)

RelFinder, SemLens, gFacet, tFacet

Они вполне позволяют проверить сделанную в топике работу в автоматическом виде.

Второй вариант, это загрузить данные в Protege (или если объем уж очень велик окажется в Sesame) и запустить резонер "по правилам выводящим родство".

Date: 2016-01-11 07:14 pm (UTC)
From: [identity profile] stan podolski (from livejournal.com)
создать то не сложно. Но кто будет платить за банкет

Date: 2016-01-12 12:04 am (UTC)
From: [identity profile] xyrr.livejournal.com
Действительно ли на эти 300 лет прерывается родословная царствующих особ по всему фронту потомков?

Весьма интересный вопрос. Возводить предков к римской эпохе у царствующих домов Европы одно время было модно.

Теодомер - франк, то есть из варваров. Беглый гуглёж показывает, что отец его Рихомер приходился дядей Флавию Арбогасту, франкскому военачальнику, возвысившемуся при императоре Валентиниане настолько, что смог сначала отстранить, а затем и убить императора и поставить на престол своего друга Евгения в 392 году. Возмущённый узурпацией, император восточной части Феодосий низложил Евгения военной силой и установил своего ставленника Гонория, а Арбогаст покончил с собой. Если верно предположение, что Арбогаст был сыном военачальника Бавтона, то его сестра Элия Евдоксия - жена восточного императора Флавия Аркадия.

В свою очередь Флавий Аркадий - сын Феодосия I, его же отец - римский военачальник Феодосий Старший. Далее вики сообщает:

There is some evidence that Flavius Theodosius's father was called Flavius Julius Honorius, and his uncles Flavius Julius Gerontius and Flavius Julius Eucherius. He himself was called Flavius Julius Theodosius, claimed descending from the gens Julia through Gaius Julius Caesar's cousin Sextus Julius Caesar.

Т.к. Домиция Лонгина из более старшего кластера была прямым потомком Августа, а Август находился в прямом родстве с Цезарем, то получается, кластеры оказываются таким образом связаны.

Date: 2016-01-12 07:53 am (UTC)
stas: (Default)
From: [personal profile] stas
Для подобных вещей и существует Wikidata :)

И, кстати, вот ещё проект: http://sixdegreesoffrancisbacon.com/

Date: 2016-01-12 12:20 pm (UTC)
From: [identity profile] klapauzius.livejournal.com
по поводу wikidata ответил чуть выше, что касается второго проекта - то интересно, но непонятно, зачем они сузили так свое поле деятельности.

Date: 2016-01-12 04:00 pm (UTC)
stas: (Default)
From: [personal profile] stas
Я думаю, сузили, чтобы можн было когда-нибудь закончить :) Иначе это же гигантский массив работы. Там сейчас 13,443 человек.
Edited Date: 2016-01-17 09:41 pm (UTC)
From: [identity profile] livejournal.livejournal.com
Пользователь [livejournal.com profile] schegloff сослался на вашу запись в своей записи «Занимательное викиведение (http://schegloff.livejournal.com/1092084.html)» в контексте: [...] тта, родившаяся менее года назад - в мае 2015. Она, кстати, является прямым потомком Теодомера. [...]

Date: 2016-06-14 07:26 am (UTC)
From: [identity profile] palaman.livejournal.com
Прекрасно!
Большое спасибо за этот текст. Очень резонирует с моими мыслями и масса новой информации.

Помимо родственных связей была бы страшно полезной информация о личных знакомствах. Это просто непочатый край, причем находки иногда взрывают мозг. Например, я случайно обнаружил, что брат Пилусдского был осужден по смерть (потом помиловали) вместе с братом Ленина. Если добавить к этому тот факт, что Ленин и Керенский знакомы с детства, то получается просто феерическая картина.

Если бы была база данных по личным знакомствам, я уверен, обнаружились бы ещё более поразительные "совпадения".

Date: 2016-06-14 07:42 am (UTC)
From: [identity profile] none-smilodon.livejournal.com
Очень круто. Грузинский кластер это скорее всего грузинские и армянские Багратионы. На расстоянии потому-что их в Европе и не признали полноценными суверенами, браки с ними были мезальянсами. Рюриковичей европейская аристократия проглотила на правах малозначительного рода. Интересно было бы посмотреть на гедиминовичей, особенно на потомком Ольгерда с сотоварищами. Думаю, если пройтись по польской, украинской и беларусской вики четко вылезет отдельный кластер, при чем в активностью и в 20-м веке.

Date: 2016-06-14 10:12 am (UTC)
From: [identity profile] ammosov.livejournal.com
Да вряд ли. Уже в конце 14 в. на Руси было полно служилых внуков-правнуков Гедимина, которым земли не досталось или досталось только титул воткнуть. А с 16 в. все родословные "к Гедимину" примерно одинаково легендарны.

Date: 2016-06-14 07:43 am (UTC)
From: [identity profile] palaman.livejournal.com
Две нижние картинки почему-то не видны :(

Date: 2016-06-14 11:27 am (UTC)
From: [identity profile] klapauzius.livejournal.com
С картинками какой-то глюк. Можно посмотреть запись в фейсбуке - там они сохранились: https://goo.gl/kLA1T3

Date: 2016-06-14 08:02 am (UTC)
From: [identity profile] alex-mashin.livejournal.com
Пётр III — не Рюрикович, а Ольденбург. По мужской линии он происходит от Элимара I, графа Ольденбургского.

Date: 2016-06-14 10:09 am (UTC)
From: [identity profile] ammosov.livejournal.com
Монархическим родословным особенно доверять не стоит. Они писались с целью аргументировать территориальные претензии, и там много художественности. Меровинги как-то размахались и возвели себя аж к Христу, но это им не помогло.

Вот наберется побольше данных по гаплогруппам, и можно будет плюс-минус двести лет прикинуть их общих предков.

А вообще куда интересней другое исследование, которое показало, что все кельты Европы и их потомки - правнуки четырех вождей бронзового века, причем половина - одного.
Page generated Dec. 25th, 2025 03:03 pm
Powered by Dreamwidth Studios