произвольной случайной последовательности. При помощи комплекса
VERDIA нами был проведен анализ ряда конкретных исторических текстов.
Результаты этого анализа изложены в следующем параграфе.
2. ВЫЯВЛЕНИЕ ОДНОРОДНЫХ И НЕОДНОРОДНЫХ ФРАГМЕНТОВ ВНУТРИ
БИБЛИИ, РУССКИХ ЛЕТОПИСЕЙ, РИМСКИХ И ГРЕЧЕСКИХ ХРОНИК
(Б.Е.Бродский, Б.С.Дарховский, Г.В.Носовский, А.Т.Фоменко)
2.1. ВВЕДЕНИЕ
В современной математической статистике большое применение
нашел важный метод разладки, созданный А.Н.Ширяевым. В настоящей
работе кратко описываются результаты интересного численного
эксперимента, идея которого была впервые предложена А.Н.Ширяевым.
Эта идея и статистический эксперимент обсуждались на
научно-исследовательском семинаре "Геометрия и статистика",
работавшем под руководством А.Т.Фоменко и А.Н.Ширяева в
математическом ин-те им В.А.Стеклова АН СССР. Цель эксперимента -
применить метод разладки к важной задаче выявления, распознавания
"однородных кусков" внутри достаточно больших исторических (и более
общо, - т.н. нарративных) текстов. К таким текстам относятся, в
частности, исторические хроники, летописи и т.п. Теоретические основы
метода разладки см. в предыдущем разделе Б.Е.Бродского и
В.С.Дарховского.
Выявление информативных количественных характеристик текстов и
предварительная обработка исторических текстов (в частности, русских
летописей и исторических книг Библии) были выполнены Г.В.Носовским и
А.Т.Фоменко. Статистический анализ и компьютерный эксперимент были
затем проведены Б.С.Дарховским и Б.Е.Бродским. Большую помощь при
этом нам оказали Т.Толозова, А.Громова и Л.Мищенко. Мы выражаем им
глубокую благодарность.
Сейчас мы опишем постановку задачи, полученные результаты и их
интерпретацию. Многие древние исторические источники (летописи,
хроники и т. д.) составлены из отдельных фрагментов (кусков) разной
природы. Например, эти отдельные куски могли быть написаны в разное
время разными авторами (в разных странах), а потому могут существенно
отличаться друг от друга своим характером, языком и стилем изложения,
степенью подробности, эмоциональной окраской и т.д. Затем могло
случиться так, что эти отдельные фрагменты были объединены (каким-то
более поздним хронистом) в одну книгу. После этого первоначальное
происхождение этих текстов-фрагментов забывалось и они начинали
существовать, "спаянные" в единое целое внутри какой-то одной
летописи. С течением времени в результате многократной переписки
книг, их изменений под влиянием разных "редакторов" и под
воздействием многих других причин, внешние различия, существовавшие
первоначально между различными фрагментами (составляющими "новый
большой текст") постепенно стирались. Сегодня такие составные тексты
часто воспринимаются как единое целое, поскольку предистория их
возникновения давно забыта.
Возникает естественный и важный вопрос: можно ли, опираясь на
численный (статистический) анализ различных частотных характеристик,
выявить сегодня внутри "единого большого текста" эти первичные
составные части, куски, т.е. можно ли снова разрезать большой текст
на его "первичные (древние) фрагменты-первоисточники" ?
В основу излагаемого ниже метода положена идея, согласно
которой каждый первичный, древний фрагмент (кусок) был более или
менее "однороден". Например, он мог быть написан одним автором, а
потому несет на себе характерный отпечаток одной индивидуальности
(единый стиль, манера и т.п.). Поскольку эта гипотетическая
индивидуальность по-видимому "мало менялась" в процессе написания
одного текста, то можно сформулировать естественную гипотезу (модель)
о "первичной однородности" фрагментов, написанных одним автором, в
одно время (или в рамках одной исторической школы хронистов,
летописцев).
Эта на первый взгляд простая идея, сформулированная
А.Н.Ширяевым и А.Т.Фоменко, оказалась полезной при анализе конкретных
исторических текстов. Более того, оказалось, что результаты,
полученные на основе применения этой идеи и статистического
исследования Б.С.Дарховского, Б.Е.Бродского и Г.В.Носовского
(применительно к конкретным историческим текстам) хорошо согласуются
с независимыми результатами, полученными применением совсем других
методов (тоже статистического характера).
В качестве численной характеристики исследуемого текста была
взята функция объема, введенная выше. Напомним ее определение.
Предположим, что исторический текст X разбит на "главы" X(t), где
каждая "глава" это фрагмент текста, посвященный описанию событий
одного года t. Такова структура очень многих древних летописей. Эта
структура условно изображена на рис.10.1. Например, слева на
странице указываются годы (по эре от сотворения мира, или по эре Р.Х.
и т.п.) и рядом с каждым годом соответствующий фрагмент, излагающий
события, происшедшие (по мнению хрониста) именно в этом году. Это и
есть фрагменты X(t). Можно вычислить объем каждого фрагмента. Объем
можно измерять, например, числом строк, или числом страниц, или
числом знаков и т.д. Таким образом, мы получаем последовательность
чисел - объемов глав X(t). Эти числа удобно изобразить в виде графика
(рис.10.2).
Выбор единицы измерения объема здесь для нас абсолютно
несущественен, так как изменение единицы измерения приводит лишь к
смене масштаба по вертикали на рис.10.2.
Излагаемый ниже метод разбиения больших исторических текстов на
однородные и неоднородные куски применим не только к графикам объема
текстов, но и к другим численным характеристикам. Для упрощения
изложения мы будем говорить здесь лишь о функциях объемов.
Выше мы говорили об однородных кусках исторических текстов.
Однако в действительности, мы разобьем тексты на т.н. стационарные
куски, являющ)=6, (144)=2,3, (147)=1, (150)=1,1,
(155)=3, (161)=2, (164)=2, (168)=7,1,6,25, (175)=3,12,2,9,1,1,
(182)=1,4, (186)=1, (190)=1, (194)=2,2,2, (203)=1,1, (209)=1,
(218)=1.
72 --- (72)=22,9, (76)=13, (78)=1, (98)=4, (101)=15, (137)=20,6,
(168)=3, (192)=4, (194)=2.
73 --- (73)=84,18, (76)=146,14,80,2,1,2,5,3,2,2,2, (88)=3, (90)=5,
(95)=2,3,3,2,3, (101)=9,4,1, (117)=1, (122)=1, (126)=1,
(132)=1,7, (135)=2,1,101,28, (143)=1, (145)=3, (147)=1,
(149)=1,1, (155)=3, (158)=1,3,7,3,1,10,6, (167)=4,5,
(170)=56,9, (175)=14,9, (178)=8, (180)=34, (183)=1, (190)=3,
(192)=3, (194)=1, (197)=1, (218)=1.
74 --- (74)=503,178,454,58,258,3,8,1,1, (87)=1,1,2, (91)=1,
(97)=2,4,22, (101)=27,6, (104)=1,4,2, (126)=1, (128)=5,
(130)=3, (133)=1, (135)=2, (137)=76,78,6, (143)=2, (146)=1,
(151)=1, (153)=2,2,1,1, (158)=1,3,1,3, (163)=1,1,4,
(167)=29,33, (171)=17, (175)=4,6, (179)=7, (185)=3,
(189)=5,6,1,190,116,135,274,94,2,11,9,12,2, (203)=7,44,29,24,
18,22,23,10,17,13,15,16,4,7,27,16.
75 --- (75)=7, (102)=1, (134)=1,1, (175)=1,1, (182)=1, (196)=1.
76 --- (76)=415,39,61,9, (81)=1,1,1, (88)=3,7,2, (97)=5, (99)=119,8,
13,7, (104)=1, (127)=3, (129)=4,1, (135)=6,1,82,28, (141)=2,
(147)=2,1, (151)=1, (163)=5, (165)=2, (167)=4,16,1, (171)=11,
(174)=1,1,21, (178)=7,3,3, (182)=1, (185)=2, (188)=3,
(192)=2,1,1,6,4, (199)=1, (203)=2,1, (217)=1,3.
77 --- (77)=4, (137)=5, (170)=1, (175)=1.
78 --- (78)=43,7,2,3,5, (84)=8, (86)=3, (88)=2, (97)=1,
(99)=1,1,32,18,4,2,4,3, (108)=8,1, (112)=2, (115)=1,
(120)=2,1,17,2,3, (126)=6,3,2,1,6,3, (133)=9,2,17,12,18,18,14,
1,4,7,1,1,1, (147)=1, (149)=4,7,4,2,2,6,5,4,2,5,2,10,1,12,8,
11,4,11,48,39,1, (171)=18, (173)=5,8,47,119,7,29,10,6,5,3,2,
(185)=8, (188)=5, (190)=38,2,13,10,33,13,62,1, (204)=5,
(207)=5, (217)=2,3.
79 --- (79)=7.
80 --- (80)=1, (88)=1, (99)=3,1,2, (135)=1, (175)=1.
81 --- (81)=23,1,2, (187)=1.
82 --- (82)=31,11, (171)=1, (217)=1.
84 --- (84)=18,15,21,9, (99)=1, (101)=1, (112)=1, (123)=1,9,10,15,
(137)=1,1, (148)=1, (152)=1, (154)=5,7, (180)=1, (182)=1,
(217)=1.
85 --- (85)=8,2, (171)=2.
86 --- (86)=24, (101)=1,2, (137)=5, (171)=1.
87 --- (87)=27, (102)=2, (124)=1, (127)=6,1, (137)=3,1, (156)=2,4,
(162)=1, (167)=1, (175)=2, (180)=1, (185)=1, (192)=2.
88 --- (88)=1, (101)=1, (138)=2, (150)=1.
89 --- (89)=22,5, (99)=1, (217)=1.
90 --- (90)=5, (137)=3, (164)=1.
91 --- (91)=19,9,9,19, (217)=1.
94 --- (94)=7, (99)=10, (137)=1.
95 --- (95)=8,12, (101)=1, (137)=6,4, (168)=3.
96 --- (96)=1, (99)=29,43,23,2, (137)=7,4, (147)=1, (167)=2,5, (176)=4.
97 --- (97)=1, (99)=2, (101)=3,8, (137)=1, (171)=1.
98 --- (98)=84, (100)=317,285,62,6,4,6, (112)=1, (120)=2,1,
(123)=1,1, (126)=2,2,2,1,1,1,2,1,1, (137)=19,182,33,4,3,1,4,
(146)=1,1, (151)=5, (153)=4,2, (157)=1,1,5,1, (162)=3,2,2,3,
(167)=3,8, (171)=88,1,1,1,12,15, (178)=4, (180)=1, (182)=2,
(190)=6, (192)=26,7,17,2,12, (204)=4, (214)=1, (217)=2,3.
99 --- (99)=92,33,84,9, (104)=8,7, (107)=9,23,10, (111)=4,
(113)=9,12,2, (121)=1,2, (127)=3, (131)=1, (137)=39,31,1,1,2,
1,11, (151)=1, (153)=1, (159)=2, (168)=6,1,6,12, (175)=56,78,
(179)=2, (181)=1,7, (185)=1,2,2,2,13,42,22,31,17,23,22,37,2,
21,9,11,4, (203)=6,71,71,51,41,47,38,27,15,13,17,16,4,7,16,11.
100 -- (100)=97,157,31, (137)=16,32, (167)=3,2, (171)=3, (175)=1,
(193)=1.
101 -- (101)=435,269,6,2,3, (109)=4, (112)=23,3, (115)=9, (118)=1,
(120)=21,16,4,5,8,5, (127)=1, (133)=1, (135)=1,4,51,105,77,2,
5,1,2, (147)=9,11,4,15,10,12,9,11, (157)=1, (159)=1,1,2,
(163)=1, (165)=2, (167)=16,23,1, (171)=4,3, (174)=6, (176)=28,
(178)=6, (181)=2,1, (188)=1, (192)=10, (194)=5,1,3.
102 -- (102)=56,22,30,11,9, (111)=2,2, (115)=2, (121)=2,3,
(125)=6,8,17, (129)=4, (134)=1,2, (137)=26,17,9,15,10,15,13,
(145)=2, (151)=1,1,2, (156)=2, (158)=1,3, (161)=2, (165)=1,
(167)=4,11, (171)=1, (176)=1, (179)=5,1, (182)=4, (192)=2.
105 -- (105)=32,16, (110)=14,1,3, (118)=1, (120)=2,1, (125)=3,
(137)=3, (143)=1,6,8,17,2, (150)=1,1, (176)=3, (182)=1,
(192)=2.
106 -- (106)=42,1,20,6,4,24,6,1, (115)=2, (120)=10,32,26, (124)=1,
1,1,1, (133)=2, (137)=4,2, (148)=5,2,2,3,9, (155)=1,1,
(167)=2,6, (176)=2, (185)=2, (218)=1.
108 -- (108)=7, (137)=1, (159)=1, (167)=1, (183)=1.
109 -- (109)=5, (114)=13,3,7,6,11,1,8,4, (125)=7, (194)=1.
111 -- (111)=18, (121)=4.
112 -- (112)=21, (120)=4,6,2,3,1,1,1, (134)=1, (136)=6,5, (147)=1,16,
(150)=3, (152)=11, (164)=1, (166)=2, (168)=3, (176)=52,
(185)=1.
113 -- (113)=3.
115 -- (115)=1.
116 -- (116)=7,3, (120)=1.
117 -- (117)=11, (194)=1.
120 -- (120)=1, (123)=6, (152)=3,3,1.
121 -- (121)=1.
122 -- (122)=1, (125)=9,3, (135)=3, (151)=1, (155)=3, (164)=1, (166)=3.
123 -- (123)=2, (152)=2,1, (176)=1, (192)=2.
124 -- (124)=6,1,11,2, (137)=4,1, (147)=2, (154)=3,16,2, (182)=3.
126 -- (126)=4,2, (130)=1, (137)=3,9, (147)=1, (150)=1,1,
(154)=1,1,1, (159)=2, (164)=1,1, (167)=6,6, (175)=1, (184)=18,
(190)=4, (192)=7, (194)=14,4.
127 -- (127)=40,23,2,3, (132)=1, (135)=1, (137)=7, (156)=13,3,9,1,
(167)=1,1, (175)=22,2, (180)=1, (182)=1, (185)=1, (190)=1,
(192)=4.
128 -- (128)=1, (130)=17,9,15,1, (137)=3, (158)=2,7,5,9,19,1,
(167)=1,2, (172)=1, (175)=33,3, (185)=1, (188)=1, (192)=2.
129 -- (129)=8,1,1, (175)=1,3.
130 -- (130)=23,7, (134)=6,3, (137)=9,15,1, (150)=1, (159)=4,
(162)=5, (164)=8,3,1,3,12, (171)=11, (175)=28,2, (192)=2,
(194)=1.
131 -- (131)=13,11, (137)=1,3, (156)=2, (159)=1, (161)=1,4, (167)=1,
1, (175)=28,3, (182)=8, (192)=6,1,3,4,3, (204)=5.
132 -- (132)=3.
133 -- (133)=6,2,10, (137)=4, (163)=1,2,13,1,1,1, (176)=18, (188)=1,
(190)=1, (192)=4,3,1, (196)=1.
134 -- (134)=21, (136)=2,13,11, (153)=1, (158)=1, (164)=13, (167)=8,
18, (176)=17.
135 -- (135)=14,6,5,4, (158)=1, (163)=1, (165)=4,7,1,13, (176)=159,
(178)=1,3, (190)=1, (192)=5.