2. 1. ПРАВИЛЬНЫЙ ХРОНОЛОГИЧЕСКИЙ СПИСОК ИМЕН
В главе 1 было введено понятие ХРОНОЛОГИЧЕСКОГО СПИСКА ИМЕН,
снабженного разбиением на главы и приведены примеры реальных
хронологических списков. В настоящем разделе мы рассмотрим задачу
проверки гипотезы Н_0 о том, что хронология того или иного
хронологического списка имен является ПРАВИЛЬНОЙ.
Уточним понятие правильного списка по сравнению с
определением, данным в главе 1. А именно, будем называть
хронологию списка имен Х ПРАВИЛЬНОЙ, если список не является
результатом размножения и последующего ``поблочного тасования''
(склейки со сдвигом и локального перемешивания) некоторого
другого, БОЛЕЕ КОРОТКОГО списка Y. В противном случае будем
говорить, что список Х СОДЕРЖИТ ДУБЛИКАТЫ. Под дубликатами
понимаются первоначально одинаковые (при тасовании они могут быть
искажены) отрезки различных экземпляров списка Y, содержащиеся в
Х (см рис. 17).
Также как и в модельной задаче, мы допускаем возможность
СЛУЧАЙНЫх искажений каждого из экземпляров списка Y, лежащих в
основе списка Х, однако предполагаем, что локальные искажения в
удаленных друг от друга частях списков ВЗАИМНО НЕЗАВИСИМЫ.
2. 2. СОПРЯЖЕННЫЕ ИМЕНА И ИМЕНА-РОВЕСНИКИ.
МАТЕМАТИЧЕСКИЙ ФОРМАЛИЗМ
Следуя описанной в предыдущем разделе методике, рассмотрим
вероятностную схему случайного равновероятного выбора с
возвращением двух имен из списка Х и определим случайную величину
\Вз\А -- РАЗНЕСЕНИЕ выбранной пары имен.
Напомним обозначения характеристик списка Х:
n -- общее число имен в списке Х (с учетом кратности их
вхождения в список);
m -- число различных имен списка Х;
N -- число глав списка Х.
Имена списка Х мы будем обозначать буквами a_i, где индекс
указывает на порядковый номер данного имени в списке:
X = {a_1, a_2,..., a_n}.
Обозначим через I множество различных имен списка Х. Это
множество состоит из m имен (m