Приложение D. Источники данных по демографической ситуации и имитационная модель, приведенная в гл. 6. «От фермы к фабрике»

I. Данные переписи, использованные в рамках анализа моделей общего уровня рождаемости

1. Определение пределов выборки и общего уровня рождаемости Выборка для данного анализа представляет собой расширение (в случае с 1939 г. замену) набора данных, сведенных в рамках исследования Коала, Андерсона и Харм (1979, 20–21, 28-33, 88), где авторы вычисляли показатель рождаемости (ПР) для выбранных ими «провинций». (В данном случае термин «провинция» подразумевает губернии в 1987 г., а также области, края, автономные республики, а иной раз и полноценные республики в 1939 и 1959 г.). С географической точки зрения выборка авторов включала преимущественно 50 провинций европейской части России, упоминаемых в переписи 1897 г., прочие же регионы ими практически не затрагивались. В текущем исследовании выборка была расширена за счет включения в спектр анализа регионов Кавказа, Центральной Азии и Сибири.

Данный анализ также структурирован по географическому принципу — европейская часть России, Кавказ, Центральная Азия и Сибирь для исследования 1897 г., а также области, края и автономные республики Российской ССР и Украинской ССР (так у автора. — Примеч. пер.) в 1939 г. и прочие республики. Структура данных за 1959 г. приблизительно совпадала с 1939 г. с той лишь оговоркой, что теперь в спектр анализа включались области Белоруссии. Полный объем данных содержит в себе 283 обзора. Источником расчетов стали российские архивы — Центральный статистический комитет (1905) и Российская академия наук (1992) и советские — Центральное статистическое управление (1962–1963).

Первым шагом к сведению данных стало определение общего уровня рождаемости. При этом на протяжении всего изучаемого периода невозможно вычислить показатели рождаемости в провинциях по возрастному принципу, поэтому расчет общего коэффициента рождаемости производился на основе ПР, который представляет собой фактическое количество случаев появления детей, деленное на вероятное количество случаев появления детей в ситуации, когда женское население страны демонстрирует возрастные коэффициенты брачной рождаемости гуттеритов [именно эта модель использована в работе Коала, Андерсона и Харм (1979, 262, примеч. 4)]. То есть общий уровень рождаемости был вычислен путем умножения ПР на 12,195 — общий коэффициент рождаемости среди гуттеритов.

Измерение рождаемости с помощью ПР имеет одно преимущество: его расчет можно производить без учета возрастных показателей рождаемости. В работе Коала, Андерсона и Харм приводится ПР (показатель рождаемости) для исследованных ими провинций — именно их выводы были использованы в текущем анализе. На практике это означало переоценку их данных за 1939 г. (которые они относят к 1940 г.) в соответствии с предельными значениями 1939, а не 1959 г., которые авторы применяли в своей модели. Требовалось оценить также ПР для областей и прочих территориальных единиц, включенных в спектр анализа Коала и др., по следующей методике.

Аналогично Коалу и др., фактическое количество случаев появления детей в каждой области в 1939 и 1959 г. вычислялось на основе общих коэффициентов рождаемости за 1949 и 1960 г. соответственно, опубликованных в выпуске № 1 «Вестника статистики» за 1965 г. (86–91). Более сложный метод использовался для расчета данных за 1897 г. Данные по ПР, приведенные в работе Коала и др., позволили восстановить количество рождений детей в изученных ими провинциях европейской части России. Это количество было скоррелированно с численностью детей в возрасте менее 1 года и в возрасте от 1 до 9 лет (по данным переписи населения), чтобы спрогнозировать количество рождений на основе статистической информации по возрастным показателям населения Кавказа, Центральной Азии и регионов Сибири. При этом регрессия на численность населения в возрасте от 1 до 9 лет оказалась более эффективным методом, поскольку данные по числу детей младше 1 года в большинстве районов Центральной Азии были занижены.

Расчет теоретического количества случаев появления детей был произведен путем наложения модели гуттеритов на численность женского населения по каждой из приведенных в переписи групп. (Предполагалось, что возрастное распределение женщин во всех группах приблизительно совпадало. Перепись населения за 1939 г. содержала данные только по общему возрастному распределению мужчин и женщин в каждой области. Поэтому общее соотношение мужского и женского населения в каждой возрастной группе, данные по которым были приведены по Советскому Союзу в целом, позволяло в итоге вычислить количество женщин в каждой возрастной группе по каждой области.)

2. Независимые переменные

В рамках анализа роль независимых переменных выполняли доля урбанистических провинций, доля провинций с мусульманским населением, а также количество лет, затраченных на образование мужчин и женщин.

Численность городского населения рассчитывалась для каждой провинции, области и т. д. по каждой переписи населения. Данные по распределению религиозных предпочтений населения были зафиксированы при проведении переписи в 1897 г., кроме того, данные советских переписей отражали национальный состав населения страны, при том что национальность классифицировалась по принадлежности к одной из традиционных религий. Это позволяло определить долю мусульманского населения в общей структуре путем суммирования численности той части населения, которая имела отношение к какой-либо мусульманской нации.

Данные по количеству лет, затраченных мужчинами и женщинами на получение образования, были получены из информации по степени образованности взрослого населения страны. В 1897 и 1939 г. были выделены 3 категории населения: грамотное население, население со средним уровнем образования и население с высшим образованием. Также переписи этих лет отражали количество грамотных мужчин и женщин по каждой провинции, области и т. д. Данные по доле населения, имеющего среднее и высшее образование (также по гендерному признаку), были зафиксированы в 1897 г., однако спектр анализа включал более обширные территориальные единицы, например европейскую часть России, Кавказ и прочее. Впоследствии была произведена разбивка на городскую и сельскую категории населения. Кроме того, удалось произвести распределение укрупненных данных по провинциям путем деления на доли, прямо пропорциональные численности городского населения. Вероятность ошибок в этом случае мала, поскольку величина общих показателей в этот период ничтожна. Перепись 1939 г. показала количество мужчин и женщин, имеющих среднее и высшее образование, по каждой области и в рамках других территориальных единицах. При этом те, кто имел высшее образование, были отнесены к категории людей, затративших на его получение 14 лет, люди со средним образованием — к категории 9 лет, а те, кто не имел никакого образования, но при этом являлся грамотным, — к категории двухлетнего обучения в 1897 г. и трехлетнего в 1939 г., когда образовательные программы стали распространяться более широко. Согласно заключению, к которому в свое время пришел Струмилин, уровень доходов работника завода, имевшего неофициальное образование, был аналогичен уровню доходов работника с двухлетним образованием. Именно этот вывод позволил сформировать то количество лет, которое можно было отнести к категории «грамотности» (Крисп. 1978, 388).

Перепись 1959 г. давала более подробную классификацию. По методике работы Карасика (1992, 371), эти данные были распределены по следующим категориям: законченное высшее образование (16 лет), неоконченное высшее образование (14 лет), среднее специальное образование (11 лет), общее среднее образование (9 лет), полное или неоконченное начальное образование (3 года).

II. Имитационные прогнозы общего уровня рождаемости и анализ его снижения

Построение данных имитационных моделей требовало введения временных рядов независимых переменных в уравнение Шульца. Эти переменные — образование, урбанизация и религиозная принадлежность — рассчитывались на основе данных переписей и их кроссвыборки, описанной чуть выше для 1897, 1939 и 1959 г. В списке других источников данных:

Образование — Джонсон (1969, 173, 285), Тимашев (1942, 82, 86, 87);

ВВП на взрослого человека — уровень подушевого ВВП взят из работы Мэдиссона (1995), данные по доле взрослого населения (старше 20 лет) — из следующих работ: Андреев, Дарский и Харькова (1992, 133 и далее), Жиромская, Киселев и Поляков (1996, 67–69), статистика ООН (1991, 360) за 1950–1985 гг.;

калории — см. гл. 7, приложение С и данные ФАО ООН (1991, 238);

религия — Барретт (1982, 689);

урбанизация — Байрох (1988, 221, 290), Лоример (1946, 154, 158), Жиромская, Киселев и Поляков (1996, 67–69), статистика ООН (1987, 53);

доля сельского хозяйства — Шанин (1986, 64), Грегори (1972, 433), Дэвис (1990, 251), данные ФАО ООН — Производственный ежегодник, разные годы.

III. Имитационная модель роста численности населения

Построение имитационной модели начинается с определения возрастной структуры населения в 1926 г., приведенной в работе Андреева, Дарского и Харьковой (1992, 134), которая проецируется на последующие периоды путем суммирования с показателями рождаемости и уменьшения на показатели смертности.

Расчет уровня рождаемости предполагает вычисление повозрастных показателей рождаемости для женщин для каждого года в 1926–1989 гг. Андреев, Дарский и Харькова (1992, 150) в рамках своего анализа приводят оценки этих показателей за период 1926–1959 гг.; данные по более поздним периодам взяты из изданий «Население СССР» (1973, 137) и «Народное хозяйство» разных годов выпуска. При этом приводимые в указанных издания цифры по уровню рождаемости для возрастных категорий с пятилетним интервалом применялись ко всем возрастам в рамках интервала.

Расчет показателей смертности также требует повозрастного анализа уровня смертности мужчин и женщин во всех возрастных категориях. Данные за 1926–1958 гг. были заимствованы из исследования Андреева, Дарского и Харьковой (1992, 133 и далее), в рамках которого авторы воспроизводят распределение мужского и женского населения по возрастным категориям для каждого года за период 1920–1959 гг. Они также приводят численность мужского и женского населения в виде пятилетних интервалов, поэтому сравнение численности обеих гендерных категорий за один год с численностью возрастной группы на 5 лет старше за следующий отчетный год и дает искомый уровень смертности. Для проведения такой операции потребовалось восстановление уровня смертности в 1926, 1931–1939, 1941, 1946, 1951, 1956 и 1958 г. Введение в анализ показателей детской смертности также дало возможность вычислить средний уровень смертности детей в возрасте от 1 до 4 лет. Данные для расчетов за периоды после 1959 г. взяты из «Народного хозяйства» разных годов выпуска.

Название книги

От фермы к фабрике

Аллен Роберт С.

Приложение D. Источники данных по демографической ситуации и имитационная модель, приведенная в гл. 6