Создание инструмента научных исследований на основе XML: Проблемы и методология - страница 2
1.1. О проекте
Некоторая вводная информация представлена на web-сайте проекта: ( http://webapp1.dlib.indiana.edu/letopis/index.jsp?lang=ru). Это кракий обзор проекта «Летопись журнальных статей»:
Цифровая Библиотечная Программа университета Индианы получила грант от Департамента Образования США в рамках Раздела IV «Технологическая программа» с целью перевода в электронный формат и представления на World Wide Web «Летописи журнальных статей» за период в двадцать лет (1956—1975 гг.), библиографического указателя советских периодических изданий, издающегося с 1926 года по настоящее время. Указатель охватывает более чем 1700 журналов, серий и продолжающихся публикаций академий, университетов, научно-исследовательских институтов в областях гуманитарных, естественных наук, наук об обществе, а также популярную периодическую литературу. Переведенная в электронный формат и помещенная в World Wide Web Летопись обеспечит доступ к периодической литературе важного периода российской истории, начинающегося с хрущевской «оттепели», следующей за двадцатым съездом коммунистической партии советского союза (КПСС), и продолжающегося вплоть до первой половины так называемой брежневской «эпохи застоя». Студенты и ученые, изучающие российскую политологию, литературу или историю периода 1956—1975 гг. безусловно оценят по достоинству «Летопись журнальных статей».
1.2. Мотивы осуществления проекта
Стимулов осуществления проекта оцифровывания было два. Первый — увеличение возможностей использования указателя. Использование печатного варианта Летописи представляет определенные трудности. Летопись издавалась еженедельными выпусками, общего указателя по Летописи не существует, так что поиск по ней довольно сложен и занимает много времени. Цифровая версия позволит осуществлять поиск по всему двадцатилетнему периоду Летописи, который мы переводим в электронный формат, что существенно облегчит использование и увеличит полезность указателя.
Второй мотивирующий фактор реализации проекта это необходимость сохранения указателя. Печатная версия была издана на бумаге с высоким содержанием кислоты, которая со временем стала очень хрупкой и в настоящее время стремительно разрушается. Перевод в электронный формат поможет сохранить ценный научный источник, каким является Летопись. Помимо XML версии указателя мы заархивируем оцифрованные изображения страниц.
1.3. Структура «Летописи журнальных статей»
Структура DTD Летописи повторяет структуру печатного варианта. В печатном варианте Летописи библиографические ссылки структирировны по более чем 300 предметным заголовкам. Предметные заголовки имеют трех-ступенную иерархию. Первый уровень включает 33 предметных заголовка, подразделяемых в свою очередь на подзагловки второго и третьего уровня. Заголовки первого уровня пронумерованы с использованием римских цифр; разделы второго уровня пронумеровны с использованием арабских цифр. Для третьего уровня подзаголовков были использованы строчные кириллические буквы. Ниже приведены некоторые примеры заголовков из иерархии:
I. Марксизм-ленинизм
1. Произведения основоположников марксизма-ленинизма.
2. Литература об основоположниках марксизма-ленинизма. Работы по марксизму-ленинизму.
XIII. Государство и право
1. Общие вопросы. Теория и история государства и права.
2. Государство и право СССР.
а. Общие вопросы. Советское строительство. Государственное и административное право.
б. Другие отрасли советского права.
в. Суд и прокуратура. Работа органов юстиции.
1.4. DTD «Летописи журнальных статей»
Ниже приводится DTD, которое мы используем для кодирования Летописи. Оно имеет элемент letopis, который вбирает в себя выпуски за несколько лет. В нем таже имеются контейнерные элементы для года и еженедельных выпусков. Мы использовали три элемента подразделов (div1, div2 и div3) для обозначения предметных подзаголовков внутри трехступенчатной предметной иерархии. Элемент cit заключает в себе одну библиографическую ссылку. Дополнительная информация об этих и других элементах и атрибутах содержится в комментариях к DTD приводимых ниже.