О проекте
Чем помочь
Чем делать
Делается
@контакты
Как делать

Естественно, вряд ли можно всё необходимое объять сразу, так что, в ходе работы проясним - при задавайте технологические вопросы на форуме, в этой ветке.

Оформление в Word

Итак, мы имеем выправленные текст, без оформления, который надо обработать в Ворде, чтобы он стал оформленным в соответствии со стандартом Милитеры. Чтобы потом оформленный текст можно было читать, как обычный файл doc, и в то же время из него можно было с помощью макросов сотворить полностью размеченный файл html. Макросы написаны не особенно изящно, но они работают. Если кто-то может улучшить / облагородить их, будет неплохо. Все нижеперечисленные макросы + некоторые другие находятся на этой странице.

1. Подготовительная часть. Надо применить несколько макросов, чтобы облагородить текст

1. 1. Если в текст с сохранением разделения на строки, надо применить макрос mLINES - он убирает жёсткие переносы, сохраняя нужные дефисы, потом сшивает строки.

1. 2. Если книга взята в сети, и отформатирована так, что каждая строка отбита переводом каретки (как, к примеру, Бунин у Мошкова на Lib.ru), надо применить макрос mMOSHKOV.

1. 3. Если в книге есть разорванные строки, применяем макрос mBREAKLINE.

1. 3. Если в тексте есть дроби (обычно в старых книгах, в довоенных), применяется макрос mFRACTIONS - он преобразует дроби, типа 1/2, 1/4, в нужный формат (½, ¼).

1. 5. Запускаем макросы mPREPAGE и mUNIVERSAL. Эти макросы отбивают абзацы, устраняют лишние пробелы, проставляют длинные тире и правильные кавычки, ну и много чего ещё делают, долго описывать - результат будет налицо.

Теперь о пагинации (нумерации страниц) и примечаниях и ссылках на них.

2. Пагинация. Если номера страниц планируется расставлять в книге, то она сохраняется в Файнридере с разбивкой на страницы. В вордовском файле страницы книги будут отделены друг от друга 'разрывом раздела'. Это физические страницы. Макрос меняет символ разрыва раздела на служебный значок [123], и убивает ненужные цифры (номера страниц). Это потому, что номера страниц (цифры) на страницах самой книги, при распознавании, в общем-то, не нужны - часто они неверно распознаются, иногда не попадают в область сканирования, и т.д. Надежнее делить разворот книги (что мы и делаем), чтобы получалась одна страница = одно изображение. Поэтому наша задача - чтобы между страницами стояло [123]. Что и делает макрос mPAGESOCR.

Потом надо глянуть, с какой страницы в книге-оригинале начинается нумерация. Например, с 5-й, соответственно надо, чтобы нумерация в файле тоже начиналась с 5-й страницы, т.е. с [5]. Вы ставите тогда перед первым в файле значком [123] ещё 4 таких же значка, чтобы получилось следующее: [123] [123] [123] [123]. Затем с помощью макроса mAMPAGES проставляете реальные номера страниц - этот макрос заменяет все [123] на [1] [2] [3] [4] [5] [6] - и т.д. страницы. Вам надо только правильно определиться с первой страницей.

Номера страниц не должны стоять в начале строки, абзаца, а только в конце строки. Они не отделяются пустой строкой, а идут подряд. Они не разделяют слово (даже если в книге слово разделено - часть на одной странице, а часть на следующей); в этом случае слово склеивается, а номер ставится после этого слова. Номера страниц в примечаниях - если они и в книге обознчены римскими цифрами - нами также оформляются римскими цифрами.

3. Примечания. Если у вас текст, в котором ссылки сделаны в верхнем регистре, то есть вот так123, можно применить макрос mAPP2OP - он их преобразует в {123}. Именно в таком виде нам и нужны примечания. Не обязательно скрупулёзно, одну за другой сверять ссылки с источником и нумеровать всё подряд. Нужно лишь одно - чтобы на месте каждой ссылки стоял значок {123}, и кол-во таких значков совпадало и соответствовало самим примечаниям. Но если вам удобнее сверяться - делайте, как вам удобнее, особенно, если ссылок немного.

Иногда приходится ставить ссылки вручную - например, текст из сети, где ссылки могут обозначаться по-разному: идти в скобках сразу за предметом примечания, или это могут быть просто цифры, которые автоматически нельзя определить. И если надо ставить вручную, не обязательно их нумеровать, просто надо на месте каждой ссылки поставить {123}.

Когда будут проставлены {123}, примените макрос mAMNOTES, и он последовательно пронумерует все ссылки. Естественно, самих примечаний в этом файле быть не должно, их надо будет обработать в другом файле.

Ссылки должны быть сквозными. Т. е., все ссылки должны быть после текста книги. Не после каждой главы, не внизу страницы, а после всего текста. Ссылка ставится перед знаком препинания, если таковой идёт за словом, к которому идёт примечание. Ссылки оформляются в фигурных скобках. В некоторых книгах есть несколько видов ссылок, они оформляются по-разному - {*123} или {I}.

Теперь, когда текст подготовлен, надо его оформить.

4. Элементы. Все книги содержат определённое число элементов, например: заголовки, цитаты, эпиграфы и т. д. В одних книгах больше, в других меньше. Вот все возможные элементы:

ЭлементСтиль
Эпиграфe
Стихотворениеv
Цитатаblock
Примечаниеno
Заголовок (том)h1
Заголовок (часть)h2
Заголовок (глава)h3
Подзаголовок 1h4
Подзаголовок 2h5
Подзаголовок 3h6
Подглавокu
Название таблицыtabname

Соответственно, вы должны сделать стили, которые будут называться как в колонке Стиль.

И этими стилями надо оформлять текст. Параметры стилей (шрифт, цвет, абзацы и т. д.) значения не имеют, главное, чтобы каждый элемент был оформлен стилем с соответствующим названием.

Эпиграф оформляется стилем e. Если эпиграф (посвящение) даётся ко всей книге, то он располагается до текста. Если это эпиграф к главе, то сначала идёт заголовок, потом эпиграф, потом текст. Подпись к эпиграфу - стиль e1.

Стихотворения оформляются стилем v. Строки пробелом не разделяются, кроме строф (если они есть).

Цитаты. Цитаты оформляются стилем block. Цитаты - это фрагменты документов, других книг, записей и т.п. Эти фрагменты должны быть отдельными от текста книги (цельными абзацами). Т.е. не надо выделять как цитату фрагмент документа, если он встроен в предложение, или представляет собой кусок предложения.

Примечания. Это не те примечания, на которые сноски даются в фигурных скобках, а примечания к таблицам, или ещё к чему-нибудь, в общем то, что обычно даётся мелким кеглем, стиль no.

Заголовки и подзаголовки. Когда в заголовке присутствует слово 'глава' (например - Глава 5. Новые приключения гуркхов на Новой земле) то заголовок оформляется именно так: слово 'глава' и номер - не жирным, а название главы - жирным. И после номера ставится точка.

Встречаюся иногда подзаголовки в виде цифр, римских или арабских. Тогда применяете макрос mROMAN - и он присвоит им стиль h3.

Иногда под названиями глав (в старых книгах) даётся краткое описание содержания главы (подглавок). Оно оформляется стилем u.

Таблицы. С таблицами надо обходиться так (имеется в виду, что таблица уже готова, проверена): вы копируете её и вставляете в новый файл. Потом применяете макрос mTABLE. И получившуюся таблицу переносите в старый файл вместе старой таблицы. Примечания к таблице (собственно примечания, или источники, любая доп. информация) оформляются стилем no.

У некоторых таблиц бывают названия, например, 'Таблица ?47', или 'Таблица 12. Динамика эффективности снижения', или просто: 'Потери сторон'. Во всех случаях применяется стиль tabname.

Если у таблицы есть слитые ячейки, придётся потом дорабатывать в html.

Что касается выделения жирным, курсивом, или подчёркиванием, то стилей для этого не надо, можно применять обычные средства Ворда.

Если встречаются нестандартные вопросы - например, в книге греческий текст, или она в старой (до 1918 г.) орфографии, то есть макросы, которые могут с этим (и не только) помочь - на этой странице.

Cайт сделал Hoaxer в марте 2001 г. Переделал 5.II.2002 г. Доделал 5.X.2002 г. Обновил 3.I.2004. Реформировал 1.IV.2009. Улучшил 12.I.2012. Новая версия запущена 20.01.2014. Яндекс.Метрика