|
Форматы
Раньше много, много отсканированных книжек лежали месяцами (да что там месяцами - годами) из-за того, что не хватало сил их выправить и оформить как следует, теперь все такие книги будут выкладываться на Милитеру, и будут доступны всем, хоть и неправленные, такое их наличие лучше чем полное отсутствие.
Если книга распознана, текст выправлен, оформлен и переведён в html, то книга появляется на Милитере в обычном виде, как это всегда было + теперь все такие книги дополняются файлом chm, запакованном в rar. Это значит, что книгу можно скачать одним файлом, и в этом файле они будет отображаться в точности, как на сайте (с примечаниями и с иллюстрациями). А поскольку chm -- это файл справки Windows, он откроется на любом компьютере с этой операционной системой.
Если книга распознана, но текст не выправлен и, соответственно, не оформлен и не переведён в html, то такая книга выкладывается с титульным листом, как обычно, но вместо глав в html будут два файла -- djvu (как правило, с текстовым слоем, кроме некоторых книг в старой орфографии, распознавать которые нецелесообразно) + doc неправленный.
Если книга добыта из сети в текстовых форматах (типа html, xml, txt, dtp, doc, fb2 etc), и текст уже выправлен но но отформатирован под МИлитеру, такие книги будут переконвертироваться в doc и выкладываться на Милитеру в виде: титульный лист + файл doc правленный. По возможности, постепенно, такие книги будут оформляться как надо, ну а пока пусть учитываются и прочитываются.
Если книга добыта из сети в графических форматах (pdf как картинки, djvu, или набор отсканированных страниц в jpg и т.п.) то она распознаётся и выкладывается на сайт в виде: титульный лист + djvu с текстовым слоем + doc неправленный.
Если книжку наши сети притащат в виде текстового pdf (т. е. текст обычно уже выправлен), такая книга выкладывается как этот самый pdf + doc неправленный, который представляет собой извлечённый из pdf текстовый слой.
Отдельно о djvu (т.к. именно в нём будет карт, схем и много книг). Значительная часть книг в этом формате (в сети) -- без текстового слоя. Поэтому все такие книги, которые приходят в djvu, будут распознаваться, и выкладываться в виде djvu c текстовым слоем + doc неправленный. Наличие текстового слоя в djvu даст возможность поиска по тексту и его копирования.
Желающим просодействовать в правке или форматировании книг, просьба прочитать эту страницу.
^ |