D
derbenat
Окончание
Распознавание и корректировка
Начинается основная работа. Говорить о том, как проделывается вычитка, думаю нет надобности. Поэтому только перечислю ошибки FineReader'а на которые надо обратить внимание.
1. Размер шрифта должен быть одинаковым для одинаковых разделов. Например, для основного текста Times New Roman - 11 пт, для подписей к картинкам Times New Roman - 8-9 пт, полужирный. Правда с нечетными размерами шрифта FineReader может производить "свои" операции - "ожирнять" простой текст (он становится, как бы на четверть жирным). Поэтому можно переделывать шрифт (если завысить величину полей, он таким будет изначально), основной - 10 пт, подписи к картинкам - 8 пт, но текст становится немного растянутым.
2. Номера страниц. Их, обычно надо распознавать дополнительно. Для этого в верхнем левом (или нижнем) окне вокруг номера страницы рисуете курсором (при нажатой левой кнопке мыши) квадратик, щелкаете по нему правой кнопкой и выбираете - распознать. Если FineReader не хочет распознавать, то выбираете тип объекта распознавания - текст, и повторяете операцию.
3. Иногда FineReader пропускает картинки. Тогда обведите картинку тем же квадратиком и определяете ее тип как картинку. При наличии какого-либо текста, она сразу появляется в правом верхнем окне. Если текста нет, то назначьте какой-нибудь участок текстом, распознайте его, и если там будут даже каракули, картинка появится. Потом удалите блок с текстом - картинка останется.
4. Там где имеется фигурное обтекание картинки текстом, FineReader часто подрезает участки картинки, и приходится резать линии ограничивающие зону распознавания, чтобы подвинуть их. Для этого наведите курсор на точку, в которой будете резать линию, нажмите Shift, появится крестик, тогда щелкните левой кнопкой мыши. На линии появится квадратик разрыва. После передвигания линия не забудьте распознать зону с текстом заново. Результаты переиодически можно проверять конвертируя страницу в PDF.
5. Иногда текст в верхнем правом окне выходит за пределы зоны распознавания. Это не обязательно ведет к тому, что в PDF'е строка будет высовываться. Небольшой выход допускается и FineReader засунет ее как надо (проверьте конвертацией в PDF). Если выход слишком большой, то выделите всю строку, щелкните по выделенному правой кнопкой и нажмите "свойства символа". Там измените масштаб шрифта (можно набить любое значение вручную, а не выбирать фиксированное) и щелкните по окошку с размером шрифта. После этого закройте "свойства символа". Только не уменьшайте интервал, это часто не действует.
6. Большую сложность вызывают развороты страниц. В этом случае приходится делать дубликат пакета. В первом сохраняю те страницы, которые напрямую конвертируются в PDF, а во втором оставляю страницы, которые конвертирую в MS Word, там обрабатываю, чтобы не было полей в месте соединения страниц, конвертирую в PDF, а потом добавляю в первую часть. Если их оставить в первом пакете, то потом придется эти страницы удалять, но их след вызовет увеличение конечного PDF'а. Имеются более сложные варианты, из-за недостатков Word'a, но я пока ими не занимался.
7. Проходим по всем картинкам. Шлепаем по ним правой кнопкой и в строчке "цветность картинок" выбираем "серая (для фотографий)" - для черно-белых картинок, и "цветная (для фотографий)" - для цветных. Для черно-белых картинок это делается обязательно.
В принципе вся книга готовится прямо в FineReader'е. Затраченное время определяется качеством исходника. При очень хорошем качестве, текст практически не требует вычитки. Но в FineReader'е возможна пакетная замена ошибок, для этого надо выбрать "Заменить" в разделе "Правка".
Настройки для конвертации в PDF я объяснять не буду. Все увидите сами по размерам выходного файла. Единственное - не забудьте выставить тот размер листа, который был заложен в опциях на открытие в FineReader'e.
Если чего пропустил, прошу сообщить.
Распознавание и корректировка
Начинается основная работа. Говорить о том, как проделывается вычитка, думаю нет надобности. Поэтому только перечислю ошибки FineReader'а на которые надо обратить внимание.
1. Размер шрифта должен быть одинаковым для одинаковых разделов. Например, для основного текста Times New Roman - 11 пт, для подписей к картинкам Times New Roman - 8-9 пт, полужирный. Правда с нечетными размерами шрифта FineReader может производить "свои" операции - "ожирнять" простой текст (он становится, как бы на четверть жирным). Поэтому можно переделывать шрифт (если завысить величину полей, он таким будет изначально), основной - 10 пт, подписи к картинкам - 8 пт, но текст становится немного растянутым.
2. Номера страниц. Их, обычно надо распознавать дополнительно. Для этого в верхнем левом (или нижнем) окне вокруг номера страницы рисуете курсором (при нажатой левой кнопке мыши) квадратик, щелкаете по нему правой кнопкой и выбираете - распознать. Если FineReader не хочет распознавать, то выбираете тип объекта распознавания - текст, и повторяете операцию.
3. Иногда FineReader пропускает картинки. Тогда обведите картинку тем же квадратиком и определяете ее тип как картинку. При наличии какого-либо текста, она сразу появляется в правом верхнем окне. Если текста нет, то назначьте какой-нибудь участок текстом, распознайте его, и если там будут даже каракули, картинка появится. Потом удалите блок с текстом - картинка останется.
4. Там где имеется фигурное обтекание картинки текстом, FineReader часто подрезает участки картинки, и приходится резать линии ограничивающие зону распознавания, чтобы подвинуть их. Для этого наведите курсор на точку, в которой будете резать линию, нажмите Shift, появится крестик, тогда щелкните левой кнопкой мыши. На линии появится квадратик разрыва. После передвигания линия не забудьте распознать зону с текстом заново. Результаты переиодически можно проверять конвертируя страницу в PDF.
5. Иногда текст в верхнем правом окне выходит за пределы зоны распознавания. Это не обязательно ведет к тому, что в PDF'е строка будет высовываться. Небольшой выход допускается и FineReader засунет ее как надо (проверьте конвертацией в PDF). Если выход слишком большой, то выделите всю строку, щелкните по выделенному правой кнопкой и нажмите "свойства символа". Там измените масштаб шрифта (можно набить любое значение вручную, а не выбирать фиксированное) и щелкните по окошку с размером шрифта. После этого закройте "свойства символа". Только не уменьшайте интервал, это часто не действует.
6. Большую сложность вызывают развороты страниц. В этом случае приходится делать дубликат пакета. В первом сохраняю те страницы, которые напрямую конвертируются в PDF, а во втором оставляю страницы, которые конвертирую в MS Word, там обрабатываю, чтобы не было полей в месте соединения страниц, конвертирую в PDF, а потом добавляю в первую часть. Если их оставить в первом пакете, то потом придется эти страницы удалять, но их след вызовет увеличение конечного PDF'а. Имеются более сложные варианты, из-за недостатков Word'a, но я пока ими не занимался.
7. Проходим по всем картинкам. Шлепаем по ним правой кнопкой и в строчке "цветность картинок" выбираем "серая (для фотографий)" - для черно-белых картинок, и "цветная (для фотографий)" - для цветных. Для черно-белых картинок это делается обязательно.
В принципе вся книга готовится прямо в FineReader'е. Затраченное время определяется качеством исходника. При очень хорошем качестве, текст практически не требует вычитки. Но в FineReader'е возможна пакетная замена ошибок, для этого надо выбрать "Заменить" в разделе "Правка".
Настройки для конвертации в PDF я объяснять не буду. Все увидите сами по размерам выходного файла. Единственное - не забудьте выставить тот размер листа, который был заложен в опциях на открытие в FineReader'e.
Если чего пропустил, прошу сообщить.
Последнее редактирование модератором: