Разыскивается anti-djvu

randomize

Турист
Регистрация
26 Ноя 2003
Сообщения
29
Реакции
1
Credits
36
Собственно, есть куча книг в djvu, хочется привести их в более читаемое состояние, подскажите, плиз, чем их распаковать, только не по 1 странице руками, а все страницы сразу.
 

belkin

Турист
Регистрация
15 Июн 2004
Сообщения
4
Реакции
0
Credits
8
можно попробовать напечатать на виртуальный PDF принтер, например FinePrint PDF Factory, а потом уже PDF-ку распознавать FineReader-ом
 
B

berez

печать через pdf качество не увиличит... Djvu это картинка.... и достаточно мелкая... при печати на pdf занимает всего лишь четверть страницы..по умолчанию... соответственно чем больше её увеличиваеш тем хужк становится качество.... и тем длинее геморой с разпознанием через FineReader......

randomize попытайся найти в нете в нужном тебе формате.... нынче книг развелось...в любом формате..
 

verhovetc

Местный
Регистрация
7 Окт 2005
Сообщения
63
Реакции
13
Credits
102
Посмотри в книжном разделе на предмет прорамм для работы с текстом. И в Янвексе.
И зря ты так на djvu нападаешь, если у кого-то руки кривые - это не значит что формат плохой. ИМХО совсем даже наоборот.

Кстати, для перевода в pdf рекомендую CutePDF Writer. Проблем с "четвертью" страницы не наблюдал ни разу, если только формат не "четверть страницы". Для дальнейшей работы с pdf - pdf2all.

Можно сразу конвертировать djvu в jpg, bmp, tif - есть специальные программы - ищи...
 
Последнее редактирование модератором:

org

Местный
Регистрация
19 Ноя 2004
Сообщения
92
Реакции
9
Credits
152
randomize
а я может чего-то не допонял..
опиши поточнее что тебя не устраивает..
тебя не устраивает, что формат дежавю, и его просматривать не удобно
или что сами странички книг в нем в плохом качестве?

дежавю это не обязательно картинка - если книга распознана, то оттуда можно выдергивать текст, почти также как из pdf..
 

randomize

Турист
Регистрация
26 Ноя 2003
Сообщения
29
Реакции
1
Credits
36
org написал(а):
а я может чего-то не допонял..
опиши поточнее что тебя не устраивает..
дык хочется просто распознать книжки и перевести, ну хотя бы в ворд
 
B

berez

org написал(а):
дежавю это не обязательно картинка - если книга распознана, то оттуда можно выдергивать текст, почти также как из pdf..
весьма интересно... получаетс что если я из word сделал дежавю там будет возможность поиска?
 

wert111

Местный
Регистрация
7 Май 2004
Сообщения
85
Реакции
14
Credits
0
randomize, попробуй так:
djvu->tiff(DjvuOCR)->FineReader->doc
 

Ognev

ex-Team DUMPz
Местный
Регистрация
20 Авг 2004
Сообщения
2,079
Реакции
908
Credits
0
berez,
Djvu - это не обязательно только картинка, этот формат поддерживает текстовый слой. Если он заполнен, то ... сам понимаешь, текст есть текст :)

А касательно темы ... На мой взгляд, Djvu часто бывает слишком плохого качества для распознавания. В этом случае качественного распознавания добиться будет слишком сложно. Так что, стоит десять раз подумать, стоит ли "шкурка выделки".