RussianArms.SU Бесплатный военно-технический и исторический архив

8. Правила, рекомендации, просьбы, пожелания, напутствия, тосты => 8.3. Сканирование и обработка книг или "у каждого свой вкус" - сказал кобель, облизывая свои яйца => Тема начата: БТТ от 2011 Мая 19, 22:16:12

Название: Сканирование и обработка книг. Общие вопросы
Отправлено: БТТ от 2011 Мая 19, 22:16:12
Сразу оговорюсь, все ниже приведенное не панацея, а токмо дабы можно было начать. Постиг данную науку с помощью коллег по russianarms.ru, за что им низкий поклон. Всех уже и не вспомню, так что не обессудьте.
Как собственно это делаю я.
Сканирую в TIFF с разрешением 300 dpi в формате "оттенки серого" для черно-белого изображения и в формате "цветное" для цветного. Сканер HP Deskjet F4213 All-in-One (даже на таком "сарае" можно добиться хорошего качества, так что не стесняйтесь начинать).
После сканирования весь материал прогоняю через программу Scan Tailor. Достаточно простая программа, не требующая особых навыков в работе с компьютером.
Выходные данные при обработке устанавливаю 600 dpi.
Если в отсканированном материале встречаются страницы с черно-белыми фотографиями - прогоняю их в режиме "смешанный", а если с цветными - "цветной/серый". Все остальное в режиме "черно-белый".
Обработанный материал кодирую либо в djvu либо в pdf (качество лучше, но и объем больше).
Вот собственно и весь "секрет".
Уважаемые коллеги, если я ошибся или что-то пропустил - исправте/дополните пожалуйста.
Название: Re:Сканирование и обработка книг. Общие вопросы
Отправлено: Arrested от 2011 Мая 24, 14:43:37
По функционалу альтернативы девятому или десятому Акробату пока что нет, при наличии изрядной доли терпения в нем файл можно ужать до вполне сопоставимых с djvu размеров и качества. Но если время дорого, то лучше сразу кодировать в djvu.
Небольшой пример: кодировал jpeg-и в pdf (Акробат Х) и djvu (Document Express Editor 6.0.1), чтобы максимально ужать pdf, пришлось "попробовать" 10 раз, причем предпоследний раз вышел абсолютно нечитаемым, пришлось увеличивать разрешение, в djvu кодировал не глядя на настройки.
Многое еще зависит от исходного материала, например если книга старая, а бумага сильно желтая, то в djvu в режиме "черно-белый" качество будет кошмарное, в других режимах будет большой файл. Вот тут рациональнее сохранять в  pdf, поигравшись с настройками постобработки. Ничего сложного нет, пробуйте, со временем найдете "золотую середину" между объемом файла и качеством изображения и все будет получаться.
Название: Re:Сканирование и обработка книг. Общие вопросы
Отправлено: БТТ от 2011 Мая 24, 14:47:44
Я кодировал PDFCreator. Пока ХР стояла было нормально, но вот на 7-ке чегось комп тормозит.
Вообще вариантов куча.
Совет: прислушайтесь к мнению arrested. Плохого не посоветует. На себе проверил  :)
Название: Re:Сканирование и обработка книг. Общие вопросы
Отправлено: W-600 от 2011 Мая 24, 21:58:31
А зачем вообще писать кто что делал? Все же под никами, кто что может предъявить?
Название: Re:Сканирование и обработка книг. Общие вопросы
Отправлено: ScrewDriver от 2011 Мая 24, 22:05:23
А нафиг вообще писать кто что делал? Все же под погонялом, кто что может предъявить?

Так ить эта, я и не пишу. Я и не помню. У меня сейчас полная коллекция под 600 документов, и бог его знает, какие я сам сканил, а какие обрабатывал. Знаю, что из них сам отсканил всего около двухсот книг, какие-то помню, какие-то нет...
Название: Re:Сканирование и обработка книг. Общие вопросы
Отправлено: RA3DCS от 2011 Мая 26, 12:49:54
В pdf (13,1 Mb): http://narod.ru/disk/14071750001/Perechen_zapchastey.pdf.html

Arrested, Вы не могли бы конвертировать эти книги в формат DJVU, в формате PDF качество значительно хуже.

Самолет типа 69. Иллюстрированные перечни запасных частей. Комплектации 1:1; 1:2; 1:4; 1:10; 1:20; 1:40. 1977(jpg)
Самолет типа 69. Иллюстрированный каталог узлов и деталей. Книга 2. Группы 8-17. 1974(jpg)

Я уже пробовал, получилось довольно коряво (много цветового мусора, отдельные мелкие детали вообще неразличимы), будет свободного времени больше, сделаю обязательно.
Название: Re:Сканирование и обработка книг. Общие вопросы
Отправлено: RA3DCS от 2011 Мая 26, 13:16:33
И не стоит бороться за минимальный объём - качество имеет приоритетное значение

Я тоже так считаю!!!!
Если мне эта книга нужна я найду способ скачать ее в любом объеме, какой бы он не был.
А кому не нужна, то и качать не нужно.
Просто обидно бывает, скачиваешь книгу и объем небольшой, но качество!
Название: Сканирование и обработка книг. Пошаговые инструкции.
Отправлено: SuvorovAV1956 от 2011 Мая 26, 14:05:54
В тексте (символах) ещё заложена определенная избыточность.
В чертежах и рисунках её быть не может.
А за некачественно сохраненные принципиальные электрические схемы, так вообще, следует помещать в Петропавловскую крепость.
В противном случае - поощрять - квартирой(ами) в пределах Садового Кольца.

Эх! Вот если бы Дума должна была состоять из одних технарей...
Название: Re:Сканирование и обработка книг. Общие вопросы
Отправлено: ScrewDriver от 2011 Мая 26, 14:33:27
Перевод в черно-белое или коррекция цвета убивают "дух времени"
Наши материалы вряд ли необходимы в печатном виде "для практического применения"
Так зачем убирать цвет, отпечатки, надписи и прочее?

Я вижу свою лично идею фикс, высшую цель, каприз, снобизм, хобби, дурость, героизм - можно назвать это как угодно - в другом: я пытаюсь сохранить книги для, как это ни громко будет сказано, потомков в том виде, в котором они были изданы. А не в том, в котором их нашли на чердаке, в хранилище библиотеки, или (пардон, но бывает и такое) на помойке. Насколько это возможно сделать.

Как я уже указывал, сырец скана книги без потери качества весит гигабайт. Дальше - всё только ухудшение качества, в той или иной степени. Единственный вариант сохранить без потерь качество и сократить размер до приемлемого - ч/б DJVU, что подразумевает тщательную и качественную обработку.

Сейчас мой архив-коллекция содержит порядка 600 книг по стрелковому оружию и военному снаряжению и технике, и весит он порядка 1,2 гигабайта. Я могу легко выложить его целиком на обменник, скинуть на флешку, люди могут его легко и без проблем скачать в виде торрента.
Если бы я хранил книги даже не в виде сканов-сырцов, а просто в виде JPG или PDF с приемлимым качеством, подчеркиваю - не с хорошим, а с приемлимым - то это весило бы гигабайт тридцать-пятьдесят.

Цитировать
Скорости растут, HDD дешевеют - грех экономить на красоте.
Здесь есть некоторое лукавство. То что HDD дешевеют, не делает их надежнее. Свою подборку я могу хранить в неограниченном количестве копий, и если я буду поддерживать соотношение объем/качество, то так будет и при 1000, и при 2000 файлов в библиотеке. Каждый из которых, повторюсь, является практически полностью достоверной копией оригинала книги. В случае, когда каждая книга весит 30-60 МБ, гибкость хранилища резко снижается, возможность оперативного обмена резко снижается... Ради того, чтобы полюбоваться фактурой 50-летней бумаги и степенью выцветания того же возраста типографской краски? Это не мой выбор.


Название: Re:Сканирование и обработка книг. Общие вопросы
Отправлено: SuvorovAV1956 от 2011 Мая 26, 14:51:55

Я вижу свою лично идею фикс, высшую цель, каприз, снобизм, хобби, дурость, героизм - ...
... Это не мой выбор.

Ваш выбор. Мы его уважаем. И маемся с 2-мя Терабайтами...
Название: Re:Сканирование и обработка книг. Общие вопросы
Отправлено: ScrewDriver от 2011 Мая 26, 15:49:11

Я вижу свою лично идею фикс, высшую цель, каприз, снобизм, хобби, дурость, героизм - ...
... Это не мой выбор.

Ваш выбор. Мы его уважаем. И маемся с 2-мя Терабайтами...

Умну тоже два терабайта полная библиотека. Приходится копию держать - не дай бог полетит...

Название: Re:Сканирование и обработка книг. Общие вопросы
Отправлено: БТТ от 2011 Мая 26, 16:07:14
Уважаемые администраторы, модераторы и пользователи.
Предлагаю обсуждение "щекотливого" вопроса по сканированию книг перенести в соответсвующий раздел.

Да, было бы неплохо откусить и перекинуть дискуссию

Этой теме в этом разделе не место. Данный раздел предназначет только для предоставления ссылок на литературу.
Существует специальный раздел "Сканирование и обработка книг или "у каждого свой вкус"".
В дисскусиях находится истина. Все мы заняты одним делом и делом нужным. Но давайте сохранять "уставной порядок", а то будет не форум а каша.

Товарищи Админы, Ваша работа. Перекиньте в соответствующий раздел.
Название: Re:Сканирование и обработка книг. Общие вопросы
Отправлено: SuvorovAV1956 от 2011 Мая 26, 16:38:11
Товарищи Админы, Ваша работа. Перекиньте в соответствующий раздел.

Перекидывать темы - легко.
Перемещать ответы - не в "раз"!  Не предусмотрена эта операция напрямую.
Попозже устрою.
Название: Re:Сканирование и обработка книг. Общие вопросы
Отправлено: ScrewDriver от 2011 Мая 27, 13:05:50
6. Запускаешь DjVu® Solo 3.1 (Non-Commercial version)
                                   http://www.f1cd.ru/soft/windows/text/djvu/djvu_solo_31_28/

Ради бога, мы долго можем спорить о подробностях и глубине обработки, НО ТОЛЬКО НЕ ЭТа софтина! Там кривой старый алгоритм, при сжатии постоянно путаются "н" и "и" в русском тексте, особенно в шрифте типа "courier" - она просто была заточена под английский язык.

Конвертировать нужно хотя бы этим:

Цитировать
DjVu Document Express Editor Pro 6.0.1 – Одна из наиболее распространенных и корректно работающих программ для создания и просмотра DjVu-документов от правопреемника самого стандарта DjVu компании LizardTech – Document Express Editor. В Document Express Editor, можно открывать и конвертировать файлы следующих форматов: DjVu (*.djvu, *.djv), BMP (*.bmp), GIF (*.gif), JPEG (*.jpeg, *.jpg), PNM (*.pnm, *.ppm, *.pgm, *.pbm), TIFF (*.tiff, *.tif), PICT (*.pict). При сохранении файла программа предложит выбрать настройки: распознавать ли текст; профиль; разрешение (от 100 до 600 dpi); качество текста (возможны 5 уровней от «агрессивного», т.е. со значительной потерей качества до «без потери»), сохранять изображения каждое в отдельном или в виде единого файла. Имеется семь профилей настройки где пользователь сам выбирает тип документа, а программа автоматически подстраивается под этот тип изображения: «Нормальный»; «Электронный»; «Фото»; «Битональный»; «Рукопись» и «Карта». Этими настройками, как правило, можно добиться вполне приемлемого результата. После того, как настройки заданы, необходимо выбрать место на локальном диске для сохранения файла в формате DjVu. Программа Document Express Editor 6.0.1 умеет распознавать около 100 языков, в том числе и русский.

Кратко:
«Нормальный» – для большинства отсканированных печатных документов.
«Электронный» – для растровых изображений электронного происхождения, таких, как скриншоты и т.п.
«Фото» – для фотографий. При этом функция OCR не работает, поэтому функция поиска и копирования текста в созданном документе не будет работать.
«Битональный» – для черно-белых изображений.
«Рукопись» – для старых или рукописных изданий без рисунков или фотографий.
«Рисунок» – похож на «Рукопись», но с поддержкой рисунков и фотографий.
«Карта» – похож на «Рисунок», но с лучшей поддержкой перевернутого текста.

Взять можно например тут:
http://reeed.ru/prog_djvu_ee.php

Название: Re:Сканирование и обработка книг. Общие вопросы
Отправлено: Arrested от 2011 Мая 27, 14:34:54
Добавлю о DjVu Solo: под Windows 7 работает очень плохо, постоянно вылетает. Под XP SP3 ситуация лучше, скорость обработки даже выше, чем в Document Express Editor, но все то, о чем написал ScrewDriver, остается.
И еще - документ, обработанный в Express Editor-е, затем переделать или изменить в DjVu Solo невозможно: в Editor-е, по-видимому, другой алгоритм сжатия и Solo будет зависать с ошибкой.
Название: Re:Сканирование и обработка книг. Общие вопросы
Отправлено: ScrewDriver от 2011 Мая 27, 15:19:37
Добавлю о DjVu Solo: под Windows 7 работает очень плохо, постоянно вылетает. Под XP SP3 ситуация лучше, скорость обработки даже выше, чем в Document Express Editor, но все то, о чем написал ScrewDriver, остается.
И еще - документ, обработанный в Express Editor-е, затем переделать или изменить в DjVu Solo невозможно: в Editor-е, по-видимому, другой алгоритм сжатия и Solo будет зависать с ошибкой.

Совершенно верно, "Соло" очень древняя, там версия djvu-компрессора 22 и с версиями выше оно не работает. Более современные программы имеют компрессор версии 25, он не имеет обратной совместимости. Но это бы полбеды, если бы оно буквы не путало.
Название: Re:Сканирование и обработка книг. Общие вопросы
Отправлено: usikoff от 2011 Июня 02, 09:37:42
Товарищи Админы, Ваша работа. Перекиньте в соответствующий раздел.

Перекидывать темы - легко.
Перемещать ответы - не в "раз"!  Не предусмотрена эта операция напрямую.
Попозже устрою.
Устроил.
Название: Re:Сканирование и обработка книг. Общие вопросы
Отправлено: БТТ от 2011 Июня 06, 21:50:36
ScanTailor

http://scantailor.sourceforge.net/?q=ru/about

Очень простая программа для обработки отсканированного материала. Быстрая в работе, не требует настройки. Принцип работы со ScanTailor - установил и вперед  :).
Все мои последние работы выполнены в ScanTailor версии 0.9.7.2 (остальные пока не пробовал, т.к. эта с головой устраивает), так что качество "выходного" материала Вы можете увидеть своими глазами.
______________________________________________________________________________________________________________
Вопрос самому себе - Ну и как теперь расценить этот пост? ;D
Реклама? Вроде бы и запрещено, но и вроде бы по теме :)
В случае чего меня подправят.
______________________________________________________________________________________________________________
Главное не бойтесь пробовать!!!
Скан тэйлор, скан кромсатор......   Кому что нравится. Главное результат!!!!


Нужно будет сбить бабос с разработчиков за рекламу :)
Эх, мечты, мечты ....
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: Arrested от 2011 Сентября 25, 07:35:51
древнюю-предревнюю утилитку
Не DjVu Reader часом?
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: Arrested от 2011 Сентября 25, 21:45:11
Eugen
http://djvu-reader.ru/programms/djvureader.html (http://djvu-reader.ru/programms/djvureader.html)
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: БТТ от 2011 Ноября 04, 16:08:51
Чуть не по теме.
Есть различные жалобы по низкой скорости скачивания файлов с различных ресурсов. Могу посоветовать вот это:

http://www.internetdownloadmanager.com/

После того как начал ей пользоваться, скорости, в частности при скачивании с Народа и Депозита, возросли (было 15-40, сейчас 120-180 при входящем пакете инета 256)
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: Nikbor5 от 2012 Февраля 23, 21:22:02
Это надо делать в настройках сканера, а не потом.
И в цвете незачем сканировать. 300 ДПИ, 8 бит серого. Выходные движки раздвинуть, чтобы черное было черным, а белое белым. Если планируется обработка СканТэйлором, этого достаточно. А если не планируется (а почему не планируется?), можно поиграть входными движками и слегка приподнять контрастность.
А начинать надо с повышения раскрываемости. Про это я писал на ТочкаРу, сейчас не смог найти черновика в своих мемуарах.
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: Nikbor5 от 2012 Февраля 23, 22:38:05
Обычная беда для фото - неровное освещение. Каким бы ровным оно не казалось на глаз.
Одно изображение еще можно более-менее вытянуть. Но их там небось штук 200.
А что если в лоб пропустить через СканТэйлор? Там неплохой алгоритм. Вот результат:
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: БТТ от 2012 Марта 24, 11:21:34
Кто нибудь пользовался прогой RasterDesk Pro  ?
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: SuvorovAV1956 от 2012 Марта 24, 12:33:31
Всё!
Поднимаю руки - не нашел простого способа обрабатывать "синьки" "хором".
Буду выкладывать "как есть"

Или нет?
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: Scaner от 2012 Марта 24, 21:23:30
Всё!
Поднимаю руки - не нашел простого способа обрабатывать "синьки" "хором".
Буду выкладывать "как есть"

Или нет?

Пришлите мне исходный скан - я сделаю.
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: SuvorovAV1956 от 2012 Августа 01, 20:44:08
Нет под рукой фотоаппарата.
Воспользуюсь сканером Plustek OpticBook 3600.

А текст, как в предлагаемом примере, ещё не пробовал

Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: ScrewDriver от 2012 Августа 01, 20:45:55

Все модели сканеров с CCD - датчиком:
http://market.yandex.ru/guru.xml?CMD=-RR=0,0,0,0-PF=2142559815~EQ~sel~x4990364-VIS=70-CAT_ID=142493-EXC=1-PG=10&hid=91112

Лично у меня Epson Perfection V30.
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: SuvorovAV1956 от 2012 Августа 01, 21:01:38
Вот пробы OpticBook 3600.

Одна "как у всех"
Вторая "только OpticBook 3600"

Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: ScrewDriver от 2012 Августа 03, 20:50:05
Если сканер быстро сканирует полноцветный (или градации серого) лист в 200DPI - сканируйте в 200DPI, файлы JPEG 100% качества. Затем зажимайте программой DjVu Solo обязательно указывая при запаковке алгоритм DjVue Photo (а не Scanned, Clean или Bitonal!).
Лучше не JPEG, а TIFF со сжатием LZW - по размеру будет сопоставимо, а то и меньше, но гарантированно без потерь сжатия, которые JPEG даст в любом случае.

 
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: ScrewDriver от 2012 Августа 03, 22:04:57
В DjVue Solo попробуйте открыть TIFF LZW, отпишите о результатах.

Это не аргумент для оправдания использования формата с потерями JPEG как промежуточного контейнера для сканов.
Кстати, о DjVu Solo - в нем старые некорректные алгоритмы сжатия, убедившись в этом, я перестал его использовать лет аж семь назад. Давно существуют более правильные и прогрессивные программы сжатия, в т.ч. и бесплатные. Я лично использую djvulibre, подключенную к scankromsator'у.

PS: Надеюсь, к кромсатору автор таки привинтит модуль получения изображения из twain и для создания электронной книги вообще больше ничего нужно не будет...
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: ScrewDriver от 2012 Августа 03, 22:39:37
Ув. ScrewDriver! У меня нет времени трахаться с ПРОФЕССИОНАЛЬНЫМ сканированием-обработкой-распознанием-форматированием и т.д., поэтому я опытным путём пришёл к вышеизложенному
Я тоже не имею никакого отношения к профессиональному сканированию и обработке информации. Но за много лет я перепробовал много всяческих способов хранения, обработки и сжатия и в конце концов отбросил и djvu solo, и jpeg как дающие иллюзию удобства и скорости, но не позволяющие получить электронную книгу надлежащего качества.
На сканирование полноценной книги в 600 страниц - 300 разворотов в среднем уходит два-три часа носом в монитор и сканер, и я считаю не очень рациональным после вложения такого труда пытаться сэкономить на скорости и простоте обработки.


Потери 100% JPEG на промежуточном этапе глазу не видны. Равно как не видны глазу отличия между DjVue Photo из исходника 200 DPI по сравнению с исходным отсканированным материалом, неважно TIFF LZW или JPEG 100%.
Я тоже так думал, и тоже использовал jpg одно время. Потом разочаровался - дефекты видны, если и не глазу, то при печати вылезают.

Про оправдания -- мимо. Сканируя в TIFF LZW потом придётся разжимать его в некомпресованный TIFF или BMP, чтобы скормить запаковщику в DjVue (DjVue Solo, возможно другие запаковщики понимают TIFF LZW). Это, по-вашему, разумно?
Разумно использовать формат без потерь и софт, который его поддерживает. Используйте Document Express Editor 6.0, он хотя был когда-то и не бесплатный, но уже настолько древний, что давно свободно валяется в интернете.


Всё вышесказанное не отменяет Ваших и иных методов, исходя из возможностей, способностей, времени, параметров сканера, профессионализма, острого глаза и качественного монитора.
Прошу предлагать ДОСТУПНЫЕ любому энтузиасту описания софта и методов сканирования и запаковки!

Поймите, я делаю комментарии к Вашему методу нисколько не для того, чтобы переучить Вас. Просто хочется, чтобы люди, воспользовавшиеся им, получали чуть лучший результат. Мне же тоже потом эти же электронные книги достаются.

кто хочет и может сканировать, не заморачиваясь.
А вот тут, увы, взаимоисключающие параграфы. Создание электронной книги - всегда траходром, а попытки упростить путь приводят к ухудшению результата. Знаете как обидно бывает, когда находишь нужную книгу, открываешь, вздыхаешь и стираешь ее, потому что нечитаемо?... К Вашим сканам это, безусловно не относится, но IMHO лучше как следует потрахаться со сканом один, два, три раза, чтобы потом чуять бумагу и шрифт, что называется, пятой точкой и быть уверенным в результате, уже не напрягаясь.
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: ScrewDriver от 2012 Августа 03, 23:14:03
Чем плох метод?

Когда я обрабатываю скан через JPEG 100% и через TIFF LZW, один и тот же, потом жму в djvu и печатаю результат, я вижу на печати разницу. В случае с цветом она замыта, а на черно-белом конрастном шрифте я ее вижу. Я не настаиваю, что это неприемлемо, ужасно - вовсе нет. Но разница есть, и не в пользу JPEG.
И djvu из JPG получается чуть-чуть, но больше.
Я еще разрешения разные тестировал таким же способом, через печать результата, причем разные для сканирования и пост-обработки, это вообще поэма. Тут я с Вами полностью согласен, для цветной журнальной типографики 200 dpi - оптимально.
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: Saddler от 2012 Августа 04, 21:27:07
Отсканировал вчера TIV 07-2012 г. выставил 600dpi, при обработке на DjVu Solo 3.1 первый раз задал фото и 600 dpi файл получился громадный, затем без изменения настроек скан и 300dpi получился результат http://www.webfile.ru/6063754 пусть теперь админы меня обвинят в нарушении авторских прав http://avtors-pravo.narod.ru/sroki.html/
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: Saddler от 2012 Августа 04, 21:48:36
Помогите разобраться, здесь исходники http://www.webfile.ru/6063786
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: Saddler от 2012 Августа 11, 11:52:50
Каковы будут мнения о сканере Epson Perfection V33.
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: Semen_7 от 2012 Августа 11, 13:40:07
http://atiz.ru/?page_id=2083
Сделай сканер своими руками!
Что-то на данный сайт ссылки не работают? Или это только у меня?

http://www.instructables.com/id/DIY-High-Speed-Book-Scanner-from-Trash-and-Cheap-C/?ALLSTEPS
Функциональный книжный сканер из барахла
Ребята классно потрудились, прикольный сканер из двух фотиков  :D
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: Saddler от 2012 Августа 11, 17:45:39
Приобрел сегодня Epson Perfection V33 начал тренировки.
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: Saddler от 2012 Августа 11, 18:18:57
300DPI в ч/б, мне лично сканер понравился, уж тихий какой, с МФУ Canon MP190 не сравнить, утром заказал в инете, после обеда забрал.
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: Saddler от 2012 Августа 11, 18:24:22
Ой извиняюсь, в простом режиме оттенки серого.
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: Saddler от 2012 Августа 11, 18:37:43
Я тот рисунок уменьшал, сейчас офисный режим, оттенки серого 300DPI.
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: Saddler от 2012 Августа 11, 20:38:56
Я думаю теперь все ОК. Авиация и космонавтика 7-й номер первые 5 страниц. http://webfile.ru/6073124
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: ScrewDriver от 2012 Августа 16, 17:09:22
Почему до сих пор всё через }l{? Почему некому написать простенькую программу на базе DjVue Solo 3.1, чтобы было в ней всё как есть, но перед запаковкой на исходных импортированных страницах на каждой можно было бы мышкой выделить рамками изображения, которые будут кодироваться по алгоритму Photo, а всё остальное (то есть текст) будет зажиматься в битонал...?!

Собственно сканкромсатор. Совершенно необязательно пользоваться всеми сотнями встроенных в него функций, можно делать только вышеописанные действия - выделение страниц и зон разного типа обработки.
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: ScrewDriver от 2012 Августа 16, 17:11:10
"...Обработка книг. Общие вопросы"... Что делать с технической литературой после её отсканирования и выкладки в сеть, если нет желания отнести её в Библиотеку? Можно скальпелем превратить в скульптуру:

Если это не фейк, а реальные старые книги - я бы золотые руки, которые такое сотворили, повыдергивал бы и сдал на лом драгмета. Дабы предотвратить в дальнейшем.
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: ScrewDriver от 2012 Августа 16, 17:56:29
ScrewDriver, можно поподробне про СканКромсатор? Что и как, например, можно сделать с изображением из моего сообщения №60? Оно находится на странице вместе с растрированным фото и текстом (полный файл -- там=же по ссылке на русфолдер).
Посмотрите вложение, там все три страницы сканов "разжаты" в 600 dpi ч/б, а изображения в сером с наложенным размытием.

Как я понимаю, СканКромсатор лишь выдаёт промежуточные файлы, их потом всё равно надо будет зажимать в DjVue. Я читаю http://www.djvu-soft.narod.ru/scan/djvu_imager.htm про СканТейлор и его автоматической распознавание картинок с последующим выводом через программу ST Split отдельно высокозажимаемого текста и слабозажимаемых картинок -- разве можно как-то иначе?
То есть, каким образом Кромсатор может помочь сильно зажать текст и слабо зажать картинки?
Так было раньше. В версию 5.95 автор кромсатора ВНЕЗАПНО встроил функцию конверсии в djvu. Используется бесплатная djvulibre, это набор программ по конверсии в djvu, работающие без интерфейса, из командной строки. Кромсатор выдает сам себе промежуточные файлы, жмет с помощью djvulibre отдельно битонал, отдельно изображения с профилем scan, отдельно с профилем foto, причем можно делать их с разными разрешениями; затем с помощью той же djvulibre совмещает их в единые страницы как было, и в общий файл. Причем для разных профилей можно задавать индивидуальные настройки качества, я пробовал, но пока неудачно, работаю с настройками по умолчанию.

http://forum.ru-board.com/topic.cgi?forum=5&topic=29984&start=1320 -здесь пасется автор кромсатора boolega и много обсуждения функций.

PS: Препарирование книжек -- это, к сожалению, не фейк. Впрочем, книжки буржуйные, не наши.
Зажрался народ.
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: ScrewDriver от 2012 Августа 16, 23:27:18
Посмотрел Вашу конверсию... К сожалению, не подходит, мелкий текст нечитаемый и мелкие детали безвозвратно утеряны:

При столь мелких деталях чертежа приходится идти на компромиссы - или чуть-чуть потерять в деталях, или получить невообразимый размер страницы. Сжатие в djvu даже с профилем foto тоже далеко не столь безобидно.
Я для себя в конце концов определил критерий - чтобы на печати на лазернике в высоком качестве визуально не было отличия. Или чтобы отличия не снижали качества восприятия, хотя бы. Поскольку мой лично лазерник печатает по определению в 600dpi битонал, выше качество мне задирать не приходилось. Но с этим можно поработать.
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: БТТ от 2013 Апреля 18, 20:47:35
RasterStitch.

Программа позволяет создавать единое изображение на основе нескольких графических файлов, "сшивая" их по краям. RasterStitch может применяться для создания панорам, для соединения в единое целое отсканированных документов большого размера, для составления карт из отдельных фрагментов и т.д. Точки совмещения краев изображений RasterStitch находит автоматически, а также можно задать вручную. Программа работает с файлами BMP, PCX, TIFF, GIF, JPG, TGA и PNG. В ней есть также инструменты для зеркального отражения, поворота и обрезки. Готовые изображения сохраняются в форматах PNG, GIF, TIFF и JPEG.

Шикарная прога!!!!  :)

Программа платная.

Оф. сайт    http://www.vextrasoft.com/rasterstitch.htm

 ;)
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: ScrewDriver от 2013 Апреля 20, 10:52:13
RasterStitch.

Программа позволяет создавать единое изображение на основе нескольких графических файлов, "сшивая" их по краям.

Я пользуюсь для этих целей Panorama Factory V5 - иногда лажает на таблицах, но в целом отлично. На трекере и та и другая программы есть, пролеченные.
Название: Re: Техническая литература 2014
Отправлено: ScrewDriver от 2014 Апреля 01, 11:29:10

А чем DJVU от PDF отличается?Я с _Jonnie_Jio_ попытались переконвертировать pdf в djvu и обьем тот же самый.
Подскажите : как сделать так чтобы pdf сконвертировался в  djvu и уменьшился в обьёме.
Это очень философский вопрос. Для того, чтобы получился правильный маленький djvu, необходимо исходные сканы обработать, преобразовав их в черно-белый формат с разрешением 400-600 dpi. Тщательно убрав весь фон и грязь, и минимально повредив шрифт. Для этого существуют специализированные программы, но настройки обработки для каждого документа (а иной раз для каждой страницы) приходится подбирать вручную.
Начинающему книгоделу посоветую программу scantailor, потом, с ростом мастерства и запросов - scankromsator.
А потом в djvu перегнать проще простого.
Например, Ваш скан ПНВ я в djvu ужму до мегабайта. Вечером.
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: Arrested от 2014 Апреля 14, 22:13:35
Увы и ах. Scan Tailor, боюсь, больше обновляться не будет: автор (Tulon) свое детище забросил, теперь им будет заниматься другой человек.  :(
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: Гайковерт от 2014 Апреля 20, 08:43:03
Подскажите пожалуйста, а как выбросить "лишние" страницы из книжки, сделанной в формате .djvu?
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: Semen_7 от 2014 Апреля 20, 18:34:50
Подскажите пожалуйста, а как выбросить "лишние" страницы из книжки, сделанной в формате .djvu?
В Document Express Professional 6 http://rutracker.org/forum/viewtopic.php?t=2242934
открыть документ и делать с ним всё что пожелаешь
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: SuvorovAV1956 от 2014 Апреля 22, 13:34:39
Надеюсь, мы понимаем, что пустые страницы оригинального документа не являются "лишними"
Иначе нарушается нумерация, а документ вызывает подозрение в полноценности и желание сверить его с оригиналом.
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: Гайковерт от 2014 Апреля 22, 17:02:11
Semen_7, спасибо.
Александр Васильевич, я ж не варвар, просто когда загоняеш книжку в FineReader, без титула и прочих форзацев чуток быстрее получается.
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: SuvorovAV1956 от 2014 Апреля 22, 18:14:19
Документы встречал с совершенно пустой страницей с надписью "пустая страница" - вызывают чувство благодарности.
Если они были одинаковыми, то менял чуток размеры - чтобы DoubleKiller не ругался...
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: Владимир Иванович от 2014 Апреля 23, 10:36:24
Подскажите,я новичок, - а как скопировать найденный материал?
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: денис2015 от 2015 Июня 24, 14:20:50
как я могу загрузить уже отсканированый материал,чтоб получить доступ к интересующей меня информации?
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: Arrested от 2015 Июня 24, 14:44:48
денис2015
Загружайте архивом на файлообменник, желательно бесплатный и без ограничения по скорости и числу скачиваний, например yadi.sk, потом ссылку с кратким описанием постите в эту тему: http://russianarms.su/index.php?topic=1048.0.
Ну а потом можете чего-нибудь и попросить взамен  ;).
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: денис2015 от 2015 Июня 24, 19:45:20
не получается зарегистрироваться в файлообменнике так как я за границей и сюда не доходят смс из россии(сомали)..нельзя как нибудь на сайт загрузить
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: денис2015 от 2015 Июня 24, 19:51:41
Очень нужно техническое пособие по системе тта-12н....
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: Semen_7 от 2015 Июня 24, 21:16:03
не получается зарегистрироваться в файлообменнике так как я за границей и сюда не доходят смс из россии(сомали)..нельзя как нибудь на сайт загрузить
На disk.yandex.ru не нужно никаких СМС
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: денис2015 от 2015 Июня 26, 06:41:05
Нужно для регистрации...может через почту есть кому передать..
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: Semen_7 от 2015 Июня 26, 13:23:27
Нужно для регистрации...может через почту есть кому передать..
Там есть кнопочка "У меня нет телефона"
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: денис2015 от 2015 Июня 27, 10:11:54
https://yadi.sk/i/xjLhULM3hWRVN....вроде получилось,проверти кто нибудь
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: денис2015 от 2015 Июня 27, 10:24:10
этого достаточно или нужно еще что то для того чтоб я мог прочитать то что меня интересует,система новая и не могу ничего найти толкового в интернете..105.438 -это номер из вашего архива
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: Arrested от 2015 Июня 27, 11:19:45
105.438 - это рекламный буклет ЗАО "Транзас" и его можно легко скачать в сети. Вот, например: cds.my1.ru/_fr/0/tta-12h_rus.pdf (http://cds.my1.ru/_fr/0/tta-12h_rus.pdf)
Ничего другого у нас по этой системе пока нет.
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: camuflage-spb от 2016 Февраля 12, 12:33:17
Здравствуйте!

Александр,куда-то Вы запропастились,и телефон не отвечает Ваш 921.

По-прежнему , у меня есть возможность делать фотосканы и отправлять потом,после редактирования, всё это в pdf.
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: Гайковерт от 2016 Октября 19, 18:22:12
Друзья, совет нужен.
Мой верный CanoScan LiDE 200 совсем захандрил, видать отслужил свое. Отсканирует 5-6 страниц, и виснет. Отвисает после выключения и повторного включения, опять 5-6 страниц и виснет. На другом компе тоже самое.
Посоветуйте пожалуйста быстрый планшетный сканер (цветопередача не очень важна), цена в пределах 10 000 р.
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: Arrested от 2016 Октября 20, 09:22:55
Посоветуйте пожалуйста быстрый планшетный сканер (цветопередача не очень важна), цена в пределах 10 000 р.
В цену укладываются только сканеры с CIS-матрицей: тот же Canon LiDE 220, HP Scanjet 200, HP Scanjet 300, Epson Perfection V19, цена у всех в пределах 5-6 тысяч (который быстрее сканирует, не могу сказать, работал только с Canon-ами, они меня устраивают). С матрицей CCD цены существенно выше 10 тыс.
Название: Re: Сканирование и обработка книг. Общие вопросы
Отправлено: ScrewDriver от 2016 Октября 20, 09:40:06
Друзья, совет нужен.
Мой верный CanoScan LiDE 200 совсем захандрил, видать отслужил свое. Отсканирует 5-6 страниц, и виснет. Отвисает после выключения и повторного включения, опять 5-6 страниц и виснет. На другом компе тоже самое.
Посоветуйте пожалуйста быстрый планшетный сканер (цветопередача не очень важна), цена в пределах 10 000 р.

Можно попробовать заменить кабель - кэноны очень к ним капризны. Если на другом компе кабель был тамошний - то да, бесполезно.

У меня Epson Perfection V30 (сейчас его реинкарнация V370) - немного побольше, требует внешнего источника, потому что CCD, скорость типовая - пять A4 за три минуты в 300dpi gray. Стоит порядка 8 тыр, зато CCD матрица многое прощает при сканировании слишком хорошо переплетенных книг - добивает до нескольких миллиметров от стекла, если страница расположена продольно - то почти без искажений. Словом, я доволен, аппарат выносливый. Иногда, бывает, подвисает - раз в месяц, не чаще, лечится передергиванием питания.