Новости:

Прежде, чем сказать "ДАЙТЕ" посетите раздел 8.5. Что такое "по запросу"


С корреспондентами без имени, возраста и места жительства в переписку не вступаем.


    Годятся любые технические описания любых машин, приборов, агрегатов, устройств (хорошо бы) военно-технического назначения советского периода.
На любую только отечественную технику, оборудование, изделия, объекты, образцы, модели, проекты и детали.
Всё над чем трудились наши славные предки и чему грозит утрата и/или забвение.
Так же нас не интересуют только одни ссылки на ИЗВЕСТНЫЕ материалы других сайтов.

Мы НЕ ТОРГУЕМ материалами нашего форума.
А прежде чем писать запросы - читайте форум.

С уважением, Суворов АВ

С корреспондентами без имени, возраста и места жительства в переписку не вступаю.

Сэкрэтные и постСоветские популярные цветные издания не предлагать.
Найдено помещение для библиотеки форума. В Санкт-Петербурге на Васильевском.
Ищем энтузиастов способных принять участие в обустройстве.



Сканирование и обработка книг. Общие вопросы

« назад - далее »

0 Пользователи и 1 гость просматривают эту тему.

Semen_7

Цитата: Tractorist от 2021 июня 21, 07:54:08
А съемка не телефон страниц книги не практикуется?
Практикуется всё. Только нужно аккуратно,  ровно и резко фотографировать страницы.

Tractorist

А съемка не телефон страниц книги не практикуется?

ScrewDriver

Цитата: Гайковерт от 2016 октября 19, 18:22:12
Друзья, совет нужен.
Мой верный CanoScan LiDE 200 совсем захандрил, видать отслужил свое. Отсканирует 5-6 страниц, и виснет. Отвисает после выключения и повторного включения, опять 5-6 страниц и виснет. На другом компе тоже самое.
Посоветуйте пожалуйста быстрый планшетный сканер (цветопередача не очень важна), цена в пределах 10 000 р.

Можно попробовать заменить кабель - кэноны очень к ним капризны. Если на другом компе кабель был тамошний - то да, бесполезно.

У меня Epson Perfection V30 (сейчас его реинкарнация V370) - немного побольше, требует внешнего источника, потому что CCD, скорость типовая - пять A4 за три минуты в 300dpi gray. Стоит порядка 8 тыр, зато CCD матрица многое прощает при сканировании слишком хорошо переплетенных книг - добивает до нескольких миллиметров от стекла, если страница расположена продольно - то почти без искажений. Словом, я доволен, аппарат выносливый. Иногда, бывает, подвисает - раз в месяц, не чаще, лечится передергиванием питания.

Arrested

Цитата: Гайковерт от 2016 октября 19, 18:22:12
Посоветуйте пожалуйста быстрый планшетный сканер (цветопередача не очень важна), цена в пределах 10 000 р.
В цену укладываются только сканеры с CIS-матрицей: тот же Canon LiDE 220, HP Scanjet 200, HP Scanjet 300, Epson Perfection V19, цена у всех в пределах 5-6 тысяч (который быстрее сканирует, не могу сказать, работал только с Canon-ами, они меня устраивают). С матрицей CCD цены существенно выше 10 тыс.

Гайковерт

Друзья, совет нужен.
Мой верный CanoScan LiDE 200 совсем захандрил, видать отслужил свое. Отсканирует 5-6 страниц, и виснет. Отвисает после выключения и повторного включения, опять 5-6 страниц и виснет. На другом компе тоже самое.
Посоветуйте пожалуйста быстрый планшетный сканер (цветопередача не очень важна), цена в пределах 10 000 р.

camuflage-spb

Здравствуйте!

Александр,куда-то Вы запропастились,и телефон не отвечает Ваш 921.

По-прежнему , у меня есть возможность делать фотосканы и отправлять потом,после редактирования, всё это в pdf.

Arrested

105.438 - это рекламный буклет ЗАО "Транзас" и его можно легко скачать в сети. Вот, например: cds.my1.ru/_fr/0/tta-12h_rus.pdf
Ничего другого у нас по этой системе пока нет.

денис2015

этого достаточно или нужно еще что то для того чтоб я мог прочитать то что меня интересует,система новая и не могу ничего найти толкового в интернете..105.438 -это номер из вашего архива

денис2015


Semen_7

Цитата: денис2015 от 2015 июня 26, 06:41:05
Нужно для регистрации...может через почту есть кому передать..
Там есть кнопочка "У меня нет телефона"

денис2015

Нужно для регистрации...может через почту есть кому передать..

Semen_7

Цитата: денис2015 от 2015 июня 24, 19:45:20
не получается зарегистрироваться в файлообменнике так как я за границей и сюда не доходят смс из россии(сомали)..нельзя как нибудь на сайт загрузить
На disk.yandex.ru не нужно никаких СМС

денис2015

Очень нужно техническое пособие по системе тта-12н....

денис2015

не получается зарегистрироваться в файлообменнике так как я за границей и сюда не доходят смс из россии(сомали)..нельзя как нибудь на сайт загрузить

Arrested

денис2015
Загружайте архивом на файлообменник, желательно бесплатный и без ограничения по скорости и числу скачиваний, например yadi.sk, потом ссылку с кратким описанием постите в эту тему: http://russianarms.su/index.php?topic=1048.0.
Ну а потом можете чего-нибудь и попросить взамен  ;).

денис2015

как я могу загрузить уже отсканированый материал,чтоб получить доступ к интересующей меня информации?

Владимир Иванович

Подскажите,я новичок, - а как скопировать найденный материал?

SuvorovAV1956

Документы встречал с совершенно пустой страницей с надписью "пустая страница" - вызывают чувство благодарности.
Если они были одинаковыми, то менял чуток размеры - чтобы DoubleKiller не ругался...
В чужих руках хрен всегда толще.

Гайковерт

Semen_7, спасибо.
Александр Васильевич, я ж не варвар, просто когда загоняеш книжку в FineReader, без титула и прочих форзацев чуток быстрее получается.

SuvorovAV1956

Надеюсь, мы понимаем, что пустые страницы оригинального документа не являются "лишними"
Иначе нарушается нумерация, а документ вызывает подозрение в полноценности и желание сверить его с оригиналом.
В чужих руках хрен всегда толще.

Semen_7

Цитата: Гайковерт от 2014 апреля 20, 08:43:03
Подскажите пожалуйста, а как выбросить "лишние" страницы из книжки, сделанной в формате .djvu?
В Document Express Professional 6 http://rutracker.org/forum/viewtopic.php?t=2242934
открыть документ и делать с ним всё что пожелаешь

Гайковерт

Подскажите пожалуйста, а как выбросить "лишние" страницы из книжки, сделанной в формате .djvu?

Arrested

Увы и ах. Scan Tailor, боюсь, больше обновляться не будет: автор (Tulon) свое детище забросил, теперь им будет заниматься другой человек.  :(

ScrewDriver

Цитата: ThePancer1984 от 2014 марта 31, 19:29:43

А чем DJVU от PDF отличается?Я с _Jonnie_Jio_ попытались переконвертировать pdf в djvu и обьем тот же самый.
Подскажите : как сделать так чтобы pdf сконвертировался в  djvu и уменьшился в обьёме.
Это очень философский вопрос. Для того, чтобы получился правильный маленький djvu, необходимо исходные сканы обработать, преобразовав их в черно-белый формат с разрешением 400-600 dpi. Тщательно убрав весь фон и грязь, и минимально повредив шрифт. Для этого существуют специализированные программы, но настройки обработки для каждого документа (а иной раз для каждой страницы) приходится подбирать вручную.
Начинающему книгоделу посоветую программу scantailor, потом, с ростом мастерства и запросов - scankromsator.
А потом в djvu перегнать проще простого.
Например, Ваш скан ПНВ я в djvu ужму до мегабайта. Вечером.

ScrewDriver

Цитата: БТТ от 2013 апреля 18, 20:47:35
RasterStitch.

Программа позволяет создавать единое изображение на основе нескольких графических файлов, "сшивая" их по краям.

Я пользуюсь для этих целей Panorama Factory V5 - иногда лажает на таблицах, но в целом отлично. На трекере и та и другая программы есть, пролеченные.

БТТ

#47
RasterStitch.

Программа позволяет создавать единое изображение на основе нескольких графических файлов, "сшивая" их по краям. RasterStitch может применяться для создания панорам, для соединения в единое целое отсканированных документов большого размера, для составления карт из отдельных фрагментов и т.д. Точки совмещения краев изображений RasterStitch находит автоматически, а также можно задать вручную. Программа работает с файлами BMP, PCX, TIFF, GIF, JPG, TGA и PNG. В ней есть также инструменты для зеркального отражения, поворота и обрезки. Готовые изображения сохраняются в форматах PNG, GIF, TIFF и JPEG.

Шикарная прога!!!!  :)

Программа платная.

Оф. сайт    http://www.vextrasoft.com/rasterstitch.htm

;)

ScrewDriver

Цитата: carrey от 2012 августа 16, 18:27:34
Посмотрел Вашу конверсию... К сожалению, не подходит, мелкий текст нечитаемый и мелкие детали безвозвратно утеряны:

При столь мелких деталях чертежа приходится идти на компромиссы - или чуть-чуть потерять в деталях, или получить невообразимый размер страницы. Сжатие в djvu даже с профилем foto тоже далеко не столь безобидно.
Я для себя в конце концов определил критерий - чтобы на печати на лазернике в высоком качестве визуально не было отличия. Или чтобы отличия не снижали качества восприятия, хотя бы. Поскольку мой лично лазерник печатает по определению в 600dpi битонал, выше качество мне задирать не приходилось. Но с этим можно поработать.

ScrewDriver

Цитата: carrey от 2012 августа 16, 17:23:09
ScrewDriver, можно поподробне про СканКромсатор? Что и как, например, можно сделать с изображением из моего сообщения №60? Оно находится на странице вместе с растрированным фото и текстом (полный файл -- там=же по ссылке на русфолдер).
Посмотрите вложение, там все три страницы сканов "разжаты" в 600 dpi ч/б, а изображения в сером с наложенным размытием.

Цитата: carrey от 2012 августа 16, 17:23:09
Как я понимаю, СканКромсатор лишь выдаёт промежуточные файлы, их потом всё равно надо будет зажимать в DjVue. Я читаю http://www.djvu-soft.narod.ru/scan/djvu_imager.htm про СканТейлор и его автоматической распознавание картинок с последующим выводом через программу ST Split отдельно высокозажимаемого текста и слабозажимаемых картинок -- разве можно как-то иначе?
То есть, каким образом Кромсатор может помочь сильно зажать текст и слабо зажать картинки?
Так было раньше. В версию 5.95 автор кромсатора ВНЕЗАПНО встроил функцию конверсии в djvu. Используется бесплатная djvulibre, это набор программ по конверсии в djvu, работающие без интерфейса, из командной строки. Кромсатор выдает сам себе промежуточные файлы, жмет с помощью djvulibre отдельно битонал, отдельно изображения с профилем scan, отдельно с профилем foto, причем можно делать их с разными разрешениями; затем с помощью той же djvulibre совмещает их в единые страницы как было, и в общий файл. Причем для разных профилей можно задавать индивидуальные настройки качества, я пробовал, но пока неудачно, работаю с настройками по умолчанию.

http://forum.ru-board.com/topic.cgi?forum=5&topic=29984&start=1320 -здесь пасется автор кромсатора boolega и много обсуждения функций.

Цитата: carrey от 2012 августа 16, 17:23:09
PS: Препарирование книжек -- это, к сожалению, не фейк. Впрочем, книжки буржуйные, не наши.
Зажрался народ.

ScrewDriver

Цитата: carrey от 2012 августа 16, 05:43:47
"...Обработка книг. Общие вопросы"... Что делать с технической литературой после её отсканирования и выкладки в сеть, если нет желания отнести её в Библиотеку? Можно скальпелем превратить в скульптуру:

Если это не фейк, а реальные старые книги - я бы золотые руки, которые такое сотворили, повыдергивал бы и сдал на лом драгмета. Дабы предотвратить в дальнейшем.

ScrewDriver

Цитата: carrey от 2012 августа 13, 06:32:57
Почему до сих пор всё через }l{? Почему некому написать простенькую программу на базе DjVue Solo 3.1, чтобы было в ней всё как есть, но перед запаковкой на исходных импортированных страницах на каждой можно было бы мышкой выделить рамками изображения, которые будут кодироваться по алгоритму Photo, а всё остальное (то есть текст) будет зажиматься в битонал...?!

Собственно сканкромсатор. Совершенно необязательно пользоваться всеми сотнями встроенных в него функций, можно делать только вышеописанные действия - выделение страниц и зон разного типа обработки.

Saddler

Я думаю теперь все ОК. Авиация и космонавтика 7-й номер первые 5 страниц. http://webfile.ru/6073124
С уважением, Евгений.

Saddler

Я тот рисунок уменьшал, сейчас офисный режим, оттенки серого 300DPI.
С уважением, Евгений.

Saddler

Ой извиняюсь, в простом режиме оттенки серого.
С уважением, Евгений.

Saddler

300DPI в ч/б, мне лично сканер понравился, уж тихий какой, с МФУ Canon MP190 не сравнить, утром заказал в инете, после обеда забрал.
С уважением, Евгений.

Saddler

Приобрел сегодня Epson Perfection V33 начал тренировки.
С уважением, Евгений.

Semen_7

Цитата: carrey от 2012 августа 11, 02:20:01
http://atiz.ru/?page_id=2083
Сделай сканер своими руками!
Что-то на данный сайт ссылки не работают? Или это только у меня?

Цитата: carrey от 2012 августа 11, 02:20:01
http://www.instructables.com/id/DIY-High-Speed-Book-Scanner-from-Trash-and-Cheap-C/?ALLSTEPS
Функциональный книжный сканер из барахла
Ребята классно потрудились, прикольный сканер из двух фотиков  :D

Saddler

Каковы будут мнения о сканере Epson Perfection V33.
С уважением, Евгений.

Saddler

С уважением, Евгений.

Saddler

#34
Отсканировал вчера TIV 07-2012 г. выставил 600dpi, при обработке на DjVu Solo 3.1 первый раз задал фото и 600 dpi файл получился громадный, затем без изменения настроек скан и 300dpi получился результат http://www.webfile.ru/6063754 пусть теперь админы меня обвинят в нарушении авторских прав http://avtors-pravo.narod.ru/sroki.html/
С уважением, Евгений.

ScrewDriver

Цитата: carrey от 2012 августа 03, 22:54:43
Чем плох метод?

Когда я обрабатываю скан через JPEG 100% и через TIFF LZW, один и тот же, потом жму в djvu и печатаю результат, я вижу на печати разницу. В случае с цветом она замыта, а на черно-белом конрастном шрифте я ее вижу. Я не настаиваю, что это неприемлемо, ужасно - вовсе нет. Но разница есть, и не в пользу JPEG.
И djvu из JPG получается чуть-чуть, но больше.
Я еще разрешения разные тестировал таким же способом, через печать результата, причем разные для сканирования и пост-обработки, это вообще поэма. Тут я с Вами полностью согласен, для цветной журнальной типографики 200 dpi - оптимально.

ScrewDriver

Цитата: carrey от 2012 августа 03, 22:16:23
Ув. ScrewDriver! У меня нет времени трахаться с ПРОФЕССИОНАЛЬНЫМ сканированием-обработкой-распознанием-форматированием и т.д., поэтому я опытным путём пришёл к вышеизложенному
Я тоже не имею никакого отношения к профессиональному сканированию и обработке информации. Но за много лет я перепробовал много всяческих способов хранения, обработки и сжатия и в конце концов отбросил и djvu solo, и jpeg как дающие иллюзию удобства и скорости, но не позволяющие получить электронную книгу надлежащего качества.
На сканирование полноценной книги в 600 страниц - 300 разворотов в среднем уходит два-три часа носом в монитор и сканер, и я считаю не очень рациональным после вложения такого труда пытаться сэкономить на скорости и простоте обработки.


Цитата: carrey от 2012 августа 03, 22:16:23
Потери 100% JPEG на промежуточном этапе глазу не видны. Равно как не видны глазу отличия между DjVue Photo из исходника 200 DPI по сравнению с исходным отсканированным материалом, неважно TIFF LZW или JPEG 100%.
Я тоже так думал, и тоже использовал jpg одно время. Потом разочаровался - дефекты видны, если и не глазу, то при печати вылезают.

Цитата: carrey от 2012 августа 03, 22:16:23
Про оправдания -- мимо. Сканируя в TIFF LZW потом придётся разжимать его в некомпресованный TIFF или BMP, чтобы скормить запаковщику в DjVue (DjVue Solo, возможно другие запаковщики понимают TIFF LZW). Это, по-вашему, разумно?
Разумно использовать формат без потерь и софт, который его поддерживает. Используйте Document Express Editor 6.0, он хотя был когда-то и не бесплатный, но уже настолько древний, что давно свободно валяется в интернете.


Цитата: carrey от 2012 августа 03, 22:16:23
Всё вышесказанное не отменяет Ваших и иных методов, исходя из возможностей, способностей, времени, параметров сканера, профессионализма, острого глаза и качественного монитора.
Прошу предлагать ДОСТУПНЫЕ любому энтузиасту описания софта и методов сканирования и запаковки!

Поймите, я делаю комментарии к Вашему методу нисколько не для того, чтобы переучить Вас. Просто хочется, чтобы люди, воспользовавшиеся им, получали чуть лучший результат. Мне же тоже потом эти же электронные книги достаются.

Цитата: carrey от 2012 августа 03, 22:16:23
кто хочет и может сканировать, не заморачиваясь.
А вот тут, увы, взаимоисключающие параграфы. Создание электронной книги - всегда траходром, а попытки упростить путь приводят к ухудшению результата. Знаете как обидно бывает, когда находишь нужную книгу, открываешь, вздыхаешь и стираешь ее, потому что нечитаемо?... К Вашим сканам это, безусловно не относится, но IMHO лучше как следует потрахаться со сканом один, два, три раза, чтобы потом чуять бумагу и шрифт, что называется, пятой точкой и быть уверенным в результате, уже не напрягаясь.

ScrewDriver

Цитата: carrey от 2012 августа 03, 21:02:56
В DjVue Solo попробуйте открыть TIFF LZW, отпишите о результатах.

Это не аргумент для оправдания использования формата с потерями JPEG как промежуточного контейнера для сканов.
Кстати, о DjVu Solo - в нем старые некорректные алгоритмы сжатия, убедившись в этом, я перестал его использовать лет аж семь назад. Давно существуют более правильные и прогрессивные программы сжатия, в т.ч. и бесплатные. Я лично использую djvulibre, подключенную к scankromsator'у.

PS: Надеюсь, к кромсатору автор таки привинтит модуль получения изображения из twain и для создания электронной книги вообще больше ничего нужно не будет...

ScrewDriver

Цитата: carrey от 2012 августа 03, 19:11:26
Если сканер быстро сканирует полноцветный (или градации серого) лист в 200DPI - сканируйте в 200DPI, файлы JPEG 100% качества. Затем зажимайте программой DjVu Solo обязательно указывая при запаковке алгоритм DjVue Photo (а не Scanned, Clean или Bitonal!).
Лучше не JPEG, а TIFF со сжатием LZW - по размеру будет сопоставимо, а то и меньше, но гарантированно без потерь сжатия, которые JPEG даст в любом случае.


SuvorovAV1956

Вот пробы OpticBook 3600.

Одна "как у всех"
Вторая "только OpticBook 3600"

В чужих руках хрен всегда толще.

ScrewDriver


SuvorovAV1956

Цитата: SuvorovAV1956 от 2012 марта 25, 23:05:14
Нет под рукой фотоаппарата.
Воспользуюсь сканером Plustek OpticBook 3600.

А текст, как в предлагаемом примере, ещё не пробовал

В чужих руках хрен всегда толще.

Scaner

Цитата: SuvorovAV1956 от 2012 марта 24, 12:33:31
Всё!
Поднимаю руки - не нашел простого способа обрабатывать "синьки" "хором".
Буду выкладывать "как есть"

Или нет?

Пришлите мне исходный скан - я сделаю.

SuvorovAV1956

Всё!
Поднимаю руки - не нашел простого способа обрабатывать "синьки" "хором".
Буду выкладывать "как есть"

Или нет?
В чужих руках хрен всегда толще.

БТТ

Кто нибудь пользовался прогой RasterDesk Pro ?

Nikbor5

Обычная беда для фото - неровное освещение. Каким бы ровным оно не казалось на глаз.
Одно изображение еще можно более-менее вытянуть. Но их там небось штук 200.
А что если в лоб пропустить через СканТэйлор? Там неплохой алгоритм. Вот результат: