Адрес для входа в РФ: exler.world

OCR - распознавание текста в изображениях

26.01.2022 11:35  19781   Комментарии (70)

Мне периодически нужно распознавать испанский текст на картинках или PDF, также английский и русский. Делать это приходится нечасто, поэтому отдельное приложение для распознавания я не искал: когда понадобилось, просто задал строку в поиске, попробовал первый же попавшийся онлайновый сервис, и так он мне понравился, что ничего другого я искать и не стал.

Сервис называется Free Online OCR, он бесплатный (с определенными ограничениями), поддерживает не один десяток языков, работает и с изображениями, и с PDF, умеет преобразовывать распознанный текст (или файл PDF) в документ Word, документ Excel или в обычный текст. Очень неплохо справляется даже с некачественными картинками и PDF - вот прям рекомендую.

 

В бесплатной версии разрешается распознавать до 15 страниц в час, максимальное количество страниц в документе - 10, максимальный размер файла - 15 мегабайт. Для подавляющего большинства пользователей этого вполне достаточно. 

Ну а теперь вопрос: а вы какими сервисами распознавания пользуетесь? Может, есть что-то поинтереснее?

26.01.2022 11:35
Комментарии 70

Заметки Google Keep. Мгновенно и безошибочно. Особенно хорош в связке с FastStone Capture. Сделал скриншот с картинкой с текстом - копипаст в Keep - распознование. Может, для больших документов неудобно, но для фрагментов (до одной страницы) - просто чудо!
28.01.22 08:30
0 0

В Google Camera можно включить режим Lens и там нажать кнопочку Text и прямо на живой картинке выделить текст и скопировать его. Пользовался несколько раз. Работает на ура, но возможно что только на их собственных телефонах.
28.01.22 02:15
0 0

Ещё есть замечательный сервис visionbot.ru
А если нужно распознавать многостраничные pdf, можно воспользоваться вот этим:
data2data.ru
27.01.22 08:14
0 0

Когда abbyy прихлопнул свой он-лайн сервис FineReader Online пришлось купить FineReader PDF 15, бо остальное не едет для распознавания многостраничных сканов.
27.01.22 06:57
0 0

Или так с "Scan text into Word"
27.01.22 00:46
0 0

Не только для распознавания, но и для него тоже.
Пользуюсь официально бесплатной программой, которая работает как сканер (подхватывает всё, в том числе Kyocera, у которого софта нет, только свои дайверы), поддерживает импорт, может немного отредактировать pdf (например, повернуть страницы, удалить) и в том числе распознает текст.
www.naps2.com
Есть портативная версия.
26.01.22 18:45
0 0

NAPS2 научилась распознавать? Очень любопытно
26.01.22 19:18
0 0

У меня с ним постоянная проблема последнее время. При попытке импортировать пдф для распознавания выдаёт ошибку, что невозможно импортировать файл. Повторяется на куче машин, переустановкой не лечится. А поначалу прям огонь было.
111
26.01.22 20:49
0 0

Кто нибудь знает нормальный конвертер PDF в АвтоКадовский DWG? С хорошей трассировкой, с поддержкой русского OCR?
26.01.22 18:25
1 0

"Лучший векторизатор для ACAD - это студент на практике." (с) Могилёвгражданпроект.
26.01.22 19:17
0 4

поделитесь, насколько хорошо многостраничные отсканеренные документы переводит то, чем вы пользуетесь (процент ошибок). Типа, если книгу отсканировал мелким шрифтом с разрешением 144 дпи. И насколько меньше ПДФ по размеру A4, чем картинка A4 получается (по идее, разница в десятки раз должна быть)?
26.01.22 17:57
0 0

Типа, если книгу отсканировал мелким шрифтом с разрешением 144 дпи.
По моему опыту распознавание мелкого шрифта (6-9 pt) меньше чем 200 dpi - тот еще мазохизм...
26.01.22 19:20
0 0

мне интересно, как официальные ПДФы статей 60-80х годов делаются. При просмотре выглядят, как шлак, но текст норм (правда копируется хер знает каK).
Т.е. рекоммендуешь меньше 288 не делать? Наш мудацкий корпоративный копир больше 288 не выдает. Так как "вам и не надо".
26.01.22 20:26
1 1

мне интересно, как официальные ПДФы статей 60-80х годов делаются.
Т.е. рекоммендуешь меньше 288 не делать?
Подозреваю что в картинку а не в текст. Без распознавания.
А меньше 200 - да, не рекомендую. По довольно большому опыту обслуживания типографий (был такой штришок в моей биографии)
27.01.22 16:01
1 0

Они в большинстве случаев крайне криво сканируются безотносительно разрешения, без малейших попыток побороться с муаром и выставить правильные уровни, хотя это все элементарно.
PS Привет, коллега ) не так мало времени в 90-х работал в медицинском издательстве от верстальщика-дизайнера до начальника отдела подготовки печатных изданий )
28.01.22 08:36
0 0

Крайне редко приходится распознавать большие многостраничные документы. Намного чаще -- это несколько предложений или абзацев на картинке.

ИМХО, для этого идеально подходит ABBYY Screenshot Reader. Для быстого доступа закрепил его на таскбаре.

Фишка в том, что требуется минимум действий. Нажал кнопку, обвел текст и вуаля -- он в буфере. Не нужно сохранять картинку куда-то или открывать/аплоудить ее куда-то.
26.01.22 17:46
0 3

OCR - распознавание текста в изображениях
Спасибо за полезный пост! Как всегда узнаю очень много интересного и полезного из таких ваших постов. В комментариях, тоже очень много полезного - благодарю всех, кто не поленился дать свои рекомендации. Пишу не для хайпа, а действительно, благодарен всем за полезную информацию. Спасибо!
26.01.22 17:28
0 1

Пользуюсь вот этим:
capture2text.sourceforge.net
26.01.22 16:56
0 1

Abbyy Screenshot Reader.
Выделяем прямоугольную область экрана, программа распознает текст и дальше или в буфер, или в ворд, или в эксель. Причем в эксель может сохранять таблицы.
Может сохранить обычный скриншот.
С большими документами не очень удобно работать, а для простой верстки пары страниц очень даже годится.
Стоит около 20 долларов.
26.01.22 16:43
0 4

Так сейчас ворд спокойно открывает ПДФ, зачем его как-то распознавать?
26.01.22 16:34
0 0

Если пдф содержит текст в виде картинки, то и в ворде он будет в виде картинки.
26.01.22 16:44
0 0

Чтобы скопировать
26.01.22 17:06
0 0

Word уже достаточно давно научился запускать OCR при открытии PDF с картинками.
По крайней мере Word из Office 365. Русский и английский текст распознает вполне приемлемо, другие языки не пробовал.
26.01.22 20:53
0 0

Adobe Scan на телефоне мне очень нравится.
Бесплатных возможностей хватает.

Очень быстро и удобно делает PDF с уже распознаным текстом.
Можно как камерой страницы фоткать, так и из картинок собрать.
26.01.22 15:58
0 0

Foxit - лучше на рынке pdf. Вплоть до редактирования текста
26.01.22 15:55
0 1

ПДФ ридер использую их, да. ПДФ креатор не особо.

Очень удобно Google Keep.
И в смартфоне, и на компьютере. Быстро и просто.
26.01.22 15:52
0 0

Google Keep.
И в смартфоне, и на компьютере. Быстро и просто
И как туда отсканированый pdf загнать с распознованием?
27.01.22 06:43
0 0

У меня вложения к почте автоматически раскладываются по папкам. Хотелось бы программу, которую можно было бы натравить на сохраненные файлы, чтобы стала возможна индексация/поиск в проводнике WIndows. Идеально с распознаванием картинок. С экспортом в PDF.
26.01.22 15:49
0 0

Google Lens на телефоне.
26.01.22 14:56
0 3

Телефоны всех победят
26.01.22 14:45
0 0

Фоткаю экран мобилой в гугль транслейте
26.01.22 14:36
0 0

Не нравятся мне сервисы онлайн. Пользуюсь прогой ABBYY PDF Transformer+
26.01.22 14:23
0 0

Для работы с ПДФ документами вместо платного адобовского Акробата есть отличный бесплатный ПДФ 24. Делает по сути все то же что и акробат только за бесплатно. Также есть функция конвертации
26.01.22 14:21
0 1

Скачал, проверил, кривовато работает. (
26.01.22 15:45
0 0

1) майкрософт ленз. Мне иногд нужно переводить незнакомые каракули, поэтому мой алгоритм:
- Сфотать лист текста и сохранить в облако в вордовском формате (важно!)
- открыть документ в ворде на компе - там уже текст распознан и можно пользоваться встроенным вордовским переводчиком

2) камера на айфоне с недавних пор (не понял точно с каких) распознает текст на фотках. Довольно неплохо, но вот по тексту на фотках почему-то поиск не работает. То есть текст прям на фотке можно выделить и скопировать. А найти поиском (что было бы самым логичным применением данной фичи) почему-то фотку с этим текстом нельзя.
26.01.22 13:51
0 0

Из того, чо на поверхности и не требует приложений/настройки - Гугл докс неплохо справляется, если пересохранять изображение/пдф в док. Но если просто текст вытянуть, то тесеракт справляется вполне.
26.01.22 13:45
0 0

На йаФоне пользовался Scanbot, но с модели заплатил и пользуйся они перешли на платную подписку. Платить 8 баксов в месяц для того, чтобы пользоваться раз в полгода я не готов.

Также удобен Scanner Mini. Что радует в телефонных приложениях - коррекция геометрии документа. Нет необходимости четко держать кадр на документе, а результат как из-под планшетного сканера. Распознование-ПДФизация (или JPGизация), рассылка почтой и мессенджерами. Что еще надо?
26.01.22 13:43
0 0

А текст редактируемый на выходе?
26.01.22 16:51
0 0

Данная функция нужна нечасто, но когда требуется, пользуюсь Google Lens.
Он для смартфона, но понимает и файлы и можно просто сфотографировать текст.
26.01.22 12:52
0 5

Попробуйте Adobe Scan - мне нравится в разы больше.
Напомните, кстати - у Google Lens на Андроид есть сканирование именно документов - а не просто картинки?
26.01.22 12:55
0 0

я так и написал, сфотографируйте текст приложением
26.01.22 12:59
0 0

Я же не просто так про Android спросил. У меня айфон - а там Lens другой.
Просто картинка - фото документа - это совсем не то что нужно....
26.01.22 13:08
0 0

я так и написал, сфотографируйте текст приложением
Теперь эта функция уже и просто в Google Photos есть.
26.01.22 13:11
0 0

думается мы как-то друг друга не понимаем...
откройте приложение, наведите камеру на текст, выберите функцию «текст» нажмите кнопку и определитесь, что с этим текстом вы желаете сделать...
26.01.22 13:19
0 0

выберите функцию «текст»
Нет такой функции в версии для iPhone
Всё, дошло... Вот то что у вас на скриншоте - в версии для iPhone называется "Объектив"
А я имел в виду Фотосканер от гугла.
Спасибо...
26.01.22 13:45
0 1

Фотосканер гугла - для оцифровки фото, устранения бликов и подобного, как мне помнится.
26.01.22 15:47
0 0

Так обычный google translate отлично переводит картинки.
Даже например написанные извращенным методом - греческий язык с использованием латиницы - спокойно переводит картинку с такой тарабарщиной
26.01.22 12:51
0 2

Заметки Google Keep
FineReader (стаааренький, шел в комплекте со сканером)
OneNote для английских текстов

Для сканов использую на телефоне Adobe Scan и MS Lens
Для скана документов с компа - чудесную софтину iCopy
Для скана картинок - чаще всего FastStone

Вот что меня поразило до глубины души - натыкался на онлайн-сервис распознавания рукописного текста. И когда он довольно корявый почерк распознал на 100% - я прям.... удивился.
26.01.22 12:48
0 2

Использую Tesseract OCR. Это неплохой опен-сорсный движок для распознавания текста под Win/Linux/Macos, сделанный при поддержке Гугла.
26.01.22 12:44
0 0

Да просто приложение Yandex Переводчик на телефоне (или аналог от Google) — навёл камеру и мгновенно видишь тот же текст с переводом. Для быстрого понимания сути более чем достаточно
26.01.22 12:31
0 2

Finereader ломаный.
Foxit Pro (для pdf) тоже ломаный.
26.01.22 12:29
0 0

Если мне нужно распознать текст с произвольной картинки пользуюсь встроенным в iOS Live Text and Visual Look Up.
26.01.22 12:27
0 3

Кстати, да.
26.01.22 12:49
0 0

Тоже, все еще Finereader 15
26.01.22 12:17
0 2

Гугл и яндекс, но это без pdf
26.01.22 12:10
0 0

Файнридер, благо он вполне сносно работает даже на Макбуке. Но за ссылку на такой он-лайн сервис спасибо: полезно может быть при использовании смартфона даже с ограничениями бесплатной версии.
26.01.22 12:09
0 1

Мне нравятся последние адоберидеры. Они мало того, что позволяют править текст прямо в pdf файле, но еще и строят шрифты соответсвующие шрифту документа.
26.01.22 12:08
0 0

Мне нравятся последние адоберидеры. Они мало того, что позволяют править текст прямо в pdf файле
С этого момент поподробнее пожалуйста. Какая версия? У меня стоит Reader DC версии 2021.011.20039, если нажать кнопку "Редактировать PDF", то сразу начинает хотеть за эту возможность денег.
26.01.22 18:05
0 0

Наверное господин спутал Reader с Acrobat.
Reader только читает, что собственно вытекает из его названия.
27.01.22 06:50
0 0

FineReader уже лет 15 или 20. Причём какой-то древней когда-то давно купленной версии.
26.01.22 12:03
0 3

Попробовал.
Чуда не произошло.
Так же как и офлайновые распозналки требует четкой картинки. Двенадцатый финереадер на том же файле отработал заметно лучше.
26.01.22 12:01
0 9

Попробовал. Чуда не произошло.Так же как и офлайновые распозналки требует четкой картинки. Двенадцатый финереадер на том же файле отработал заметно лучше.
А если где-то на бегу с телефона что-то нужно распознать? Я для смартфона нормального аналога файнридера не нашёл, а вот сейчас вспоминаю - были ситуации, когда ноута под рукой не было, но распознать и переслать текст было нужно.
26.01.22 12:10
0 0

Попробовал.
Чуда не произошло.
Чудо никто и не обещал.
26.01.22 12:30
3 1

А если где-то на бегу с телефона что-то нужно распознать?
Google Keep жеж
26.01.22 12:50
0 5

Google Keep жеж
Так iOS жеж, Гугль нихьт!
26.01.22 18:17
1 0

Так iOS жеж, Гугль нихьт!
Чиво вдруг? У меня (так сложилось исторически) весь iOS на гуглоприложениях - и кое-что на MS.
27.01.22 16:03
0 0

для поиска по картинкам мне достаточно Evernote. если нужно именно опознать+скопировать текст, использую OCR из FoxitPro.
26.01.22 12:00
0 0

Я Файнридером по старинке, и время от времени встроенной в Акробат OCR.
26.01.22 12:00
0 6

Я иногда пользуюсь ABBYY Screenshot Reader.
26.01.22 23:25
0 1
Теги
Сортировать по алфавиту или записям
BLM 21
Calella 143
exler.ru 271
авто 441
видео 3984
вино 359
еда 498
ЕС 60
игры 114
ИИ 29
кино 1579
попы 190
СМИ 2751
софт 930
США 130
шоу 6