Принцип работы оптического распознавания символов (OCR)

Оптическое распознавание символов (OCR) относится к программному обеспечению, которое создает цифровую версию печатного, набранного или рукописного документа, который компьютер может прочитать без необходимости вручную набирать или вводить текст. OCR обычно используется для сканированных документов в формате PDF, но также может создавать читаемую компьютером версию текста в файле изображения.

Содержание

Что такое OCR
Для чего используется OCR?
Зачем использовать OCR?
История OCR

Что такое OCR

OCR, также называемое распознаванием текста, — это программная технология, которая преобразует символы, такие как цифры, буквы и знаки препинания (также называемые глифами) из печатных или письменных документов в электронную форму, более легко распознаваемую и читаемую компьютерами и другими программами. Некоторые программы OCR делают это в процессе сканирования или фотографирования документа с помощью цифровой камеры, а другие могут применять этот процесс к документам, которые были ранее отсканированы или сфотографированы без OCR. OCR позволяет пользователям осуществлять поиск в документах PDF, редактировать текст и переформатировать документы.

Для чего используется OCR?

Для быстрого, повседневного сканирования OCR может не иметь большого значения. Если вы выполняете большой объем сканирования, возможность поиска в PDF-файлах, чтобы найти именно тот, который вам нужен, может сэкономить немало времени и делает функцию OCR в программе сканера более важной. Вот некоторые другие вещи, в которых помогает OCR:

Автоматизированная обработка данных и ввод данных (Пример: Системы отслеживания соискателей для резюме).
Сделать отсканированные книги доступными для поиска.
Преобразование рукописных сканов в машиночитаемый текст.
Повышение удобства использования документов программами для чтения, помогающими пользователям с ослабленным зрением.
Сохранение исторических документов и газет, а также обеспечение возможности их поиска.
Извлечение данных и передача в бухгалтерские программы (Пример: квитанции и счета-фактуры).
Индексирование документов для использования поисковыми системами.
Распознавание номерных знаков водителей камерой контроля скорости и программным обеспечением для камер красных фонарей.
Синтезаторы речи для людей, которые не могут говорить — физик-теоретик Стивен Хокинг, возможно, является самым известным пользователем программы синтезатора речи.

Зачем использовать OCR?

Почему бы просто не сделать снимок, верно?? Потому что вы не сможете ничего редактировать или искать текст, потому что это будет просто изображение. Сканирование документа и запуск программы OCR может превратить этот файл в то, что вы сможете редактировать и искать.

История OCR

Хотя самое раннее использование распознавания текста датируется 14 годами, широкое развитие и использование технологий, связанных с OCR, началось в 1950-х годах, в частности, с создания очень упрощенных шрифтов, которые было легче преобразовать в читаемый в цифровом формате текст. Первый из этих упрощенных шрифтов был создан Дэвидом Шепардом и широко известен как OCR-7B. OCR-7B все еще используется сегодня в финансовой индустрии для стандартного шрифта, используемого на кредитных и дебетовых картах. В 1960-х годах почтовые службы нескольких стран начали использовать технологию OCR для значительного ускорения сортировки почты, включая США, Великобританию, Канаду и Германию. OCR по-прежнему является основной технологией, используемой для сортировки почты почтовыми службами по всему миру. В 2000 году ключевые знания о пределах и возможностях технологии OCR были использованы для разработки программ CAPTCHA, используемых для остановки ботов и спамеров.

На протяжении десятилетий OCR становилось все более точным и сложным благодаря достижениям в смежных областях технологии, таких как искусственный интеллект, машинное обучение и компьютерное зрение. Сегодня программное обеспечение OCR использует распознавание образов, определение особенностей и поиск текста для преобразования документов быстрее и точнее, чем когда-либо прежде.

ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ

Как сканировать документы с помощью телефона или планшета?
На iOS откройте приложение «Заметки» и создайте новую заметку. Откройте камеру, а затем нажмите Сканирование документов. На Android откройте Google Диск и выберите Плюс (+), затем нажмите кнопку Сканирование сканировать документ с помощью телефона.

Как использовать OCR в Adobe Acrobat?
Откройте файл PDF, содержащий отсканированное изображение, затем выберите Инструменты > Редактирование PDF. Acrobat автоматически применит OCR, чтобы вы могли редактировать текст. Просто выберите место, где вы хотите внести правки, и начинайте печатать.

В чем разница между OCR и OMR?
Оптическое распознавание меток (OMR) — это программное обеспечение, которое обнаруживает метки на бумаге, обычно на листе с пузырьками. OMR используется для обработки результатов экзаменов, опросов, анкетирования и даже выборов. В отличие от OCR, OMR не может расшифровать пометки на странице, а только проверить, что пометки есть.