В OCR-системе Google Docs появилась поддержка русского языка

Дмитрий Клюшин, 04.03.2011

Спустя восемь месяцев после включения в состав Google Docs механизма оптического распознавания текста из PDF-файлов или изображений форматов JPG, GIF, PNG, разработчики онлайнового офисного пакета сообщили о расширении списка поддерживаемых OCR-системой языков. Теперь алгоритмы последней обеспечивают распознавание текстов на 34 языках, включая русский.

Элементы управления OCR-модулем расположены на странице загрузки файлов в Google Docs. Достаточно выставить галочку напротив опции «Преобразовывать текст из PDF-файлов или изображений в формат документов Google», и система автоматически извлечет из отсканированных документов и цифровых фотографий текстовые данные для их последующей правки в текстовом редакторе.

Максимальный размер изображений перечисленных выше форматов и PDF-файлов составляет 2 Мбайта. В PDF-документах при поиске текста для распознавания просматриваются только первые десять страниц. С прочими ограничениями и особенностями OCR-системы можно ознакомиться на этой странице прилагаемой к Google Docs документации.

В компании отмечают, что OCR-система Google Docs была разработана в сотрудничестве с командой проекта Google Books. По словам специалистов, распознавание лучше всего работает с изображениями в высоком разрешении, при этом алгоритмы системы не всегда хорошо справляются с сохранением стилевого оформления документов. Для того чтобы у пользователя была возможность быстро исправить ошибки распознавания, в обработанный документ включается оригинал изображения.

google

Нет комментарий

Оставить комментарий Отменить ответ

Для отправки комментария вам необходимо авторизоваться.

хайтек агрегатор

новости интернета и современных технологий

В OCR-системе Google Docs появилась поддержка русского языка

Нет комментарий

Оставить комментарий Отменить ответ

В автомобилях Tesla появится аналог Google Play с играми и приложениями

видео | NVIDIA обновила вышедший 25 лет назад Quake II. Но сыграть в него смогут не все

Движущиеся тротуары: их почти сделали ещё 150 лет назад

Учёные создали новый полимер, который позволит заряжать батареи быстрее и без риска возгорания

Китайский «робот-огнеборец» от Deep Robotics показал на что способен в реалистичных условиях

Фабрика ENGINEAI в Шэньчжэне выпускает одного андроида каждые 15 минут

В OCR-системе Google Docs появилась поддержка русского языка

Вперед Первый взгляд на новую материнскую плату GIGABYTE GA-P67A-UD7-B3

Назад Steam — крупнейшая ПК-система цифровой дистрибуции

Нет комментарий

Оставить комментарий Отменить ответ