JS библиотека Tessaract.js получение текста из картинки

JS библиотека Tessaract.js получение текста из картинки
Метки: /

В этой статье вы прочитаете про очень интересную JavaScript библиотеку Tessaract.js, которая позволяет получать текст из изображения, думаю это многим будет интересно.

Также если вы интересуетесь разными JavaScript библиотекам, то почитайте статью «Топ 9 библиотек для JavaScript», я думаю вы найдёте там что интересное.

Как подключить Tessaract.js:

Подключить эту библиотеку можно тремя способами, через CDN, NPM и YARN, начнём по порядку.

CDN:

Если кто не знает, то CDN это когда мы подключаем удалённый файл, через тег script. Вот как мы подключаем в нашем HTML файле:

NPM:

NPM это когда мы прописываем специальную команды в терминале, что бы установить пакет. Вот что мы пишем:

YARN:

Тоже самое что и NPM, только теперь используем немного другой пакетный менеджер. Вот такая команда:

Можете выбрать на своё усмотрение, что вам нужно.

Работа с Tessaract.js:

Работать с этой библиотекой достаточно легко, в целом я даже думаю что справиться достаточно начинающий программист, поэтому покажу вам только два примера, и всё.

Эти два примера будут делать плюс минус одно и тоже, различии в том, что один из полимеров более предпочтительный.

Начнём мы с менее предпочтительного, вот его код:

Тут мы импортируем библиотеку Tesseract, потом с помощью метода recognize(), мы будем искать в изображение текст, первым параметром метод принимает путь до картинки, второй, это язык текста которого мы хотим найти, ну и третий это объект с дополнительными параметрами, в нашем случае мы добавляем logger, то есть отслеживаем логи в консоли или в терминале.  Если всё успешно, то результат текста выводим в терминал.

Как вы можете заметить тут не чего сложного нет, вместо вывода в терминал вы можете выводить на экран браузера или записывать другой файл если используете Node.js.

Второй пример как говорилось выше более предпочтительней, вот он:

Теперь мы импортируем отдельный компонент библиотеки, называется createWorker, и с его помощью создаём объект для работы, как видите в качестве параметра мы так же используем объект, который хранит дополнительные настройки, у нас там только отображение логов в терминале.

Затем создаём асинхронную функцию, которую тут же и запускаем, внутри неё мы подгружаем вспомогательные компоненты которые находиться удалённо, поэтому с библиотекой можно работать только с подключенным интернетом, потом языковой пакет, это loadLanguage(), и инициализируем всё что сделали.

Потом запускаем метод recognize(), который в качестве параметра принимает в себя путь до картинки, после выводим в консоль текст который мы получили из изображения.

Последние что мы тут делаем, так это очищаем и завершаем работу с помощью метода terminate().

В целом на этом всё, тут я вам посоветую самим поэкспериментировать, и поработать с ней самим, чтобы точно понять как работать с библиотекой.

Вывод:

В этой статье вы познакомились с библиотекой Tessaract.js, которая позволяет получать текст из изображения, если она вас заинтересовала, то почитайте её документацию. Думаю вам было интересно.

Подписываетесь на соц-сети:

Оценка:

1 Звезда2 Звезды3 Звезды4 Звезды5 Звезд
(Пока оценок нет)
Загрузка...

Также рекомендую:

Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии