PHP бібліотека для витягнення тексту з зображень кількома мовами

Відкритий API оптичного розпізнавання символів (OCR) для PHP дозволяє завантажувати та сканувати зображення або документи, розпізнавати та витягати текст з зображень кількома мовами у PHP додатках.

Оптичне розпізнавання символів (OCR) стало незамінним інструментом для витягнення тексту з зображень та документів у наш час. З розвитком цифрової трансформації потреба в ефективних та точних рішеннях OCR ніколи не була такою актуальною. OcrPHP – дуже потужна відкрита бібліотека OCR, яка дає змогу розробникам створювати надійні та масштабовані OCR‑застосунки. Це бібліотека OCR на базі PHP, що використовує движок Tesseract OCR, широко відомий та високо оцінений технологічний продукт, розроблений Google. У бібліотеці є безліч функцій, таких як сканування документів, витяг тексту з зображень, витяг тексту певною мовою, витяг тексту з PDF‑файлів тощо.

Бібліотека OcrPHP включає передові методи попередньої обробки зображень, такі як випрямлення, усунення шуму та бінаризація, щоб підвищити точність OCR. Вона підтримує виконання OCR кількома мовами, включаючи англійську, іспанську, французьку, німецьку, італійську, португальську, китайську, японську та інші. Розробники можуть налаштовувати процес OCR, змінюючи параметри мови, режим сегментації сторінки та налаштування движка OCR. Бібліотека також містить надійні механізми обробки помилок, що забезпечують плавне та ефективне виконання OCR‑операцій. Завдяки підтримці багатьох мов, передовому скануванню зображень, кастомним конфігураціям та простій інтеграції, вона дозволяє створювати універсальні інструменти розпізнавання тексту з мінімальними зусиллями та низькими витратами.

Огляд

Огляд можливостей OcrPHP.

Огляд функцій

Виконувати OCR
Додавати можливості OCR
Розпізнавати текст багатьма мовами
Конвертувати зображення тексту
Розпізнаний шрифт тексту
Пошук у PDF
Інші мови
Створювати OCR застосунки
Зберігати у браузері
Витягувати текст
Підтримка багатопоточності

OcrPHP

OcrPHP підтримує популярні формати файлів стиснення, перелічені нижче.

Читач

PNG, JPEG, BMP, TIFF, TGA, DICOM

Записувач

PNG, JPEG, BMP, TIFF

OcrPHP

Платформна незалежність

OcrPHP потребує лише PHP Runtime.

PHP 5.1 та вище.

OcrPHP

Початок роботи з OcrPHP

Рекомендований спосіб встановлення OcrPHP – використання Composer. Будь ласка, скористайтеся наступною командою для безпроблемної інсталяції.

Встановити OcrPHP через Composer

composer require fizzday/ocrphp

Встановити OcrPHP через Github

git clone https://github.com/fizzday/OcrPHP.git

Ви можете завантажити скомпільовану спільну бібліотеку з репозиторію Github.

Розпізнавання та витягнення тексту з зображення за допомогою PHP

Відкрита бібліотека OcrPHP спрощує процес завантаження різних типів зображень та витягнення тексту з них за допомогою всього кількох рядків коду PHP. Нижче наведено дуже простий приклад, який використовує бібліотеку Imagick для завантаження файлу зображення та створення екземпляра класу OcrPHP. Після цього розробники можуть задати мову та налаштування движка OCR перед виконанням розпізнавання зображення за допомогою методу recognize(). Нарешті, отриманий текст виводиться за допомогою методу getText().

Як витягнути текст з зображення за допомогою PHP бібліотеки?

require_once 'OcrPHP/autoload.php';

// Load the image file
$image = new Imagick('path/to/image.jpg');

// Create an instance of the OcrPHP class
$ocr = new OcrPHP();

// Set the language and OCR engine settings
$ocr->setLanguage('eng');
$ocr->setPageSegmentationMode(OcrPHP::PSM_SINGLE_BLOCK);

// Perform OCR on the image
$result = $ocr->recognize($image);

// Print the extracted text
echo $result->getText();

Розпізнавання тексту певною мовою за допомогою PHP

Бібліотека OcrPHP забезпечує підтримку багатьох мов для виконання OCR‑операцій у PHP‑застосунках. Незалежно від того, чи ваш текст англійською, китайською чи будь‑якою іншою підтримуваною мовою, OcrPHP впорається з цим без проблем. Щоб витягнути текст певною мовою, передайте код мови як параметр. Переконайтеся, що відповідна мовна модель Tesseract встановлена. Нижче наведено приклад, який демонструє, як розробники можуть витягнути текст з зображень китайською мовою у PHP‑застосунках.

Як витягнути текст з зображення китайською мовою за допомогою PHP?

require 'vendor/autoload.php';

use Fizzday\Ocr\Ocr;

$imagePath = __DIR__ . '/example-image-chinese.png';

$ocr = new Ocr();

// Extract text in Chinese
$text = $ocr->scan($imagePath, 'chi_sim'); // Use 'eng' for English

echo "Extracted Text (Chinese): \n" . $text;

Пакетна обробка та автоматизація OCR за допомогою PHP

Для розробників, які створюють застосунки обробки документів, пакетна обробка може стати цінною функцією. Відкрита бібліотека OcrPHP спрощує процес перебору файлів у каталозі, автоматично витягуючи текст з кожного зображення. Це ідеально підходить для автоматизації завдань, таких як сканування рахунків, чеків чи книг. Нижче наведено корисний приклад, який сканує всі .png‑файли у вказаному каталозі, витягує текст з кожного та виводить його. За потреби його можна розширити, зберігаючи результат у файл або базу даних, що робить інструмент потужним для обробки документів.

Як витягнути текст з декількох зображень за допомогою PHP бібліотеки?

require 'vendor/autoload.php';

use Fizzday\Ocr\Ocr;

$directory = __DIR__ . '/images/';
$ocr = new Ocr();

foreach (glob($directory . '*.png') as $imagePath) {
    $text = $ocr->scan($imagePath);
    echo "Text from {$imagePath}: \n" . $text . "\n\n";
}

Користувацька конфігурація та підтримка інтеграції

Відкрита бібліотека OcrPHP – це універсальний та зручний для розробників інструмент, який спрощує інтеграцію можливостей OCR у PHP‑проекти. Бібліотека дозволяє задавати власні конфігурації Tesseract, такі як мова, режим сегментації сторінки та параметри попередньої обробки зображень, забезпечуючи гнучкість у налаштуванні результатів OCR.