Biblioteca PHP para Extraer Texto de Imágenes en Múltiples Idiomas

La API OCR de Código Abierto para PHP permite cargar y escanear imágenes o documentos, reconocer y extraer texto de imágenes en varios idiomas dentro de aplicaciones PHP.

La tecnología de Reconocimiento Óptico de Caracteres (OCR) se ha convertido en una herramienta esencial para extraer texto de imágenes y documentos en la actualidad. Con el auge de la transformación digital, la necesidad de soluciones OCR eficientes y precisas nunca ha sido tan urgente. OcrPHP es una biblioteca OCR de código abierto muy potente que permite a los desarrolladores crear aplicaciones OCR robustas y escalables. Es una biblioteca OCR basada en PHP que utiliza el motor Tesseract OCR, una tecnología OCR ampliamente usada y altamente reconocida desarrollada por Google. La biblioteca incluye numerosas funciones, como escaneo de documentos, extracción de texto de imágenes, extracción de texto en un idioma específico, extracción de texto de PDFs y mucho más.

La biblioteca OcrPHP incorpora técnicas avanzadas de preprocesamiento de imágenes, como corrección de inclinación, eliminación de manchas y binarización, para mejorar la precisión del OCR. Soporta la realización de OCR en varios idiomas, incluidos inglés, español, francés, alemán, italiano, portugués, chino, japonés y muchos más. Los desarrolladores pueden personalizar el proceso OCR ajustando parámetros como el idioma, el modo de segmentación de página y la configuración del motor OCR. También incluye mecanismos robustos de manejo de errores para garantizar que las operaciones OCR se ejecuten de manera fluida y eficiente. Con funciones como soporte multilingüe, escaneo avanzado de imágenes, configuraciones personalizadas e integración sencilla, permite a los desarrolladores crear herramientas de reconocimiento de texto versátiles con poco esfuerzo y bajo costo.

A Simple Vista

Una visión general de las características de OcrPHP.

Resumen de Características

Realizar OCR
Agregar Capacidades OCR
Reconocer texto en muchos idiomas
Convertir Imágenes de texto
Texto de Fuente Reconocido
Buscar PDF
Otros Idiomas
Crear aplicaciones OCR
Guardar en el navegador
Extraer Texto
Soporte de Multihilo

OcrPHP

OcrPHP soporta los formatos de archivo de compresión populares listados a continuación.

Lector

PNG, JPEG, BMP, TIFF, TGA, DICOM

Escritor

PNG, JPEG, BMP, TIFF

OcrPHP

Independencia de Plataforma

OcrPHP solo requiere el tiempo de ejecución de PHP.

PHP 5.1 y superiores.

OcrPHP

Comenzando con OcrPHP

La forma recomendada de instalar OcrPHP es usando Composer. Por favor, use el siguiente comando para una instalación sin problemas.

Instalar OcrPHP vía Composer

composer require fizzday/ocrphp

Instalar OcrPHP vía Github

git clone https://github.com/fizzday/OcrPHP.git

Puede descargar la biblioteca compartida compilada desde el repositorio Github.

Reconocer y Extraer Texto de una Imagen con PHP

La biblioteca OcrPHP de código abierto facilita que el software cargue varios tipos de imágenes y extraiga texto de esas imágenes con solo un par de líneas de código PHP. Aquí hay un ejemplo muy sencillo que usa la biblioteca Imagick para cargar un archivo de imagen y crear una instancia de la clase OcrPHP. Los desarrolladores pueden luego establecer el idioma y la configuración del motor OCR antes de realizar OCR en la imagen usando el método recognize(). Finalmente, imprime el texto extraído usando el método getText().

¿Cómo Extraer Texto de una Imagen usando la Biblioteca PHP?

require_once 'OcrPHP/autoload.php';

// Load the image file
$image = new Imagick('path/to/image.jpg');

// Create an instance of the OcrPHP class
$ocr = new OcrPHP();

// Set the language and OCR engine settings
$ocr->setLanguage('eng');
$ocr->setPageSegmentationMode(OcrPHP::PSM_SINGLE_BLOCK);

// Perform OCR on the image
$result = $ocr->recognize($image);

// Print the extracted text
echo $result->getText();

Reconocer Texto en un Idioma Específico con PHP

La biblioteca OcrPHP ha incorporado soporte para varios idiomas para llevar a cabo operaciones OCR dentro de aplicaciones PHP. Ya sea que su texto esté en inglés, chino o cualquier otro idioma compatible, OcrPHP puede manejarlo sin problemas. Para extraer texto en un idioma específico, pase el código del idioma como parámetro. Asegúrese de que el modelo de idioma Tesseract correspondiente esté instalado. El siguiente ejemplo muestra cómo los desarrolladores pueden extraer texto de imágenes en idioma chino dentro de aplicaciones PHP.

¿Cómo Extraer Texto de una Imagen en Idioma Chino vía PHP?

require 'vendor/autoload.php';

use Fizzday\Ocr\Ocr;

$imagePath = __DIR__ . '/example-image-chinese.png';

$ocr = new Ocr();

// Extract text in Chinese
$text = $ocr->scan($imagePath, 'chi_sim'); // Use 'eng' for English

echo "Extracted Text (Chinese): \n" . $text;

Procesamiento por Lotes y Automatización OCR con PHP

Para los desarrolladores que crean aplicaciones de procesamiento de documentos, el procesamiento por lotes puede ser una característica valiosa. OcrPHP facilita que los desarrolladores recorran un directorio de archivos de imagen y extraigan texto de cada uno automáticamente. Esto es perfecto para automatizar tareas como escanear facturas, recibos o libros. Aquí hay un ejemplo muy útil que escanea todos los archivos .png en el directorio especificado, extrae texto de cada uno y lo imprime. Puede ampliar esto para guardar la salida en un archivo o base de datos, convirtiéndolo en una herramienta poderosa para el procesamiento de documentos.

¿Cómo Extraer Texto de Múltiples Imágenes vía la Biblioteca PHP?

require 'vendor/autoload.php';

use Fizzday\Ocr\Ocr;

$directory = __DIR__ . '/images/';
$ocr = new Ocr();

foreach (glob($directory . '*.png') as $imagePath) {
    $text = $ocr->scan($imagePath);
    echo "Text from {$imagePath}: \n" . $text . "\n\n";
}

Configuración Personalizada y Soporte de Integración

La biblioteca OcrPHP de código abierto es versátil y amigable para los desarrolladores, lo que simplifica la integración de capacidades OCR en proyectos PHP. La biblioteca permite especificar configuraciones personalizadas de Tesseract, como idioma, modo de segmentación de página y parámetros de preprocesamiento de imágenes, ofreciendo flexibilidad para adaptar los resultados OCR.