Gratis Python API til at integrere OCR-funktioner og udtrække tekst

Open Source Python OCR API til nøjagtig og hurtig tekstgenkendelse fra billeder og dokumenter. Læs både Natural Scene Text og Dense Text i dokumentet ved hjælp af Python Library.

Optical Character Recognition (OCR) teknologi har eksisteret i et stykke tid, og den bruges i forskellige industrier til at automatisere dataindtastning og dokumentbehandlingsopgaver. EasyOCR er en open source OCR-motor (Optical Character Recognition), der er hurtig, præcis og nem at bruge. Det giver en brugervenlig grænseflade for udviklere til at integrere OCR i deres applikationer. Med EasyOCR-biblioteket kan softwareudviklere udtrække tekst fra billeder og scannede dokumenter på få sekunder, hvilket gør det til et ideelt værktøj til dokumenthåndtering, dataudtræk og automatisering.

EasyOCR er skrevet i Python og understøttet over 80+ sprog, hvilket gør det til et kraftfuldt værktøj for virksomheder, der opererer i flersprogede miljøer. Der er flere vigtige funktioner i biblioteket, såsom nøjagtig tekstudtræk, flersproget support, enkel integration med eksisterende applikationer, tilpasning af OCR-motoren til at opfylde dine specifikke behov, omkostningseffektive løsninger, udtræk af tekst fra scannede dokumenter, modtagelse og lagring den udtrukne tekst og mange flere. API'en er en cloud-baseret løsning, der ikke kræver nogen hardware- eller softwareinstallation, hvilket gør den til en omkostningseffektiv løsning for virksomheder i alle størrelser.

EasyOCR API bruger deep learning algoritmer til at opnå høje nøjagtighedshastigheder og kan behandle store mængder data hurtigt. Det er en fleksibel og skalerbar løsning, der kan integreres i eksisterende arbejdsgange ved hjælp af en simpel RESTful API. EasyOCR API er en kraftfuld OCR-løsning, der kan hjælpe virksomheder i alle størrelser med at automatisere deres dataindtastningsprocesser, forbedre nøjagtigheden og reducere omkostningerne. Med understøttelse af flere sprog er det et ideelt værktøj til dokumenthåndtering, dataudtræk og automatisering. Hvis du leder efter en OCR-motor til at integrere i din applikation, så prøv EasyOCR.

Oversigt

En oversigt over EasyOCR-funktioner.

Oversigt over funktioner

Udfør OCR
Tilføj OCR-funktioner
Genkend billedtekst
Konverter billeder af tekst
Genkendt skrifttypetekst
Søg i PDF
Andre sprog
Opret OCR-apps
Gem i browser
Udtræk tekst
Multi-threading Support

EasyOCR

EasyOCR understøtter populære billedfilformater anført nedenfor.

Læser

PNG, JPEG, BMP, TIFF, TGA, DICOM

Forfatter

PNG, JPEG, BMP, TIFF

EasyOCR

Platformuafhængighed

EasyOCR kan fungere med Python 2.7 og nyere.

Python 2.7 og nyere.

EasyOCR

Kom godt i gang med EasyOCR

Den anbefalede måde at installere EasyOCR på er at bruge pip. Brug venligst følgende kommando for en problemfri installation.

Installer EasyOCR via pip

 pip install easyocr

Du kan også installere det manuelt; download de seneste udgivelsesfiler direkte fra GitHub-lageret.

Tekstlæsning og udtrækning fra billede via Python API

Open source EasyOCR API bruger deep learning algoritmer til at indlæse, genkende og udtrække tekst fra billeder og PDF-filer i Python-applikationer. EasyOCR kan læse flere sprog på samme tid, men de skal være kompatible med hinanden. Sprog, der deler mest karakter (f.eks. latinsk skrift) med hinanden, er kompatible. API'et gør det muligt at læse og udtrække tekst fra billeder, herunder hvordan man forbehandler billederne og justerer OCR-motorens parametre for at forbedre nøjagtigheden. Følgende eksempel viser, hvordan man læser og udtrækker tekst fra billeder og automatiserer dataindtastningsopgaver med lethed.

Læs og udtræk tekst fra billeder via Python API

import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine

# Load the image and preprocess it

from PIL import Image
import cv2

image = Image.open('text_image.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_image.png')

# Use the OCR engine to extract text from the image.

result = reader.readtext(image, detail=0)

Genkendelse af tegn fra tekstbokse via Python API

Genkendelse af tegn fra tekstbokse er et almindeligt eksempel på OCR-motorer. Open source EasyOCR API giver en kraftfuld og brugervenlig løsning til denne use case. Det hjælper softwareudviklere med let at genkende tegn fra tekstbokse, og hvordan man forbehandler billederne og justerer OCR-motorens parametre for at forbedre nøjagtigheden. Tekstbokse kan have forskellige former, størrelser og retninger, og dette kan påvirke nøjagtigheden af OCR-motoren. Så anvendelse af nogle forbehandlingstrin kan forbedre nøjagtigheden af OCR-motoren, såsom Forskæv billedet, Anvend binarisering og Anvend støjreduktion.

Hvordan genkender man tegn fra tekstbokse via Python API?

import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine

# Load the image and preprocess it

from PIL import Image
import cv2

image = Image.open('text_box.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_box.png')

# OCR engine to recognize the characters in the text box

result = reader.readtext(image, detail=0)

# The result is a list of strings, where each string represents a recognized character in the text box.