Gratis Python API for å integrere OCR-funksjoner og trekke ut tekst

Open Source Python OCR API for nøyaktig og rask tekstgjenkjenning fra bilder og dokumenter. Les både Natural Scene Text og Dense Text i dokumentet ved hjelp av Python Library.

Optical Character Recognition (OCR)-teknologi har eksistert en stund, og den brukes i ulike bransjer for å automatisere dataregistrering og dokumentbehandlingsoppgaver. EasyOCR er en åpen kildekode OCR-motor (Optical Character Recognition) som er rask, nøyaktig og enkel å bruke. Det gir et brukervennlig grensesnitt for utviklere for å integrere OCR i applikasjonene sine. Med EasyOCR-biblioteket kan programvareutviklere trekke ut tekst fra bilder og skannede dokumenter i løpet av sekunder, noe som gjør det til et ideelt verktøy for dokumenthåndtering, datautvinning og automatisering.

EasyOCR er skrevet i Python og støttes over 80+ språk, noe som gjør det til et kraftig verktøy for bedrifter som opererer i flerspråklige miljøer. Det er flere viktige funksjoner i biblioteket som nøyaktig tekstutvinning, flerspråklig støtte, enkel integrasjon med eksisterende applikasjoner, tilpasse OCR-motoren for å møte dine spesifikke behov, kostnadseffektive løsninger, trekke ut tekst fra skannede dokumenter, motta og lagre den utpakkede teksten, og mange flere. API-en er en skybasert løsning som ikke krever maskinvare- eller programvareinstallasjon, noe som gjør den til en kostnadseffektiv løsning for bedrifter i alle størrelser.

EasyOCR API bruker dyplæringsalgoritmer for å oppnå høye nøyaktighetshastigheter og kan behandle store datamengder raskt. Det er en fleksibel og skalerbar løsning som kan integreres i eksisterende arbeidsflyter ved hjelp av en enkel RESTful API. EasyOCR API er en kraftig OCR-løsning som kan hjelpe bedrifter i alle størrelser med å automatisere dataregistreringsprosessene sine, forbedre nøyaktigheten og redusere kostnadene. Med støtte for flere språk, er det et ideelt verktøy for dokumenthåndtering, datautvinning og automatisering. Hvis du ser etter en OCR-motor som kan integreres i applikasjonen din, prøv EasyOCR.

Med et blikk

En oversikt over EasyOCR-funksjoner.

Oversikt over funksjoner

Utfør OCR
Legg til OCR-funksjoner
Gjenkjenne bildetekst
Konverter bilder av tekst
Gjenkjent skrifttekst
Søk i PDF
Andre språk
Lag OCR-apper
Lagre i nettleseren
Trekk ut tekst
Støtte for flere tråder

EasyOCR

EasyOCR støtter populære bildefilformater oppført nedenfor.

Leser

PNG, JPEG, BMP, TIFF, TGA, DICOM

Forfatter

PNG, JPEG, BMP, TIFF

EasyOCR

Plattformuavhengighet

EasyOCR kan fungere med Python 2.7 og nyere.

Python 2.7 og nyere.

EasyOCR

Kom i gang med EasyOCR

Den anbefalte måten å installere EasyOCR på er å bruke pip. Bruk følgende kommando for en jevn installasjon.

Installer EasyOCR via pip

 pip install easyocr

Du kan også installere det manuelt; last ned de siste utgivelsesfilene direkte fra GitHub-depotet.

Tekstlesing og utvinning fra bilde via Python API

Open source EasyOCR API bruker dyplæringsalgoritmer for å laste, gjenkjenne og trekke ut tekst fra bilder og PDF-filer i Python-applikasjoner. EasyOCR kan lese flere språk samtidig, men de må være kompatible med hverandre. Språk som deler mest karakter (f.eks. latinsk skrift) med hverandre er kompatible. API-en lar deg lese og trekke ut tekst fra bilder, inkludert hvordan du forhåndsbehandler bildene og justerer OCR-motorens parametere for å forbedre nøyaktigheten. Følgende eksempel viser hvordan du leser og trekker ut tekst fra bilder og automatiserer dataregistreringsoppgaver med letthet.

Les og trekk ut tekst fra bilder via Python API

import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine

# Load the image and preprocess it

from PIL import Image
import cv2

image = Image.open('text_image.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_image.png')

# Use the OCR engine to extract text from the image.

result = reader.readtext(image, detail=0)

Gjenkjenne tegn fra tekstbokser via Python API

Å gjenkjenne tegn fra tekstbokser er et vanlig bruksområde for OCR-motorer. Åpen kildekode EasyOCR API gir en kraftig og brukervennlig løsning på denne brukssaken. Det hjelper programvareutviklere å gjenkjenne tegn fra tekstbokser med letthet og hvordan man forhåndsbehandler bildene og justerer OCR-motorens parametere for å forbedre nøyaktigheten. Tekstbokser kan ha forskjellige former, størrelser og retninger, og dette kan påvirke nøyaktigheten til OCR-motoren. Så å bruke noen forbehandlingstrinn kan forbedre nøyaktigheten til OCR-motoren, for eksempel Fjerne bildet, bruke binarisering og bruke støyreduksjon.

Hvordan gjenkjenne tegn fra tekstbokser via Python API?

import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine

# Load the image and preprocess it

from PIL import Image
import cv2

image = Image.open('text_box.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_box.png')

# OCR engine to recognize the characters in the text box

result = reader.readtext(image, detail=0)

# The result is a list of strings, where each string represents a recognized character in the text box.