Open Source C# .NET API voor snellere OCR-tekstherkenning
Gratis C# .NET Optical Character Recognition (OCR) API voor snellere tekstherkenning uit afbeeldingen, inclusief gescande documenten, PDF's met meerdere pagina's en foto's.
Optische tekenherkenning (OCR) is een zeer nuttige technologie die machines in staat stelt tekst uit zowel afbeeldingen als documenten te lezen en deze om te zetten in machinaal leesbare tekst. De laatste tijd is OCR steeds populairder geworden door de opkomst van de digitalisering en de behoefte aan geautomatiseerde gegevensverwerking. Er zijn veel OCR API's beschikbaar die ontwikkelaars kunnen gebruiken om OCR in hun applicaties te implementeren. Eén zo'n API is de Free-OCR-API-CSharp, een geavanceerde gratis OCR API die softwareontwikkelaars helpt bij het maken van .NET-applicaties voor het afhandelen van OCR-bewerkingen. De API is volledig gratis te gebruiken en vereist geen registratie- of abonnementskosten.
Free-OCR-API-CSharp is een gratis OCR API waarmee softwareprogrammeurs OCR-functionaliteit kunnen integreren in hun C#-applicaties zonder enige externe afhankelijkheden. De API maakt gebruik van geavanceerde OCR-technologie waardoor tekst uit afbeeldingen kan worden herkend, inclusief gescande documenten, PDF's en foto's. De API ondersteunt meerdere talen en kan tekst in verschillende lettertypestijlen en -groottes herkennen. De API ondersteunt meerdere talen, waaronder Engels, Frans, Duits, Italiaans, Portugees en Spaans. De OCR-technologie die door de API wordt gebruikt, is snel en nauwkeurig, waardoor tekstherkenning snel en efficiënt mogelijk is. Over het algemeen is het een uitstekende keuze voor softwareontwikkelaars om eenvoudig geavanceerde OCR-functionaliteit toe te voegen aan hun C#-applicaties.
Aan de slag met gratis-OCR-API-CSharp
De aanbevolen manier om Free-OCR-API-CSharp te installeren is met behulp van NuGet. Gebruik het volgende commando voor een vlotte installatie.
Installeer gratis OCR-API-CSharp via NuGet
Install-Package Free-OCR-API-CSharp
Je kunt het ook handmatig installeren; download de nieuwste releasebestanden rechtstreeks vanuit de GitHub repository.
Tekst uit afbeeldingen herkennen via C# OCR API
De open source API Free-OCR-API-CSharp biedt ondersteuning voor een geweldige functie voor het herkennen van tekst uit verschillende soorten afbeeldingen in verschillende talen binnen .NET-applicaties. Om de taak te volbrengen hoeven softwareontwikkelaars alleen maar hun afbeelding in een byte-array te laden en de OCR-methode van de FreeOcrApi-instantie aan te roepen, waarbij ze de byte-array en de taal van de te herkennen tekst doorgeven. De bibliotheek biedt ook een geweldige functie voor batchherkenning van tekst uit meerdere bestanden tegelijk, waardoor het gemakkelijk wordt om veel bestanden tegelijk te verwerken. Het volgende voorbeeld laat zien hoe u tekst uit afbeeldingen kunt herkennen met behulp van C# .NET-code.
Hoe herken ik tekst uit afbeeldingen via de C# API?
using System;
using System.IO;
using FreeOcrApi;
var ocr = new FreeOcrApi("your-api-key");
// Load your image file into a byte array:
byte[] imageData = File.ReadAllBytes("path-to-your-image-file");
string recognizedText = ocr.OCR(imageData, "eng");
// Finally, display the recognized text in the console or save it to a file:
Console.WriteLine(recognizedText);
File.WriteAllText("path-to-output-file", recognizedText);
Maak doorzoekbaar PDF-bestand via C# API
Met de open source API Free-OCR-API-CSharp kunnen softwareontwikkelaars doorzoekbare PDF's (ook bekend als Sandwich PDF's) rechtstreeks in hun eigen C#-applicaties maken. Standaard is de toegevoegde tekstlaag zichtbaar, wat gebruikers een geweldige kans geeft om het resultaat te testen, omdat ze de OCR-uitvoer rechtstreeks kunnen vergelijken met de scanafbeelding. Het volgende voorbeeld laat zien hoe softwareontwikkelaars een afbeelding kunnen laden en deze met C#-code kunnen converteren naar zoek-PDF-documenten.
Hoe maak ik een doorzoekbare PDF via C# ApI?
using System.IO;
using FreeOcrApi;
using PdfSharpCore.Drawing;
using PdfSharpCore.Pdf;
namespace ConsoleApp
{
class Program
{
static void Main(string[] args)
{
FreeOcrApiWrapper api = new FreeOcrApiWrapper("YOUR_API_KEY");
MemoryStream imageStream = new MemoryStream(File.ReadAllBytes("path/to/image.jpg"));
string text = api.Recognize(imageStream);
PdfDocument pdf = new PdfDocument();
PdfPage page = pdf.AddPage();
XGraphics gfx = XGraphics.FromPdfPage(page);
XFont font = new XFont("Verdana", 12, XFontStyle.Regular);
gfx.DrawString(text, font, XBrushes.Black, new XRect(0, 0, page.Width, page.Height), XStringFormats.TopLeft);
pdf.Save("path/to/output.pdf");
}
}
}