1. מוצרים
  2.   OCR
  3.   JavaScript
  4.   Tesseract.js
 
  

Open Source JavaScript API כדי להוסיף ולנהל OCR לאפליקציות אינטרנט

ספריית JavaScript בחינם מובילה להוספת פונקציונליות של זיהוי תווים אופטי (OCR) ל-JS Web Apps והמרת תמונות של טקסט מודפס או בכתב יד לטקסט קריא במכונה בחינם.

Tesseract.js היא ספריית JavaScript שימושית מאוד בקוד פתוח המאפשרת למפתחי תוכנה לשלב פונקציונליות של זיהוי תווים אופטי (OCR) בתוך יישומי האינטרנט שלהם במינימום מאמץ ועלות. OCR הוא תהליך המרת תמונות של טקסט מודפס או בכתב יד לטקסט קריא במכונה. Tesseract.js הוא יציאה של מנוע ה-Tesseract OCR הפופולרי, שפותח במקור על ידי Hewlett-Packard בשנות ה-80 ולאחר מכן תוחזק על ידי גוגל. Tesseract.js יכול לזהות למעלה מ-100 שפות, מה שהופך אותו לכלי רב עוצמה עבור מפתחים המעוניינים להוסיף פונקציונליות OCR ליישומי האינטרנט שלהם.

Tesseract.js קל מאוד לטיפול וניתן להשתמש בו למגוון משימות, כגון חילוץ טקסט ממסמכים סרוקים, קבלות וכרטיסי ביקור, אוטומציה של משימות הזנת נתונים וכן שיפור פונקציונליות החיפוש בתוך יישומי אינטרנט. אחד היתרונות המרכזיים של Tesseract.js הוא היכולת לזהות טקסט גם כאשר תמונת הקלט היא באיכות או ברזולוציה ירודה. הספרייה משתמשת באלגוריתמים של למידת מכונה כדי לשפר את הדיוק של תוצאות OCR. זה יכול גם לבצע ניתוח פריסת עמוד ולזהות אזורי עניין בתוך תמונה.

Tesseract.js נהיה פופולרי בשל קלות השימוש שלו כמו גם יכולות OCR חזקות וניתן להפעיל אותו בצורה חלקה בדפדפן או בשרת עם NodeJS. הוא מספק API פשוט המאפשר למפתחי תוכנה להגדיר אפשרויות OCR כגון שפה, מצב פילוח עמודים ותווים ברשימת ההיתרים. היכולת שלו לזהות טקסט מתמונות באיכות ירודה ותמיכה במספר שפות הופכות אותו לכלי בעל ערך עבור מגוון רחב של יישומים ולבחירה מצוינת עבור מפתחים המעוניינים להוסיף OCR ליישומי האינטרנט שלהם.

Previous Next

תחילת העבודה עם Tesseract.js

הדרך המומלצת להתקנת Tesseract.js היא באמצעות npm. אנא השתמש בפקודה הבאה להתקנה חלקה

התקן את Tesseract.jsvia npm

 npm install tesseract.js

אתה יכול גם להתקין אותו באופן ידני; הורד את קבצי הגרסה העדכניים ביותר ישירות ממאגר GitHub.

המר תמונה לטקסט באמצעות JavaScript API

ספריית הקוד הפתוח JavaScript Tesseract.js מקלה על מפתחי תוכנה לעבוד עם סוגים שונים של תמונות כגון BMP, JPG, PNG, PBM, WebP ועוד. הספרייה תומכת בחילוץ טקסט מתמונות כדי להפוך את עיבוד הטקסטים לאוטומטיים לתמונות, קובצי PDF ומסמכים סרוקים. הדוגמה הבאה מראה כיצד לטעון תמונה וטקסט שחולץ ממנה באמצעות כמה שורות קוד בלבד. ארגומנט השפה משמש לקביעת נתוני השפה המאומנים שישמשו בעיבוד תמונות. מפתחי תוכנה יכולים להשתמש במספר שפות כאן.

כיצד להמיר תמונה לטקסט באמצעות JavaScript API?

Tesseract.recognize(
  image,language,
  { 
    logger: m => console.log(m) 
  }
)
.catch (err => {
  console.error(err);
})
.then(result => {
 console.log(result);
})
}

קרא אזור תמונה וחלץ טקסט באמצעות JS API

ספריית JavaScript בקוד פתוח כללה תכונות שימושיות מאוד לקריאת אזור מסוים בתוך תמונה ולכידת הנתונים שלה בתוך יישומי JavaScript. ה-API תומך בלכידת אזור התמונה ומנסה לזהות טקסט בתוך אזור זה באמצעות מנוע ה-OCR הפנימי החזק. הדוגמאות הבאות מראות כיצד מפתחי תוכנה יכולים לספק כתובת URL לתמונה וה-API יכול לזהות ולזהות בקלות טקסט באזור הנבחר.

קרא וזיהוי טקסט באזור נבחר של תמונה באמצעות JS API

const { createWorker } = require('tesseract.js');

const worker = await createWorker();
const rectangle = { left: 0, top: 0, width: 500, height: 250 };

(async () => {
  await worker.loadLanguage('eng');
  await worker.initialize('eng');
  const { data: { text } } = await worker.recognize('https://tesseract.projectnaptha.com/img/eng_bw.png', { rectangle });
  console.log(text);
  await worker.terminate();
})();
 עִברִית