ספריית רובי חינמית מתקדמת לטעינה ולחילוץ טקסט מתמונות

קוד פתוח מוביל Ruby OCR API וממיר תמונה לטקסט המאפשר למפתחי תוכנה לטעון, לזהות ולחלץ טקסט מתמונות (תמונות סרוקות וקבצי PDF)

זיהוי תווים אופטי (OCR) היא טכנולוגיה רבת עוצמה המאפשרת למחשבים לזהות ולחלץ טקסט מתמונות או מסמכים סרוקים. יש לו יישומים רבים, החל מדיגיטציה של חומרים מודפסים ועד לאוטומציה של תהליכי הזנת נתונים. בשפת התכנות Ruby, ספרייה פופולרית אחת עבור OCR היא Ruby-Tesseract-OCR. Ruby-Tesseract-OCR היא אבן חן רובי המשמשת כעטיפת למנוע Tesseract OCR. Tesseract הוא מנוע OCR בקוד פתוח שפותח על ידי Google והוא ידוע בזכות הדיוק שלו ובתמיכה בשפה.

Ruby-Tesseract-OCR חורג מיכולות OCR בסיסיות ומציע תכונות נוספות למקרי שימוש מתקדמים. לדוגמה, מפתחי תוכנה יכולים לציין אזור עניין (ROI) בתוך תמונה כדי להגביל את ניתוח ה-OCR לאזור ספציפי. זה שימושי במיוחד כאשר אתה מתמודד עם מסמכים מורכבים או כאשר אתה רק צריך לחלץ טקסט מקטע מסוים. הספרייה מספקת מספר תכונות נוספות לשיפור יכולות ה-OCR, כגון טעינת תמונה קיימת, חילוץ טקסט מתמונות או מסמכים סרוקים, השגת פלט HOCR (HTML OCR) ועוד רבים נוספים.

פנינת Ruby-Tesseract-OCR מספקת ממשק קל לשימוש לאינטראקציה עם מנוע Tesseract, המאפשר למפתחי Ruby לשלב יכולות OCR בפרויקטים שלהם ללא מאמץ. בין אם אתה צריך לחלץ מידע מחשבוניות, לבצע דיגיטציה של חומרים מודפסים או להפוך משימות הזנת נתונים לאוטומטיות, ספריית הקוד הפתוח מספקת פתרון אמין ויעיל. נסה את זה, וגלה את הפוטנציאל של OCR בפרויקטי Ruby שלך היום.

במבט אחד

סקירה כללית של תכונות Ruby-Tesseract-OCR.

סקירת תכונות

בצע OCR
הוסף יכולות OCR
זהה טקסט תמונה
טען תמונות באמצעות כתובת URL
המר טקסט PDF tp
טקסט גופן מזוהה
חפש PDF
שפות אחרות
צור אפליקציות OCR
שמור בדפדפן
חלץ טקסט
תמיכה בריבוי-שרשורים

Ruby-Tesseract-OCR

Ruby-Tesseract-OCR תומך בפורמטים פופולריים של קבצי OCR המפורטים להלן.

קוֹרֵא

PNG, JPEG, BMP, TIFF, TGA, DICOM

סוֹפֵר

PNG, JPEG, BMP, TIFF

Ruby-Tesseract-OCR

עצמאות פלטפורמה

Ruby-Tesseract-OCR דורש רק Ruby Runtime.

Ruby 5.1 ומעלה.

Ruby-Tesseract-OCR

תחילת העבודה עם Ruby-Tesseract-OCR

הדרך המומלצת להתקנת Ruby-Tesseract-OCR היא באמצעות Rubygems. אנא השתמש בפקודה הבאה להתקנה חלקה.

התקן Ruby-Tesseract-OCR דרך Rubygems

gem install tesseract-ocr

תוכל להוריד את הספרייה המשותפת שהורכבה ממאגר Github.

חלץ טקסט מתמונות ומסמכים סרוקים באמצעות Ruby

Ruby-Tesseract-OCR היא ספריית קוד פתוח חזקה מאוד המאפשרת למפתחי תוכנה לטעון ולחלץ טקסט מסוגים שונים של תמונות עם כמה שורות של קוד Ruby בלבד. הספרייה מקלה על חילוץ טקסט מתמונות, PDFS או מסמכים סרוקים. זרימת העבודה הטיפוסית כוללת טעינת תמונה, הגדרת פרמטרי ה-OCR והפעלת מנוע ה-OCR כדי לזהות את הטקסט. לצורך פעולה מוצלחת מפתחים צריכים לספק את הנתיב לתמונה שהם רוצים לעבד ולקרוא לשיטת text_for כדי לחלץ את הטקסט. לבסוף, התוצאה תודפס לקונסולה. הספרייה מציעה אפשרויות Fconfiguration שונות לשליטה בהתנהגות OCR, כגון מצב פילוח עמודים, תווים ברשימת הלבנים ועוד. הדוגמאות הבאות מראות כיצד מפתחי תוכנה יכולים לטעון תמונת JPEG ולחלץ ממנה טקסט בתוך יישומי Ruby.

כיצד לחלץ טקסט מתמונות באמצעות פקודות רובי?

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

e.text_for('test/first.png').strip # => 'ABC'

חלץ טקסט מאזור תמונה מסוים באמצעות Ruby

ספריית הקוד הפתוח Ruby-Tesseract-OCR חורגת מיכולות OCR בסיסיות ומציעה תכונות נוספות למקרי שימוש מתקדמים. לדוגמה, משתמשים יכולים לציין אזור עניין (ROI) בתוך תמונה כדי להגביל את ניתוח ה-OCR לאזור ספציפי. זה שימושי במיוחד כאשר עוסקים במסמכים מורכבים או כאשר משתמשים צריכים רק לחלץ טקסט מקטע מסוים. בנוסף, הספרייה מספקת שיטות להשגת פלט HOCR (HTML OCR), הכולל לא רק את הטקסט המוכר אלא גם מידע על הפריסה והקואורדינטות של רכיבי הטקסט. פלט HOCR מועיל כאשר אתה זקוק לנתונים פרטניים יותר או רוצה לבצע ניתוח נוסף על מבנה הטקסט.

כיצד לבצע hOCR על תמונה באמצעות Ruby Library?

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

puts e.hocr_for('test/first.png')