ספריית רובי חינמית מתקדמת לטעינה ולחילוץ טקסט מתמונות
קוד פתוח מוביל Ruby OCR API וממיר תמונה לטקסט המאפשר למפתחי תוכנה לטעון, לזהות ולחלץ טקסט מתמונות (תמונות סרוקות וקבצי PDF)
זיהוי תווים אופטי (OCR) היא טכנולוגיה רבת עוצמה המאפשרת למחשבים לזהות ולחלץ טקסט מתמונות או מסמכים סרוקים. יש לו יישומים רבים, החל מדיגיטציה של חומרים מודפסים ועד לאוטומציה של תהליכי הזנת נתונים. בשפת התכנות Ruby, ספרייה פופולרית אחת עבור OCR היא Ruby-Tesseract-OCR. Ruby-Tesseract-OCR היא אבן חן רובי המשמשת כעטיפת למנוע Tesseract OCR. Tesseract הוא מנוע OCR בקוד פתוח שפותח על ידי Google והוא ידוע בזכות הדיוק שלו ובתמיכה בשפה.
Ruby-Tesseract-OCR חורג מיכולות OCR בסיסיות ומציע תכונות נוספות למקרי שימוש מתקדמים. לדוגמה, מפתחי תוכנה יכולים לציין אזור עניין (ROI) בתוך תמונה כדי להגביל את ניתוח ה-OCR לאזור ספציפי. זה שימושי במיוחד כאשר אתה מתמודד עם מסמכים מורכבים או כאשר אתה רק צריך לחלץ טקסט מקטע מסוים. הספרייה מספקת מספר תכונות נוספות לשיפור יכולות ה-OCR, כגון טעינת תמונה קיימת, חילוץ טקסט מתמונות או מסמכים סרוקים, השגת פלט HOCR (HTML OCR) ועוד רבים נוספים.
פנינת Ruby-Tesseract-OCR מספקת ממשק קל לשימוש לאינטראקציה עם מנוע Tesseract, המאפשר למפתחי Ruby לשלב יכולות OCR בפרויקטים שלהם ללא מאמץ. בין אם אתה צריך לחלץ מידע מחשבוניות, לבצע דיגיטציה של חומרים מודפסים או להפוך משימות הזנת נתונים לאוטומטיות, ספריית הקוד הפתוח מספקת פתרון אמין ויעיל. נסה את זה, וגלה את הפוטנציאל של OCR בפרויקטי Ruby שלך היום.
תחילת העבודה עם Ruby-Tesseract-OCR
הדרך המומלצת להתקנת Ruby-Tesseract-OCR היא באמצעות Rubygems. אנא השתמש בפקודה הבאה להתקנה חלקה.
התקן Ruby-Tesseract-OCR דרך Rubygems
gem install tesseract-ocr
תוכל להוריד את הספרייה המשותפת שהורכבה ממאגר Github.
חלץ טקסט מתמונות ומסמכים סרוקים באמצעות Ruby
Ruby-Tesseract-OCR היא ספריית קוד פתוח חזקה מאוד המאפשרת למפתחי תוכנה לטעון ולחלץ טקסט מסוגים שונים של תמונות עם כמה שורות של קוד Ruby בלבד. הספרייה מקלה על חילוץ טקסט מתמונות, PDFS או מסמכים סרוקים. זרימת העבודה הטיפוסית כוללת טעינת תמונה, הגדרת פרמטרי ה-OCR והפעלת מנוע ה-OCR כדי לזהות את הטקסט. לצורך פעולה מוצלחת מפתחים צריכים לספק את הנתיב לתמונה שהם רוצים לעבד ולקרוא לשיטת text_for כדי לחלץ את הטקסט. לבסוף, התוצאה תודפס לקונסולה. הספרייה מציעה אפשרויות Fconfiguration שונות לשליטה בהתנהגות OCR, כגון מצב פילוח עמודים, תווים ברשימת הלבנים ועוד. הדוגמאות הבאות מראות כיצד מפתחי תוכנה יכולים לטעון תמונת JPEG ולחלץ ממנה טקסט בתוך יישומי Ruby.
כיצד לחלץ טקסט מתמונות באמצעות פקודות רובי?
require 'tesseract'
e = Tesseract::Engine.new {|e|
e.language = :eng
e.blacklist = '|'
}
e.text_for('test/first.png').strip # => 'ABC'
חלץ טקסט מאזור תמונה מסוים באמצעות Ruby
ספריית הקוד הפתוח Ruby-Tesseract-OCR חורגת מיכולות OCR בסיסיות ומציעה תכונות נוספות למקרי שימוש מתקדמים. לדוגמה, משתמשים יכולים לציין אזור עניין (ROI) בתוך תמונה כדי להגביל את ניתוח ה-OCR לאזור ספציפי. זה שימושי במיוחד כאשר עוסקים במסמכים מורכבים או כאשר משתמשים צריכים רק לחלץ טקסט מקטע מסוים. בנוסף, הספרייה מספקת שיטות להשגת פלט HOCR (HTML OCR), הכולל לא רק את הטקסט המוכר אלא גם מידע על הפריסה והקואורדינטות של רכיבי הטקסט. פלט HOCR מועיל כאשר אתה זקוק לנתונים פרטניים יותר או רוצה לבצע ניתוח נוסף על מבנה הטקסט.
כיצד לבצע hOCR על תמונה באמצעות Ruby Library?
require 'tesseract'
e = Tesseract::Engine.new {|e|
e.language = :eng
e.blacklist = '|'
}
puts e.hocr_for('test/first.png')