ספריית רובי בקוד פתוח להמרת תמונות לטקסט באינטרנט
ספריית Ruby Optical Character Recognition בחינם (OCR) מאפשרת למפתחי תוכנה לטעון, לקרוא ולהמיר תמונות, קובצי PDF או מסמכים סרוקים לטקסט או למסמכים הניתנים לחיפוש
טכנולוגיית זיהוי תווים אופטי (OCR) עשתה התקדמות משמעותית בשנים האחרונות, והקלה על אוטומציה של חילוץ נתונים ממקורות שונים. הוא מאפשר אוטומציה, משפר את נגישות הנתונים ומשפר את הפרודוקטיביות בתחומים שונים. כלי רב עוצמה אחד כזה הוא ספריית OcrSpace Ruby, המספקת למפתחים פתרון פשוט לשילוב יכולות OCR באפליקציות Ruby שלהם. ספרייה זו מפשטת את תהליך חילוץ הטקסט מתמונות, מסמכים סרוקים וקובצי PDF, מה שהופך אותה לבחירה מצוינת עבור מפתחים המחפשים פתרון OCR נוח.
ספריית OcrSpace Ruby מציעה ממשק פשוט ואינטואיטיבי, המקל על שילוב יכולות OCR ביישומי Ruby. ישנם מספר מאפיינים חשובים של הספרייה, כגון טעינת סוגים שונים של תמונות, חילוץ טקסט מתמונות, המרת מסמכים סרוקים לטקסט, חילוץ טקסט ממסמכים שנכתבו במספר שפות, זיהוי טקסט מתמונות ברזולוציה נמוכה, עבודה עם תוכן בכתב יד , אחזור קואורדינטות של הטקסט המזוהה, זיהוי מספרי עמודים, זיהוי תחומי עניין ספציפיים ועוד רבים נוספים.
ספריית OcrSpace Ruby היא מעטפת סביב ה-API של Ocr.Space OCR, אשר מציעה חילוץ טקסט אמין ומדויק מתמונות ומסמכי PDF. ספריה זו, שנבנתה במיוחד עבור מפתחי Ruby, מפשטת את תהליך האינטגרציה, ומאפשרת למתכנתים לשלב במהירות פונקציונליות OCR באפליקציות שלהם מבלי להתמודד עם המורכבות של ה-API הבסיסי. בין אם אתה בונה מערכת ניהול מסמכים, אוטומציה של חילוץ נתונים או שיפור הנגישות, ספריית OcrSpace Ruby היא כלי שלא יסולא בפז שמייעל את תהליך ה-OCR ומעצים את האפליקציות שלך עם יכולות חילוץ טקסט מדויקות.
תחילת העבודה עם OcrSpace
הדרך המומלצת להתקנת OcrSpace היא באמצעות Rubygems. אנא השתמש בפקודה הבאה להתקנה חלקה.
התקן את OcrSpace באמצעות Rubygems
$ gem install ocr_space
תוכל להוריד את הספרייה המשותפת שהורכבה ממאגר Github.
המר תמונות מכתובת אתר לטקסט באמצעות Ruby API
ספריית הקוד הפתוח OcrSpace כללה כמה תכונות עוצמתיות לטעינת סוגים שונים של תמונות ולהמרה לטקסט עם כמה שורות של קוד Ruby. הספרייה תומכת באפשרויות OCR שונות, כולל חילוץ טקסט מתמונות, מסמכים סרוקים וקבצי PDF. בין אם מפתחי תוכנה צריכים לעבד חשבוניות, קבלות או כל סוג אחר של מסמך, ספריית OcrSpace Ruby יכולה להתמודד עם זה ביעילות. הדוגמה הבאה מראה כיצד מפתחי תוכנה יכולים להמיר תמונות לטקסט באמצעות כתובת URL באמצעות Ruby API.
המר תמונות מ-URL באמצעות Ruby API
result = resource.convert url: "http://bit.ly/2ih9aXt"
puts result
=> #[{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}]
result = resource.clean_convert url: "http://bit.ly/2ih9aXt"
puts result
=> #If you want to find the secrets of the universe, think in terms of energy, frequency and vibration. AZ QUOTES
יכולות OCR מתקדמות באמצעות Ruby API
ספריית הקוד הפתוח OcrSpace כללה כמה תכונות שימושיות ומתקדמות מאוד לטיפול בפעולות OCR בתוך יישומי Ruby. זה יכול לזהות במדויק טקסט מתמונות ברזולוציה נמוכה, טקסט מעוות ואפילו תוכן בכתב יד, ומבטיח תוצאות אמינות בתרחישים שונים. מלבד חילוץ טקסט, הספרייה מאפשרת למפתחים גם לחלץ מידע חשוב אחר ממסמכים. זה כולל אחזור קואורדינטות של הטקסט המוכר, זיהוי מספרי עמודים וזיהוי אזורי עניין ספציפיים בתוך המסמך.
כיצד לחלץ טקסט מקובץ שהועלה באמצעות Ruby API?
result = resource.convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"
puts result #Raw result
=> #{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}
result = resource.clean_convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"
puts result