مكتبة روبي مفتوحة المصدر لتحويل الصور إلى نص عبر الإنترنت
تتيح مكتبة Ruby المجانية للتعرف البصري على الأحرف (OCR) لمطوري البرامج تحميل وقراءة وتحويل الصور أو ملفات PDF أو المستندات الممسوحة ضوئيًا إلى نص أو مستندات قابلة للبحث
حققت تقنية التعرف الضوئي على الحروف (OCR) تطورات كبيرة في السنوات الأخيرة، مما جعل من السهل أتمتة عملية استخراج البيانات من مصادر مختلفة. فهو يتيح التشغيل الآلي ويحسن إمكانية الوصول إلى البيانات ويعزز الإنتاجية في مختلف المجالات. إحدى هذه الأدوات القوية هي مكتبة OcrSpace Ruby، التي توفر للمطورين حلاً مباشرًا لدمج إمكانات التعرف الضوئي على الحروف في تطبيقات Ruby الخاصة بهم. تعمل هذه المكتبة على تبسيط عملية استخراج النص من الصور والمستندات الممسوحة ضوئيًا وملفات PDF، مما يجعلها خيارًا ممتازًا للمطورين الذين يبحثون عن حل مناسب للتعرف الضوئي على الحروف.
توفر مكتبة OcrSpace Ruby واجهة واضحة وبديهية، مما يجعل من السهل دمج إمكانات التعرف الضوئي على الحروف في تطبيقات Ruby. هناك عدة ميزات مهمة جزء من المكتبة، مثل تحميل أنواع مختلفة من الصور، واستخراج النص من الصور، وتحويل المستندات الممسوحة ضوئيًا إلى نص، واستخراج النص من المستندات المكتوبة بلغات متعددة، والتعرف على النص من الصور منخفضة الدقة، والعمل مع المحتوى المكتوب بخط اليد واسترجاع إحداثيات النص الذي تم التعرف عليه، واكتشاف أرقام الصفحات، وتحديد مجالات الاهتمام المحددة، وغير ذلك الكثير.
مكتبة OcrSpace Ruby عبارة عن غلاف حول Ocr.Space OCR API، والذي يوفر استخراجًا موثوقًا ودقيقًا للنص من الصور ومستندات PDF. تم تصميم هذه المكتبة خصيصًا لمطوري Ruby، وهي تعمل على تبسيط عملية التكامل، مما يسمح للمبرمجين بدمج وظائف التعرف الضوئي على الحروف بسرعة في تطبيقاتهم دون التعامل مع تعقيدات واجهة برمجة التطبيقات الأساسية. سواء كنت تقوم بإنشاء نظام لإدارة المستندات، أو أتمتة استخراج البيانات، أو تحسين إمكانية الوصول، فإن مكتبة OcrSpace Ruby هي أداة لا تقدر بثمن تعمل على تبسيط عملية التعرف الضوئي على الحروف وتمكين تطبيقاتك من خلال إمكانات استخراج النص الدقيقة.
البدء مع OcrSpace
الطريقة الموصى بها لتثبيت OcrSpace هي استخدام Rubygems. الرجاء استخدام الأمر التالي للتثبيت السلس.
قم بتثبيت OcrSpace عبر Rubygems
$ gem install ocr_space
يمكنك تنزيل المكتبة المشتركة المجمعة من مستودع Github.
تحويل الصور من URL إلى نص عبر Ruby API
تتضمن مكتبة OcrSpace مفتوحة المصدر بعض الميزات القوية لتحميل أنواع مختلفة من الصور وتحويلها إلى نص باستخدام سطرين من كود Ruby. تدعم المكتبة خيارات التعرف الضوئي على الحروف (OCR) المتنوعة، بما في ذلك استخراج النص من الصور والمستندات الممسوحة ضوئيًا وملفات PDF. سواء كان مطورو البرامج بحاجة إلى معالجة الفواتير أو الإيصالات أو أي نوع آخر من المستندات، يمكن لمكتبة OcrSpace Ruby التعامل معها بكفاءة. يوضح المثال التالي كيف يمكن لمطوري البرامج تحويل الصور إلى نص عبر عنوان URL باستخدام Ruby API.
تحويل الصور من URL عبر Ruby API
result = resource.convert url: "http://bit.ly/2ih9aXt"
puts result
=> #[{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}]
result = resource.clean_convert url: "http://bit.ly/2ih9aXt"
puts result
=> #If you want to find the secrets of the universe, think in terms of energy, frequency and vibration. AZ QUOTES
قدرات التعرف الضوئي على الحروف المتقدمة عبر Ruby API
تتضمن مكتبة OcrSpace مفتوحة المصدر بعض الميزات المفيدة جدًا والمتقدمة للتعامل مع عمليات التعرف الضوئي على الحروف داخل تطبيقات Ruby. يمكنه التعرف بدقة على النص من الصور منخفضة الدقة والنص المشوه وحتى المحتوى المكتوب بخط اليد، مما يضمن نتائج موثوقة عبر سيناريوهات مختلفة. وبصرف النظر عن استخراج النص، تتيح المكتبة أيضًا للمطورين استخراج معلومات مهمة أخرى من المستندات. يتضمن ذلك استرداد إحداثيات النص الذي تم التعرف عليه، واكتشاف أرقام الصفحات، وتحديد مجالات الاهتمام المحددة داخل المستند.
كيفية استخراج النص من ملف تم تحميله عبر Ruby API؟
result = resource.convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"
puts result #Raw result
=> #{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}
result = resource.clean_convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"
puts result