Open Source Go Library להמרת קבצי עיבוד תמלילים של Microsoft®
המר מסמכי עיבוד תמלילים של מיקרוסופט לטקסט רגיל באמצעות GO API בחינם
מה זה Docconv?
לעתים קרובות, תוך כדי עבודה עם מסמכי עיבוד תמלילים של Microsoft, המפתחים צריכים את טקסט המסמך בפורמט רגיל. לפעמים, הם מעבדים את הטקסט או פשוט מציגים אותו בפורמט אחר. ה-API Docconv בקוד פתוח וחינמי מאפשר למפתחי GO לחלץ טקסט מ-DOC ו-DOCX בפורמט רגיל.
הספרייה פותחה לחלוטין ב-GO אך יש לה כמה תלות לפעול כראוי. ממשק ה-API דורש JustText orden, wv, poplerutils ו-unrtf
תחילת העבודה עם Docconv
הדרך המומלצת של Docconv להיכנס לפרויקט שלך היא באמצעות GitHub. אנא השתמש בפקודה הבאה להתקנה חלקה.
התקן את Docconv דרך GitHub
$ go get code.sajari.com/docconv/...
המר DOCX לטקסט רגיל באמצעות Free Go API
ספריית הקוד הפתוח Docconv מאפשרת למתכנתי מחשבים להמיר DOCX לטקסט רגיל בתוך יישומי Go משלהם. על מנת להמיר את ה-DOCX שלך לטקסט רגיל, אתה רק צריך לטעון את המסמך שלך ולהמיר אותו בשיטת occonv.ConvertPath(). על ידי שימוש בשורות הקוד הבאות, אתה יכול בקלות להמיר DOCX לטקסט פשוט.
המרת עיבוד תמלילים לטקסט ב-GO
- צור לקוח חדש
- המר DOCX לטקסט באמצעות client.ConvertPath() והעביר את נתיב הקובץ כפרמטר
- בדוק אם יש שגיאות
- הדפס טקסט רגיל
המר DOCX לטקסט באמצעות GO API בחינם
// create a new client
c := client.New()
// convert DOCX to Text
res, err := client.ConvertPath(c, "fileformat.docx")
if err != nil {
log.Fatal(err)
}
// print output
fmt.Println(res)