Библиотека Go с открытым исходным кодом для преобразования файлов Microsoft® Word Processing
Преобразование документов Microsoft Word Processing в обычный текст с помощью бесплатного API GO
Что такое Доккон?
Часто при работе с документами Microsoft Word Processing разработчикам требуется текст документа в обычном формате. Иногда они обрабатывают текст или просто отображают его в другом формате. Бесплатный API Docconv с открытым исходным кодом позволяет разработчикам GO извлекать текст из DOC и DOCX в обычном формате.
Библиотека полностью разработана в GO, но имеет некоторые зависимости для правильной работы. API требует tidy, wv, popplerutils и unrtf JustText.
Начало работы с DocCon
Рекомендуемый способ внедрения Docconv в ваш проект — использование GitHub. Пожалуйста, используйте следующую команду для плавной установки.
Установите Docconv через GitHub
$ go get code.sajari.com/docconv/...
Конвертируйте DOCX в обычный текст через Free Go API
Библиотека с открытым исходным кодом Docconv позволяет программистам преобразовывать DOCX в обычный текст внутри своих собственных приложений Go. Чтобы преобразовать ваш DOCX в обычный текст, вам просто нужно загрузить документ и преобразовать его с помощью метода occonv.ConvertPath(). Используя следующие строки кода, вы можете легко преобразовать DOCX в обычный текст.
Преобразование обработки текста в текст в GO
- Создать нового клиента
- Преобразование DOCX в текст с помощью client.ConvertPath() и передача пути к файлу в качестве параметра
- Проверить на ошибки
- Печатать обычный текст
Преобразование DOCX в текст с помощью бесплатного API GO
// create a new client
c := client.New()
// convert DOCX to Text
res, err := client.ConvertPath(c, "fileformat.docx")
if err != nil {
log.Fatal(err)
}
// print output
fmt.Println(res)