Библиотека Go с открытым исходным кодом для преобразования файлов Microsoft® Word Processing

Преобразование документов Microsoft Word Processing в обычный текст с помощью бесплатного API GO 

Что такое Доккон?

Часто при работе с документами Microsoft Word Processing разработчикам требуется текст документа в обычном формате. Иногда они обрабатывают текст или просто отображают его в другом формате. Бесплатный API Docconv с открытым исходным кодом позволяет разработчикам GO извлекать текст из DOC и DOCX в обычном формате.

Библиотека полностью разработана в GO, но имеет некоторые зависимости для правильной работы. API требует tidy, wv, popplerutils и unrtf JustText.

Previous Next

Начало работы с DocCon

Рекомендуемый способ внедрения Docconv в ваш проект — использование GitHub. Пожалуйста, используйте следующую команду для плавной установки.

Установите Docconv через GitHub

$ go get code.sajari.com/docconv/...
                        

Конвертируйте DOCX в обычный текст через Free Go API

Библиотека с открытым исходным кодом Docconv позволяет программистам преобразовывать DOCX в обычный текст внутри своих собственных приложений Go. Чтобы преобразовать ваш DOCX в обычный текст, вам просто нужно загрузить документ и преобразовать его с помощью метода occonv.ConvertPath(). Используя следующие строки кода, вы можете легко преобразовать DOCX в обычный текст.

Преобразование обработки текста в текст в GO

  1. Создать нового клиента
  2. Преобразование DOCX в текст с помощью client.ConvertPath() и передача пути к файлу в качестве параметра
  3. Проверить на ошибки
  4. Печатать обычный текст

Преобразование DOCX в текст с помощью бесплатного API GO

// create a new client
c := client.New()
// convert DOCX to Text
res, err := client.ConvertPath(c, "fileformat.docx")
if err != nil {
    log.Fatal(err)
}
// print output
fmt.Println(res)
                        
 Русский