Bibliothèque Go Open Source pour la conversion de fichiers de traitement de texte Microsoft®

Convertir des documents de traitement de texte Microsoft en texte brut via l'API GO gratuite 

Qu'est-ce que Docconv ?

Souvent, lorsqu'ils travaillent avec des documents Microsoft Word Processing, les développeurs ont besoin du texte du document au format brut. Parfois, ils traitent le texte ou l'affichent simplement dans un format différent. L'API open-source et gratuite Docconv permet aux développeurs GO d'extraire du texte de DOC et DOCX au format brut.

La bibliothèque est entièrement développée en GO mais a quelques dépendances pour fonctionner correctement. L'API nécessite tidy, wv, popplerutils et unrtf JustText

Previous Next

Premiers pas avec Docconv

La méthode recommandée pour Docconv dans votre projet consiste à utiliser GitHub. Veuillez utiliser la commande suivante pour une installation fluide.

Installer Docconv via GitHub

$ go get code.sajari.com/docconv/...
                        

Convertir DOCX en texte brut via l'API Free Go

La bibliothèque open source Docconv permet aux programmeurs informatiques de convertir DOCX en texte brut dans leurs propres applications Go. Pour convertir votre DOCX en texte brut, il vous suffit de charger votre document et de le convertir à l'aide de la méthode occonv.ConvertPath(). En utilisant les lignes de code suivantes, vous pouvez facilement convertir DOCX en texte brut.

Convertir le traitement de texte en texte dans GO

  1. Créer un nouveau client
  2. Convertissez DOCX en texte à l'aide de client.ConvertPath() et passez le chemin du fichier en tant que paramètre
  3. Vérifier les erreurs
  4. Imprimer du texte brut

Convertir DOCX en texte via l'API GO gratuite

// create a new client
c := client.New()
// convert DOCX to Text
res, err := client.ConvertPath(c, "fileformat.docx")
if err != nil {
    log.Fatal(err)
}
// print output
fmt.Println(res)
                        
 Français