Microsoft® ワード プロセッシング ファイルを変換するためのオープン ソース Go ライブラリ

無料の GO API を使用して Microsoft ワープロ ドキュメントをプレーン テキストに変換する 

ドコンブとは?

多くの場合、開発者は Microsoft ワープロ ドキュメントで作業しているときに、プレーン フォーマットのドキュメント テキストを必要とします。場合によっては、テキストを処理したり、別の形式で表示したりすることもあります。オープンソースで無料の API Docconv を使用すると、GO 開発者は DOC および DOCX からプレーン形式でテキストを抽出できます。

ライブラリは完全に GO で開発されていますが、正しく動作するためにいくつかの依存関係があります。 API には、tidy、wv、popplerutils、および unrtf JustText が必要です

Previous Next

Docconv の使用を開始する

プロジェクトへの Docconv の推奨される方法は、GitHub を使用することです。スムーズなインストールのために、次のコマンドを使用してください。

GitHub 経由で Docconv をインストールする

$ go get code.sajari.com/docconv/...
                        

Free Go API を介して DOCX をプレーン テキストに変換する

オープン ソース ライブラリ Docconv を使用すると、コンピューター プログラマーは、独自の Go アプリケーション内で DOCX をプレーン テキストに変換できます。 DOCX をプレーン テキストに変換するには、ドキュメントを読み込んで occonv.ConvertPath() メソッドを使用して変換するだけです。次のコード行を使用すると、DOCX をプレーン テキストに簡単に変換できます。

GO でワード プロセッシングをテキストに変換する

  1. 新しいクライアントを作成する
  2. client.ConvertPath() を使用して DOCX をテキストに変換し、ファイル パスをパラメータとして渡します
  3. エラーをチェックする
  4. プレーンテキストを印刷する

無料の GO API を介して DOCX をテキストに変換する

// create a new client
c := client.New()
// convert DOCX to Text
res, err := client.ConvertPath(c, "fileformat.docx")
if err != nil {
    log.Fatal(err)
}
// print output
fmt.Println(res)
                        
 日本