Microsoft® 워드 프로세싱 파일 변환을 위한 오픈 소스 Go 라이브러리
무료 GO API를 통해 Microsoft 워드 프로세싱 문서를 일반 텍스트로 변환
Docconv는 무엇입니까?
Microsoft 워드 프로세싱 문서로 작업하는 동안 개발자는 종종 일반 형식의 문서 텍스트가 필요합니다. 때로는 텍스트를 처리하거나 다른 형식으로 표시합니다. 오픈 소스 및 무료 API Docconv를 통해 GO 개발자는 DOC 및 DOCX에서 일반 형식으로 텍스트를 추출할 수 있습니다.
라이브러리는 GO에서 완전히 개발되었지만 제대로 작동하기 위한 몇 가지 종속성이 있습니다. API에는 Tidy, wv, popplerutils 및 unrtf JustText가 필요합니다.
Docconv 시작하기
Docconv를 프로젝트에 권장하는 방법은 GitHub를 사용하는 것입니다. 원활한 설치를 위해 다음 명령어를 사용해주세요.
GitHub를 통해 Docconv 설치
$ go get code.sajari.com/docconv/...
Free Go API를 통해 DOCX를 일반 텍스트로 변환
오픈 소스 라이브러리 Docconv를 사용하면 컴퓨터 프로그래머가 자신의 Go 애플리케이션 내에서 DOCX를 일반 텍스트로 변환할 수 있습니다. DOCX를 일반 텍스트로 변환하려면 문서를 로드하고 occonv.ConvertPath() 메서드를 사용하여 변환하기만 하면 됩니다. 다음 코드 줄을 사용하여 DOCX를 일반 텍스트로 쉽게 변환할 수 있습니다.
GO에서 워드 프로세싱을 텍스트로 변환
- 새 클라이언트 만들기
- client.ConvertPath()를 사용하여 DOCX를 텍스트로 변환하고 파일 경로를 매개변수로 전달
- 오류 확인
- 일반 텍스트 인쇄
무료 GO API를 통해 DOCX를 텍스트로 변환
// create a new client
c := client.New()
// convert DOCX to Text
res, err := client.ConvertPath(c, "fileformat.docx")
if err != nil {
log.Fatal(err)
}
// print output
fmt.Println(res)