Cruthaigh HTML simplí agus glan ó Microsoft® Word Docs le Mammoth
Tiontaigh Word go HTML go semantach gan a bheith buartha faoin ábhar atá á scriosadh.
Cad é Mammoth?
Is pacáiste éasca le húsáid, simplí, gan stró é Mammoth is féidir a úsáid chun doiciméid Word a ghintear ó Google Docs, Microsoft Word agus LibreOffice a thiontú go HTML. Mar thiontaire foinse oscailte Doc go HTML, bíonn Mammoth áisiúil chun aon doiciméad a thiontú go séimeantach gan díriú ar an stíl, ar an dath nó ar na clónna a úsáidtear.
Soláthraíonn Mammoth taispeántais gréasáin chun féachaint conas a thiontóidh sé docs go HTML, áfach, is é ceann de na gnéithe is fearr den tiontaire Doc seo go HTML ná an iliomad ardán a thacaíonn sé lena n-áirítear WordPress, Java/JVM, .NET, agus Python trí PyPI. Má tá doiciméid chasta cruthaithe agat le go leor stíleanna agus gnéithe datha, d’fhéadfadh go mbeifí in ann teacht ar neamhréir idir an toradh deiridh agus an comhad ionchuir.
Is cuma, maidir le doiciméid Word simplí ar gá iad a thiontú go HTML, faigheann Mammoth an post.
Tús a chur le Mammoth
Is é an bealach molta chun leabharlann Mammoth a shuiteáil ná trí npm. Bain úsáid as an ordú seo a leanas le haghaidh suiteáil rianúil
Suiteáil Mammoth trí npm
npm install mammoth
Tiontaigh Microsoft ® Word go HTML trí Free JavaScript API
Is API foinse oscailte JavaScript é Mommoth chun Word a thiontú go HTML saor in aisce. Soláthraíonn sé go leor gnéithe chun doiciméid Word a fhormáidiú agus a chur in eagar nuair a bhíonn siad tiontaithe go HTML, mar shampla Ceannteidil, Liostaí, agus íomhánna a chur leis, Cló iodálach agus cló trom, sosanna líne a chur leis, agus go leor eile. Gintear gach íomhá sa doiciméad focal sa toradh HTML de réir réamhshocraithe. Is féidir leat téacs amh a bhaint as aon doiciméad freisin trí úsáid a bhaint as an bhfeidhm mammoth.extractRawText, áfach, déanfaidh sé neamhaird ar fhormáidiú an bhundoiciméid.
Comhad .docx atá ann cheana a thiontú go HTML
var mammoth = require("mammoth");
mammoth.convertToHtml({path: "path/to/document.docx"})
.then(function(result){
var html = result.value; // The generated HTML
var messages = result.messages; // Any messages, such as warnings during conversion
})
.done();
Stíleanna Léarscáil ó Word go HTML trí JavaScript API
Don chuid is mó, mapálann Mammoth stíleanna coitianta Microsoft Word DOCX ó bhundhoiciméad Word isteach sa toradh deiridh HTML. Déantar gnéithe cosúil le Ceannteideal 1 i Word a thiontú go H1 in HTML. Mar sin féin, soláthraíonn Mammoth go leor feidhmeanna chun stíleanna a thiontú ó Word doc go HTML.
Léarscáil Stíl Chustaim
var mammoth = require("mammoth");
var options = {
styleMap: [
"p[style-name='Section Title'] => h1:fresh",
"p[style-name='Subsection Title'] => h2:fresh"
]
};
mammoth.convertToHtml({path: "path/to/document.docx"}, options);