Luo yksinkertaista ja puhdasta HTML-koodia Microsoft® Word Docsista Mammothilla

Muunna Word semanttisesti HTML-muotoon murehtimatta sisällön pyyhkiytymisestä.

Mikä on Mammoth?

Mammoth on helppokäyttöinen, yksinkertainen ja vaivaton paketti, jolla voidaan muuntaa Google Docsista, Microsoft Wordista ja LibreOfficesta luodut Word-asiakirjat HTML:ksi. Avoimen lähdekoodin Doc-HTML-muuntimena Mammoth on kätevä muuntaa minkä tahansa asiakirjan semanttisesti keskittymättä käytettyyn tyyliin, väreihin tai fontteihin.

Mammoth tarjoaa web-demoja nähdäkseen kuinka se muuntaa asiakirjat HTML:ksi, mutta yksi tämän Doc-muuntimen HTML-muotoon parhaista ominaisuuksista on monet sen tukemat alustat, mukaan lukien WordPress, Java/JVM, .NET ja Python PyPI:n kautta. Jos sinulla on monimutkaisia asiakirjoja, jotka on luotu useilla tyyleillä ja väriominaisuuksilla, saattaa olla mahdollista löytää ristiriita lopputuloksen ja syöttötiedoston välillä.

Siitä huolimatta, yksinkertaisissa Word-asiakirjoissa, jotka on muutettava HTML-muotoon, Mammoth tekee työnsä.

Previous Next

Mammothin käytön aloittaminen

Suositeltu tapa asentaa Mammoth-kirjasto on npm:n kautta. Käytä seuraavaa komentoa sujuvaan asennukseen

Asenna Mammoth npm:n kautta

 npm install mammoth 

Muunna Microsoft® Word HTML-muotoon ilmaisen JavaScript-sovellusliittymän avulla

Mommoth on avoimen lähdekoodin JavaScript-sovellusliittymä, joka muuntaa Wordin HTML:ksi ilmaiseksi. Se tarjoaa monia ominaisuuksia Word-asiakirjojen muotoiluun ja muokkaamiseen, kun ne on muutettu HTML-muotoon, kuten otsikoiden, luetteloiden ja kuvien lisääminen, kursivoitu ja lihavoitu fontti, rivinvaihtojen lisääminen ja paljon muuta. Kaikki Wordin doc:n kuvat luodaan oletusarvoisesti HTML-tuloksessa. Voit myös poimia raakatekstiä mistä tahansa asiakirjasta käyttämällä mammoth.extractRawText-funktiota, mutta se jättää huomioimatta alkuperäisen asiakirjan muotoilun.

Muunna olemassa oleva .docx-tiedosto HTML-muotoon

var mammoth = require("mammoth");
mammoth.convertToHtml({path: "path/to/document.docx"})
  .then(function(result){
    var html = result.value; // The generated HTML
    var messages = result.messages; // Any messages, such as warnings during conversion
  })
  .done(); 

Kartoita tyylit Wordista HTML:ään JavaScript API:n kautta

Suurimmaksi osaksi Mammoth kartoittaa yleisiä Microsoft Word DOCX -tyylejä alkuperäisestä Word-asiakirjasta HTML-lopputulokseen. Elementit, kuten Otsikko 1 Wordissa, muunnetaan H1:ksi HTML:ssä. Mammoth tarjoaa kuitenkin monia toimintoja tyylien muuntamiseen Word doc -tiedostosta HTML:ksi.

Mukautettu tyylikartta

var mammoth = require("mammoth");
var options = {
  styleMap: [
    "p[style-name='Section Title'] => h1:fresh",
    "p[style-name='Subsection Title'] => h2:fresh"
  ]
};
mammoth.convertToHtml({path: "path/to/document.docx"}, options);
 Suomen