Δημιουργήστε απλό και καθαρό HTML από το Microsoft® Word Docs με το Mammoth

Μετατρέψτε σημασιολογικά το Word σε HTML χωρίς να ανησυχείτε για τη διαγραφή του περιεχομένου.

Τι είναι το Μαμούθ;

Το Mammoth είναι ένα εύχρηστο, απλό, χωρίς φασαρία πακέτο που μπορεί να χρησιμοποιηθεί για τη μετατροπή εγγράφων του Word που δημιουργούνται από τα Έγγραφα Google, το Microsoft Word και το LibreOffice σε HTML. Ως μετατροπέας Doc σε HTML ανοιχτού κώδικα, το Mammoth είναι χρήσιμο για τη σημασιολογική μετατροπή οποιουδήποτε εγγράφου χωρίς να εστιάζει στο στυλ, το χρώμα ή τις γραμματοσειρές που χρησιμοποιούνται.

Η Mammoth παρέχει επιδείξεις ιστού για να δει πώς θα μετατρέψει τα έγγραφα σε HTML, ωστόσο, ένα από τα καλύτερα χαρακτηριστικά αυτού του μετατροπέα εγγράφων σε HTML είναι οι πολλές πλατφόρμες που υποστηρίζει, συμπεριλαμβανομένων των WordPress, Java/JVM, .NET και Python μέσω PyPI. Εάν έχετε δημιουργήσει περίπλοκα έγγραφα με πολλά στυλ και χαρακτηριστικά χρώματος, ίσως είναι δυνατό να βρείτε μια αναντιστοιχία μεταξύ του τελικού αποτελέσματος και του αρχείου εισόδου.

Ανεξάρτητα, για απλά έγγραφα του Word που πρέπει να μετατραπούν σε HTML, το Mammoth κάνει τη δουλειά.

Previous Next

Ξεκινώντας με το Mammoth

Ο προτεινόμενος τρόπος εγκατάστασης της βιβλιοθήκης Mammoth είναι μέσω npm. Χρησιμοποιήστε την ακόλουθη εντολή για ομαλή εγκατάσταση

Εγκαταστήστε το Mammoth μέσω npm

 npm install mammoth 

Μετατρέψτε το Microsoft® Word σε HTML μέσω του Free JavaScript API

Το Mommoth είναι ένα ανοιχτού κώδικα JavaScript API για δωρεάν μετατροπή του Word σε HTML. Παρέχει πολλές δυνατότητες για τη μορφοποίηση και την επεξεργασία εγγράφων του Word όταν έχουν μετατραπεί σε HTML, όπως προσθήκη επικεφαλίδων, λιστών και εικόνων, πλάγια γραφή και έντονη γραμματοσειρά, προσθήκη αλλαγών γραμμής και πολλά άλλα. Όλες οι εικόνες στη λέξη doc δημιουργούνται στο αποτέλεσμα HTML από προεπιλογή. Μπορείτε επίσης να εξαγάγετε ακατέργαστο κείμενο από οποιοδήποτε έγγραφο χρησιμοποιώντας τη συνάρτηση mammoth.extractRawText, ωστόσο, θα αγνοήσει τη μορφοποίηση από το αρχικό έγγραφο.

Μετατρέψτε ένα υπάρχον αρχείο .docx σε HTML

var mammoth = require("mammoth");
mammoth.convertToHtml({path: "path/to/document.docx"})
 .then(function(result){
  var html = result.value; // The generated HTML
  var messages = result.messages; // Any messages, such as warnings during conversion
 })
 .done(); 

Στυλ χάρτη από το Word σε HTML μέσω JavaScript API

Ως επί το πλείστον, η Mammoth αντιστοιχίζει κοινά στυλ DOCX του Microsoft Word από ένα πρωτότυπο έγγραφο του Word στο τελικό αποτέλεσμα HTML. Στοιχεία όπως η Επικεφαλίδα 1 στο Word μετατρέπονται σε H1 σε HTML. Ωστόσο, το Mammoth παρέχει πολλές λειτουργίες για τη μετατροπή στυλ από Word doc σε HTML.

Χάρτης προσαρμοσμένου στυλ

var mammoth = require("mammoth");
var options = {
 styleMap: [
  "p[style-name='Section Title'] => h1:fresh",
  "p[style-name='Subsection Title'] => h2:fresh"
 ]
};
mammoth.convertToHtml({path: "path/to/document.docx"}, options);
 Ελληνικά