1. Táirgí
  2.   PDF
  3.   PHP
  4.   PDFParser
 
  

Leabharlann PHP Foinse Oscailte chun Comhaid PDF a Pharsáil

Ligeann API PHP saor in aisce d’fhorbróirí Comhaid PDF a Pharsáil, Sonraí & Eilimintí a Bhaint as PDF.

Is Leabharlann PHP foinse Oscailte é PDFParser a ligeann d’fhorbróirí bogearraí comhaid PDF a pharsáil agus eilimintí PDF a bhaint taobh istigh dá bhfeidhmchláir PHP féin. Tá PDFParser tógtha ar bharr parsálaí TCPDF. Is leabharlann PHP neamhspleách é PDFParser a sholáthraíonn uirlisí éagsúla chun sonraí a bhaint as comhad PDF.

Tá Formáid Doiciméad Iniompartha (PDF) ar cheann de na formáidí doiciméad is fearr ar domhan agus tá an-tóir uirthi go fóill. Tacaíonn an API le roinnt gnéithe tábhachtacha do pharsáil PDF, mar shampla rudaí agus ceanntásca PDF a luchtú agus a pharsáil, meiteashonraí a bhaint, téacs a bhaint as leathanaigh ordaithe, tacaíocht PDF comhbhrúite, tacaíocht ionchódaithe ábhar Hexa agus octal, agus go leor eile.

.

Previous Next

Tús a chur le PDFParser

Déanfar leabharlann PDFParser a íoslódáil go huathoibríoch tríd an líne ordaithe composer. Cuir PDFParser le do chomhad composer.json.

Cuir  ordú le composer.json

 { 
  "require": {
  "smalot/pdfparser": "*"
  } 
 } 

Úsáid an cumadóir chun an beart a íoslódáil tríd an ordú a rith:

Parsáil Comhad PDF & Sliocht Téacs ó Gach Leathanach trí PHP API

Soláthraíonn PDFParser an fheidhmiúlacht a chuireann ar chumas ríomhchláraitheoirí ríomhairí doiciméid PDF a pharsáil laistigh dá bhfeidhmchlár PHP féin. Ar dtús, ní mór duit rudaí riachtanacha a thógáil agus an comhad PDF a luchtú, is féidir an comhad parsáilte a stóráil ar athróg agus ansin ligfidh an réad seo duit an PDF a láimhseáil leathanach de réir leathanaigh. Anois is féidir leat téacs a bhaint go héasca as an PDF iomlán nó ar leithligh de réir leathanaigh. Nuair a bheidh an doiciméad parsáilte anois is féidir leat téacs a bhaint go héasca as gach leathanach den PDF.

Parsáil Comhad PDF trí PHP

  // Include Composer autoloader if not already done.
  include 'vendor/autoload.php';
  // Parse Base64 encoded PDF string and build necessary objects.
  $parser = new \Smalot\PdfParser\Parser();
  $pdf  = $parser->parseContent(base64_decode($base64PDF));
  $text = $pdf->getText();
  echo $text;

Sliocht Meiteashonraí ó Dhoiciméad PDF

Metadata includes very important information about the PDF document and its contents such as Author, copyright information, creator, Creation Date and more. PDFParser gives developers the power to extract metadata from a PDF document. Once the document is parsed you can easily retrieve all details from the PDF file.

Sliocht Meiteashonraí ó PDF trí PHP API

  // Metadata Extraction from PDF 
  $metaData = $pdf->getDetails();
  Array
  (
   [Producer] => Adobe Acrobat
   [CreatedOn] => 2022-01-28T16:36:11+00:00
   [Pages] => 35
  )

Sliocht Téacs ó Leathanach Sonrach PDF

Ligeann PDFParser d’fhorbróirí téacs a bhaint as leathanaigh ar leith gan stró trí úsáid a bhaint as méid beag cód. Tugann an API an cumas d’fhorbróirí gach leathanach den doiciméad PDF a láimhseáil ar leithligh. Is féidir le forbróirí atriall a dhéanamh tríd an raon leathan leathanach agus is féidir leo téacs a aisghabháil ón leathanach a roghnaíonn siad. Tá ord an eagar mar an gcéanna leis an doiciméad PDF.

Sliocht téacs ó pdf trí php

  // Extract Text from PDF via PHP
  $text = $pdf->getText();
  // or extract the text of a specific page (in this case the first page)
  $text = $pdf->getPages()[0]->getText();
 Gaeilge