PDFTextStream

Sagteware kiekie:
PDFTextStream
Sagteware besonderhede:
Weergawe: 2.6.0
Upload datum: 20 Feb 15
Lisensie: Shareware
Prys: 1900.00 $
Populariteit: 2

Rating: nan/5 (Total Votes: 0)

PDFTextStream projek is 'n PDF teks en metadata onttrekking biblioteek beskikbaar is vir Java, Python, en NET.
Dit ondersteun alle weergawes van die PDF dokument spesifikasie, (insluitend v1.6, wat gebruik word deur Acrobat 7), onttrekking van die teks geïnkripteer met behulp van double-byte karakter sets (insluitend Sjinees, Japannees, en Koreaans), dekripsie van 40-bit en 128- bietjie geïnkripteer dokumente, en onttrekking van alle dokument metadata wat deur PDF dokumente (insluitend vorm data, boekmerke, en notas).
Maklike integrasie met Jakarta Lucene is ingesluit

Wat is nuut in hierdie release:.

  • Hierdie weergawe sluit 'n verskeidenheid van fixes gemaak om te verseker PDFTextStream in staat is om te onttrek teks uit PDF-dokumente wat Afwykende die PDF spesifikasie.
  • Dit sluit ook 'n verskeidenheid van prestasie verbeteringe.

Wat is nuut in die weergawe 2.3.0:

  • Bygevoeg 'n .isStruckThrough () metode om com. snowtide.pdf.TextUnit, wat aandui of 'n karakter het 'n deurstreep daaroor getrek.
  • Verbeterde PDFTextStream se ondersteuning vir die ingeboude karakter afbeeldings.
  • Die berekening van witspasie tussen woorde is vasgestel om behoorlik rekenskap witspasie wat uitdruklik in die bron PDF dokumente ingebou.
  • Verbeterde PDFTextStream se hantering van saamgestelde inhoud coderingen, wat voorheen kan misluk as gevolg in sommige wissel van PDF inhoud word 'geïgnoreer "tydens die ekstraksie.
  • Vaste 'n fout in VisualOutputTarget waar teks van 'n enkele lyn sou verdeel word oor verskeie lyne
  • Verbeterde vertikale belyning van die teks onttrek met behulp VisualOutputTarget
  • Verbeter VisualOutputTarget-geproduseer uittreksels onwaar bykomende witspasie tussen nou-aangrensende woorde te skakel

Wat is nuut in die weergawe 2.2.5:

  • Hierdie vrystelling voeg ondersteuning vir die wen xfa vorms data as XML.
  • Dit aansienlik verbeter die prestasie van die teks onttrekking behulp VisualOutputTarget. Ondersteuning vir PDF-dokumente groter as 2GB.
  • 'n oplossing vir 'n fout waar die enkoderings van ingebed Type1 fonts was voorheen nie behoorlik toegepas word in sekere omstandighede.
  • 'n oplossing vir 'n probleem waar nuwe inhoud in opgedateer PDF dokumente is soms geïgnoreer word.
  • 'n oplossing vir 'n probleem waar PDFDocEncoding-geënkodeerde boekmerke en metadata is nie behoorlik ontsyfer.
  • 'n .getDestinationName () metode in com.snowtide.pdf.Bookmark.

Vereistes :

  • Apache Lucene

Kommentaar te PDFTextStream

Kommentaar nie gevind
Kommentaar te lewer
Draai op die foto!