lxml

Sagteware kiekie:
lxml
Sagteware besonderhede:
Weergawe: 3.4.4 Opgedateer
Upload datum: 12 May 15
Ontwikkelaar: infrae.com
Lisensie: Gratis
Populariteit: 245

Rating: 5.0/5 (Total Votes: 1)

lxml kombineer die spoed van die biblioteke met die eenvoud van die Python taal.
Nou

  • lxml.html.iterlinks: verenigbaar met alle CPython weergawes 2,4-3,2

    Wat is nuut in hierdie weergawe. terug skakels in meta verfris tags.

  • New XMLParser opsie collect_ids = False om ID hash tafel skepping te skakel. Dit kan aansienlik bespoedig parsing van dokumente met baie verskillende ID's wat nie gebruik word nie.
  • Die parser gebruik per-dokument hash tabelle vir XML-ID's. Dit verminder die las van die globale parser dict en versnel die ontleding van dokumente met baie verskillende ID.
  • ElementTree.getelementpath (element) gee terug 'n strukturele ElementPath uitdrukking vir die gegewe element, wat gebruik kan word vir soektogte later.
  • xmlfile () 'n nuwe argument close = True aanvaar te sluit lêer (-agtige) voorwerpe na die skryf van hulle. Voor, xmlfile () net gesluit die lêer as dit dit intern geopen het.
  • Laat & quot; bytearray & quot; tipe vir ASCII teks invoer.

Wat is nuut in weergawe 3.4.2:

  • lxml.html.iterlinks terug nou skakels in meta verfris tags.
  • New XMLParser opsie collect_ids = False om ID hash tafel skepping te skakel. Dit kan aansienlik bespoedig parsing van dokumente met baie verskillende ID's wat nie gebruik word nie.
  • Die parser gebruik per-dokument hash tabelle vir XML-ID's. Dit verminder die las van die globale parser dict en versnel die ontleding van dokumente met baie verskillende ID.
  • ElementTree.getelementpath (element) gee terug 'n strukturele ElementPath uitdrukking vir die gegewe element, wat gebruik kan word vir soektogte later.
  • xmlfile () 'n nuwe argument close = True aanvaar te sluit lêer (-agtige) voorwerpe na die skryf van hulle. Voor, xmlfile () net gesluit die lêer as dit dit intern geopen het.
  • Laat & quot; bytearray & quot; tipe vir ASCII teks invoer.

Wat is nuut in weergawe 3.3.2:

  • Die eienskappe resolvers en weergawe, sowel as die metodes set_element_class_lookup () en makeelement (), is verlore iterparse voorwerpe.
  • Gevalle van XMLSchema, Schematron en RelaxNG nie hul plaaslike error_log duidelik voor die loop van 'n bevestiging.
  • lxml.doctestcompare deurmekaar & quot; verwag & quot; en & quot; werklike & quot; in kenmerk waardes.

Wat is nuut in weergawe 3.3.1:

  • Bugs vasgestel:
  • HTML dokumente ontleed met parser.feed () versuim het om elemente tydens tag iterasie te vind.
  • Building in PyPy misluk weens ontbreek ondersteuning vir PyUnicode_Compare () en PyByteArray _ * () in PyPy se C-API.
  • Samestelling in MSVC misluk weens ontbreek & quot; stdint.h & quot; standaard header-lêer.
  • iterparse () versuim het om te ontleed BOM vooraan lêers.

Wat is nuut in weergawe 3.3.0:

  • Bugs vasgestel:
  • Die heuristiese lêer paaie onderskei van URLs is strenger minder vals negatiewe produseer.

Wat is nuut in weergawe 3.2.3:

  • Vaste ondersteuning vir Python 2,4 wat verlore in 3.2 0,2.

Wat is nuut in weergawe 3.2.1:

  • Die metodes apply_templates () en process_children () van XSLT uitbreiding elemente opgedoen twee nuwe boolean opsies elements_only en remove_blank_text dat weggooi nie alle stringe of witspasie net snare uit die lys gevolg.

Wat is nuut in weergawe 3.2.0:

  • Witruimte kan die gedrag van die string parsing verander funksies in lxml.html.
  • Die string ontleding van funksies in lxml.html meer robuuste in die aangesig van ongewoon HTML inhoud soos raam sets of ontbreek liggaam tags.
  • I / O foute terwyl hulle probeer om toegang tot lêers met paaie wat nie-ASCII karakters kon UnicodeDecodeError samel in plaas van behoorlik die aanmelding van die IO-fout.
  • Parsing van in-geheue snare gestremde toegang tot die netwerk in die standaard parser en het die daaropvolgende pogings om te ontleed uit 'n URL misluk.

Wat is nuut in weergawe 3.1.2:

  • slaag eienskappe deur die naamruimte-onbewus van die API sax brug (dws die handler.startElement () metode) het misluk met 'n TypeError.
  • Vaste serialisasie fout in XSLT uitset wanneer die omskakeling die resultaat boom 'n Unicode string.

Wat is nuut in weergawe 3.0.2:

  • Vaste crash in tolk afsluit deur te skakel na Cython 0,17 0,3 vir die bou.

Wat is nuut in weergawe 3.0:

  • C14N kan spesifiseer die inklusiewe voorvoegsels om bevorder te word Top vlak tydens eksklusiewe serialisasie.
  • Aanvanklike ondersteuning vir die bou in PyPy (deur cpyext).
  • DTD voorwerpe opgedoen het 'n API wat lees toegang toelaat om hul verklarings.
  • xpathgrep.py opgedoen ondersteuning vir die ontleding van lyn-vir-lyn (bv uit grep uitset) en rondom die uitset met 'n nuwe wortel tag.
  • E-fabriek in lxml.builder aanvaar subtipes van bekende tipes data (soos string subtipes) wanneer die bou-elemente rondom hulle.
  • Tree iterasie en iterparse () met 'n selektiewe tag argument ondersteun verby 'n stel van etikette. Tree nodes sal teruggestuur word deur die iterators as hulle enige van die tags te pas.

Wat is nuut in weergawe 2.3.5:

  • Crash wanneer die samesmelting teks nodes in element.remove ( ).
  • Crash in sax / teiken parser wanneer hulle leë DOCTYPE.

Wat is nuut in weergawe 2.3.4:

  • Crash wanneer die bou van 'n nsmap (Element eiendom) met leë naamruimte URI.
  • Crash as gevolg van ras toestand wanneer foute (of gebruiker boodskappe) tydens gestruktureerde XSLT verwerking.
  • XSLT style samestelling samestelling foute kan ignoreer nie.

Wat is nuut in weergawe 2.3.3:

  • funksies bygevoeg:
  • lxml.html.tostring () het nuwe serialisasie opsies with_tail en DOCTYPE.
  • Bugs vasgestel:
  • Vaste 'n crash wanneer iterparse () vir HTML parsing en versoek begin gebeure.
  • Vaste parsing meer keurders in cssselect. Witspasie voor pseudo-elemente en pseudo-klasse is betekenisvol, want dit is 'n afstammeling Combinator. & Quot; E: pseudo & quot; moet dieselfde ontleed as & quot; E *: & quot ;, pseudo nie & quot; E:. pseudo & quot;
  • lxml.html.diff nie meer verhoog 'n uitsondering wanneer 'img' tags slaan sonder 'src' kenmerk.

Wat is nuut in weergawe 2.3.2:

  • funksies bygevoeg:
  • lxml.objectify.deannotate () het 'n nuwe boolean opsie cleanup_namespaces die objektiveer naamruimte verklarings te verwyder (en in die algemeen skoon te maak die naamruimte verklarings) na die verwydering van die tipe notas.
  • lxml.objectify sy eie subelement () funksie opgedoen as 'n afskrif van 'n andersins etree.SubElement oortollige invoer van lxml.etree op die gebruiker kant te vermy.
  • Bugs vasgestel:
  • Vaste die & quot; afstammeling & quot; fout in cssselect 'n tweede keer (na 'n eerste fix in lxml 2.3.1). Die vorige verandering het gelei tot 'n ernstige prestasie regressie vir die XPath evaluering van die vertaalde uitdrukking. Let daarop dat dit breek die gebruik van 'n paar van die gegenereerde XPath uitdrukkings as XSLT plek paaie wat voorheen gewerk het in 2.3.1.
  • Vaste parsing van sommige keurders in cssselect. Witspasie na combinators & quot; & # x3e; & quot ;, & quot; + & quot; en & quot; ~ & quot; is nou korrek geïgnoreer. Voorheen is is ontleed as 'n afstammeling Combinator. Byvoorbeeld, & quot; div & # x3e; .foo & quot; div & # x3e; * .foo & quot is dieselfde as & quot ontleed; in plaas van & quot; div & # x3e; .foo & quot;.

Wat is nuut in weergawe 2.3.1:

  • funksies bygevoeg:
  • New opsie kill_tags in lxml.html.clean spesifieke tags en hul inhoud (dws hulle hele substructuur) te verwyder.
  • pi.get () en pi.attrib op verwerking instruksies om pseudo-eienskappe ontleed uit die teks inhoud van die verwerking van instruksies.
  • lxml.get_include () gee 'n lys van sluit paaie wat gebruik kan word om eksterne C-kode teen lxml.etree saam te stel. Dit is spesifiek wat nodig is vir staties gekoppel lxml bou wanneer kode moet saam teen die presiese dieselfde kop lêer weergawes as lxml self.
  • Resolver.resolve_file () neem 'n bykomende opsie close_file dat instel indien die lêer (-agtige) voorwerp sal gesluit wees na die lees van of nie. By verstek, sal die lêer gesluit word, as die gebruiker nie verwag word om 'n verwysing te hou om dit te.
  • Bugs vasgestel:
  • HTML skoonmaak nie 'data: "verwyder. Skakels
  • Die html5lib parser integrasie gebruik nou die "amptelike" implementering in html5lib self, wat maak dit werk met nuwer weergawes van die biblioteek.
  • In lxml.sax kan endElementNS () verkeerdelik 'n eenvoudige tag naam verwerp wanneer die ooreenstemmende begin gebeurtenis afgelei dieselfde plain tag naam te wees in die standaard namespace.
  • Wanneer 'n oop lêer-agtige voorwerp geslaag in parse () of iterparse (), sal die parser nie meer naby dit na gebruik. Dit terugval 'n verandering in lxml 2,3 waar alle lêers sal gesluit word. Dit is die gebruikers verantwoordelikheid om die lêer (-agtige) voorwerp behoorlik toe, ook in die fout gevalle.
  • Stelling fout in lxml.html.cleaner wanneer wegdoen top-vlak elemente.
  • In lxml.cssselect, gebruik die XPath 'A // B' (kort vir 'A / afstammeling-of-self :: node () / B') in plaas van 'n / afstammeling :: B 'vir die css afstammeling selector ('n B). Dit maak 'n paar rand gevalle in ooreenstemming met die selector gedrag in WebKit en Firefox, te wees en maak meer css uitdrukkings geldige ligging paaie (vir gebruik in xsl: template wedstryd).
  • In lxml.html, nie-gekies & # x3c; opsie & # x3e; tags wys nie meer in die vorm versamel waardes.
  • Voeg / verwyder & # x3c; opsie & # x3e; waardes na / van 'n meervoudige vorm veld kies behoorlik kies hulle en unselects hulle.
  • Ander veranderinge:
  • Static bou kan die aflaai gids met die opsie --download-dir te gee.

Wat is nuut in weergawe 2.3:

  • funksies bygevoeg:
  • As jy op soek vir die kinders, lxml.objectify neem '{} tag' as wat beteken 'n leë naamruimte, in teenstelling met die ouer naamruimte.
  • Bugs vasgestel:
  • As jy klaar die lees van 'n lêer-agtige voorwerp, die parser sy .close () metode roep onmiddellik.
  • As jy klaar parsing, iterparse () sluit onmiddellik die insette lêer.
  • Werk-rond vir libxml2 fout wat die HTML parser kan verlaat in 'n nie-funksionele toestand na 'n erg gebreekte dokument (in libxml2 2.7.8 vaste) parsing.
  • Marque tag in HTML opruim kode is korrek benoem markiestent.
  • Ander veranderinge:
  • Sommige openbare funksies in die Cython-vlak C-API meer eksplisiete terugkeer tipes.

Wat is nuut in die weergawe 2.3beta1:

  • Bugs vasgestel:
  • Crash in nuwer weergawes libxml2 wanneer beweeg elemente tussen dokumente wat eienskappe op vervang XInclude nodes het.
  • XMLID () funksie ontbreek die opsionele parser en base_url parameters.
  • Soek vir wildcard tags in iterparse () is gebreek in Py3.
  • lxml.html.open_in_browser () nie werk nie in Python 3 te danke aan die gebruik van os.tempnam. Dit neem nou 'n parameter opsionele 'encoding.

Soortgelyke sagteware

metaPdf
metaPdf

5 Jun 15

Whoosh
Whoosh

12 May 15

mwlib.epub
mwlib.epub

1 Mar 15

unshortenit
unshortenit

13 May 15

Kommentaar te lxml

Kommentaar nie gevind
Kommentaar te lewer
Draai op die foto!