lxml

Sagteware kiekie:
lxml
Sagteware besonderhede:
Weergawe: 3.4.1
Upload datum: 17 Feb 15
Ontwikkelaar: Martijn Faassen
Lisensie: Gratis
Populariteit: 72

Rating: nan/5 (Total Votes: 0)

lxml is 'n gesofistikeerde, kragtige, gratis en unieke Python module wat bind die libxml2 en libxslt biblioteke, sodat Python ontwikkelaars om te werk met beide XML en HTML-lêers insider hul Python code.An XML verwerking librarylxml is 'n XML (Extensible Markup Language ) verwerking biblioteek is geskryf in die Python-programmeertaal, spesifiek ontwerp om die ElementTree API spesifikasie tot soveel as moontlik volg.
Dit kan die ElementTree API brei spesifieke funksies van die libxslt en libxml2 biblioteke, soos Ontspan NG (Next-Generation), XPath, XML Schema, c14n, XSLT (Extensible Style Taal) bloot te stel, etc.Use lxml Python kode van te noem XSLT stylesheetsDevelopers sal in staat wees om die lxml program te gebruik Python kode van XSLT style en XPath uitdrukkings te bel via uitbreiding funksies. 'N Wye verskeidenheid van tutoriale is beskikbaar op die projek & rsquo; s tuisblad (sien die skakel aan die einde van die artikel).
Die sagteware is open source deur ontwerp en kombineer die funksie volledigheid en spoed van die bogenoemde biblioteke met die eenvoud van 'n afgestorwene en rsquo; s API (Application Programming Interface) .Getting begin met lxmlIt is baie maklik lxml om te installeer op 'n GNU / Linux verspreiding die gebruik van die bron argief versprei op Softoware en die projek & rsquo; s amptelike webwerf. Eenvoudig die aflaai van die bron pakket, stoor dit op jou huis gids, pak dit, maak die Terminal app en navigeer na die plek van die onttrek argief lêers (bv cd /home/softoware/lxml-3.4.1).
Begin die & nav, maak & rsquo; beveel die program, wat moet neem ongeveer 1-2 minute op 'n moderne rekenaar op te stel. Na 'n suksesvolle samestelling, loop die & nav, maak installeer & rsquo; opdrag as root of die & nav, maak sudo installeer & rsquo; opdrag as 'n bevoorregde gebruiker lxml stelsel wide.Supports GNU / Linux en Microsoft Windows bedryfstelsel systemsThe sagteware is amptelik ondersteun op GNU / Linux en Microsoft Windows-bedryfstelsels te installeer. Dit is suksesvol getoets op 32-bit en 64-bis rekenaars

Wat is nuut in hierdie release:.

  • Kenmerke bygevoeg:
  • New html file HTML generator die inkrementele xmlfile serialisasie API te vergesel. Patch deur Burak Arslan.
  • Bugs vasgestel:
  • lxml.sax.ElementTreeContentHandler nie inisialiseer sy superklas.

Wat is nuut in die weergawe 3.3.1:

  • Bugs vasgestel:
  • LP # 1014290: HTML dokumente ontleed met parser.feed () versuim elemente tydens tag iterasie te vind
  • .
  • LP # 1273709: Gebou in PyPy misluk weens ontbreek ondersteuning vir PyUnicode_Compare () en PyByteArray _ * () in PyPy se C-API
  • .
  • LP # 1274413: Samestelling in MSVC misluk weens ontbreek & quot; stdint.h & quot; standaard kop lêer.
  • LP # 1274118: iterparse () versuim het om te ontleed BOM voorafgegaan lêers
  • .

Wat is nuut in die weergawe 3.0 Alpha 2:

  • funksies bygevoeg:
  • Die .iter () metode van elemente aanvaar nou tag argumente soos & quot; {*} naam & quot; om te soek vir elemente met 'n gegewe plaaslike naam in enige naamruimte. Met hierdie toevoeging, alle kombinasies van wildcards nou werk soos verwag: & quot; {ns} naam & quot ;, & quot; {} naam & quot ;, & quot; {*} naam & quot ;, & quot; {ns} * & quot ;, & quot; {} * & quot; en & quot; {*} * & quot ;. Let daarop dat & quot; naam & quot; is gelykstaande & quot; {} naam & quot ;, maar & quot; * & quot; is & quot; {*} * & quot ;. Dieselfde verandering is van toepassing op die .getiterator (), .itersiblings (), .iterancestors (), .iterdescendants (), .iterchildren () en .itertext () metodes, die strip_attributes (), strip_elements () en strip_tags () funksies sowel as die iterparse () klas.
  • C14N laat spesifiseer die inklusiewe voorvoegsels aan top-vlak bevorder word tydens eksklusiewe serialisasie.
  • Bugs vasgestel:
  • Slaag lang Unicode snare in die voer () parser koppelvlak versuim het om die hele string te lees.

Wat is nuut in die weergawe 2.3.5:

  • crash wanneer die samesmelting teks nodes in element.remove ( ).
  • Crash in saxofoon / teiken parser wanneer hulle leë DOCTYPE.

Wat is nuut in die weergawe 2.3.4:

  • Crash wanneer die bou van 'n nsmap (Element eiendom) met leë naamruimte URI.
  • Crash weens ras toestand wanneer foute (of gebruiker boodskappe) voorkom tydens gestruktureerde XSLT verwerking.
  • XSLT style samestelling kan opstel foute ignoreer.

Wat is nuut in die weergawe 2.3.2:

  • funksies bygevoeg:
  • lxml.objectify.deannotate () het 'n nuwe boolean opsie cleanup_namespaces die objektiveer naamruimte verklarings te verwyder (en in die algemeen skoon te maak die naamruimte verklarings) na die verwydering van die tipe notas.
  • lxml.objectify opgedoen het sy eie SubElement () funksie as 'n afskrif van etree.SubElement 'n andersins onnodige invoer van lxml.etree te vermy op die gebruiker kant.
  • Bugs vasgestel:
  • Vaste die & quot; afstammeling & quot; fout in cssselect 'n tweede keer (na 'n eerste fix in lxml 2.3.1). Die vorige verandering het gelei tot 'n ernstige prestasie regressie vir die XPath evaluering van die vertaalde uitdrukking. Let daarop dat dit breek die gebruik van 'n paar van die gegenereerde XPath uitdrukkings soos XSLT plek paaie wat voorheen in 2.3.1 gewerk.
  • Vaste parsing van sommige keurders in cssselect. Witspasie na combinators & quot; & Gt; & quot ;, & quot; + & quot; en & quot; ~ & quot; is nou reg geïgnoreer. Voorheen is is ontleed as 'n afstammeling Combinator. Byvoorbeeld, & quot; div & gt; .foo & quot; is ontleed dieselfde as & quot; div & gt; * .foo & quot; in plaas van & quot; div & gt; .foo & quot;.

Wat is nuut in die weergawe 2.3.1:

  • funksies bygevoeg:
  • New opsie kill_tags in lxml.html.clean spesifieke etikette en hul inhoud (dws hulle hele substructuur) te verwyder.
  • pi.get () en pi.attrib op verwerking instruksies pseudo-eienskappe te ontleed uit die teks inhoud van die verwerking van instruksies.
  • lxml.get_include () gee 'n lys van sluit paaie wat gebruik kan word om eksterne C-kode teen lxml.etree te stel. Dit is spesifiek wat nodig is vir staties gekoppel lxml bou wanneer kode moet teen presies dieselfde header lêer weergawes as lxml self op te stel.
  • Resolver.resolve_file () neem 'n bykomende opsie close_file te instel as die lêer (-agtige) voorwerp sal gesluit word na die lees of nie. By verstek, sal die lêer gesluit word, as die gebruiker nie verwag om 'n verwysing te hou om dit te.
  • Bugs vasgestel:
  • HTML skoonmaak nie verwyder 'data:'. Skakels
  • Die html5lib parser integrasie gebruik nou die "amptelike" implementering in html5lib self, wat maak dit werk met nuwer weergawes van die biblioteek.
  • In lxml.sax, endElementNS () kon verkeerd 'n eenvoudige tag naam verwerp wanneer die ooreenstemmende begin gebeurtenis afgelei dieselfde vlakte tag naam te wees in die verstek naamruimte.
  • Wanneer 'n oop lêer-agtige voorwerp geslaag het in parse () of iterparse (), die ontleder sal nie langer naby dit na gebruik. Dit terugval 'n verandering in lxml 2.3 waar alle lêers sal gesluit word. Dit is die gebruikers verantwoordelikheid om behoorlik maak die lêer (-agtige) voorwerp, ook in die fout gevalle.
  • Stelling fout in lxml.html.cleaner wanneer wegdoen top-vlak elemente.
  • In lxml.cssselect, gebruik die XPath 'A // B' (kort vir 'A / afstammeling-of-self :: node () / B') in plaas van 'n / afstammeling :: B 'vir die css afstammeling selector ('n B '). Dit maak 'n paar rand gevalle in ooreenstemming met die selector gedrag in WebKit en Firefox, en maak meer css uitdrukkings geldig plek paaie (vir gebruik in xsl: template wedstryd).
  • In lxml.html, nie-gekies tags wys nie meer in die versamel vorm waardes.
  • Byvoeg / verwyder waardes na / van 'n meervoudige kies vorm veld kies hulle behoorlik en Inverse hulle.
  • Ander veranderinge:
  • Statiese bou kan spesifiseer die aflaai gids met die --download-rig opsie.

Wat is nuut in weergawe 2.3:

  • funksies bygevoeg:
  • As jy op soek vir die kinders, neem lxml.objectify '{} tag' as wat beteken 'n leë naamruimte, in teenstelling met die ouer naamruimte.
  • Bugs vasgestel:
  • As jy klaar die lees van 'n lêer-agtige voorwerp, die ontleder noem onmiddellik sy .close () metode.
  • As jy klaar parsing, iterparse () sluit onmiddellik die insette lêer.
  • Werk-rond vir libxml2 fout wat kan die HTML parser verlaat in 'n nie-funksionele toestand na die ontleding van 'n erg gebreekte dokument (vaste in libxml2 2.7.8).
  • Suzuki tag in HTML opruim kode korrek die naam markiestent.
  • Ander veranderinge:
  • Sommige openbare funksies in die Cython-vlak C-API meer eksplisiete terugkeer tipes.

Wat is nuut in die weergawe 2.2.8 / 2.3 Beta 1:

  • Crash in nuwer libxml2 weergawes wanneer bewegende dele tussen dokumente wat eienskappe op vervang XInclude nodes het.
  • XMLID () funksie is ontbreek die opsionele parser en base_url parameters.
  • Soek vir wildcard tags in iterparse () is gebreek in Py3.
  • lxml.html.open_in_browser () nie in Python 3 werk as gevolg van die gebruik van os.tempnam. Dit neem nou 'n opsionele 'encoding' parameter.

Vereistes :

  • Python

Soortgelyke sagteware

mdx_outline
mdx_outline

14 Apr 15

Gnosis Utils
Gnosis Utils

2 Jun 15

didit
didit

12 May 15

Ander sagteware ontwikkelaar Martijn Faassen

z3c.relationfield
z3c.relationfield

14 Apr 15

hurry.resource
hurry.resource

11 May 15

Kommentaar te lxml

Kommentaar nie gevind
Kommentaar te lewer
Draai op die foto!