Op grond van die Nokogiri HTML parser vir Ruby, Sanitize is 'n witlys gebaseerde stelsel vir die verwydering van 'n HTML blok van die teks.
Die "witlys" tegniek sal ontwikkelaars om te installeer toelaat dat 'n lys van HTML tags wat Sanitize sal gebruik as 'n verwysing vir wat dit oorweeg "aanvaarbare" HTML.
Elke ander HTML tag nie in die lys sal verwyder word van die ontleed teks.
Sanitize kan werk met die standaarde voldoen of met misvormde HTML.
Die biblioteek kan opspoor en uit te filter HTML tags, eienskappe en protokolle.
Die skoongemaak teks sal altyd outputted as geldig HTML of XHTML.
Om te help ontwikkelaars te begin op hul projekte, Sanitize kom met 'n paar gereed gemaak konfigurasies ingesluit. Gaan die README lêer vir meer besonderhede
Wat is nuut in hierdie release:.
- twee nuwe CSS config instellings: at_rules_with_properties en. at_rules_with_styles
- Bygevoeg volle ondersteuning vir CSSpage reëls in die ontspanne config, insluitende ondersteuning vir alle bladsy-marge box reëls.
- Bygevoeg die volgende CSS at-reëls tot die ontspanne config.
- Bygevoeg 'n hele klomp van CSS eienskappe tot die ontspanne config. Kyk hier die volledige lys.
- Klein prestasie.
- opgegradeer kras om 1.0.2 te haal 'n fix dat die ontleding van CSSpage reëls geraak.
Wat is nuut in weergawe 3.1.2:
- Vaste: #document en #fragment versuim het om op bevrore snare, en kan per ongeluk onbevrore snare verander as hulle gebruik om 'n ander as UTF-8-kodering of as hulle karakters bevat nie toegelaat in HTML.
Wat is nuut in weergawe 3.0.2:
- Opdateer Nokogumbo om 1.1.12, want 1,1. 11 stilweg teruggekeer die verandering wat ons probeer om af te haal in die laaste uitgawe.
Wat is nuut in weergawe 3.0.0:
- Bygevoeg gevorderde CSS sanitization ondersteuning met behulp van kras, wat is ten volle voldoen aan die CSS Syntax Module Vlak 3 parsing spec. Die inhoud van die wit & # x3c; styl & # x3e; elemente en styl eienskappe in HTML sal ontsmet as CSS, of jy kan die Sanitize :: CSS klas gebruik om CSS style sheets of eiendomme hand ontsmet.
- 'n Bygevoeg: allow_doctype omgewing. Wanneer ware, goed gevorm DOCTYPE definisies sal toegelaat word in die dokumente. Wanneer valse (die verstek), sal DOCTYPE definisies verwyder word van dokumente. DOCTYPE definisies word nooit toegelaat in fragmente, ongeag van hierdie instelling.
- Bygevoeg die volgende elemente van die ontspanne config, benewens verskeie eienskappe. Artikel, opsy, liggaam, data, div, footer, kop, kop, html, hoof, nav, artikel, span, styl, die titel
- Die: whitespace_elements config is nou 'n Hash, en kan jy die teks wat voor en na hierdie elemente wanneer hulle verwyder moet word of spesifiseer. Die ou-styl-Array gebaseer config waarde is nog steeds ondersteun vir backwards compatibility.
- Ongeskik Unicode karakters is nou verwyder van HTML voordat dit ontleed.
- Vaste:
- Nie-tag hakies in insette soos & quot; 1 & # x3e; 2 en 2 & # x3c; 1 & quot; nou ontleed en korrek ontsnap in ooreenstemming met die HTML5 spec, wat oorslaan & quot; 1 & gt; 2 en 2 & lt; 1 & quot;.
- Broers en susters bygevoeg na die huidige node in traversal nou ook gekruis. In vorige weergawes is hulle eenvoudig oorgeslaan.
- Nokogiri is geklap en opdrag gegee om te stop en bygevoeg newlines na sekere elemente, want as mense wou newlines daar hulle wil hulle daar sit, dammit.
Wat is nuut in weergawe 2.0.6:
- Version 2.0.5 per ongeluk ingesluit 'n werk-in -progress veranderinge wat nog nie hul pad moes gemaak het in die meester-tak.
Wat is nuut in weergawe 1.2.1:
- Bygevoeg 'n: remove_contents config omgewing. Indien waar, sal Sanitize die inhoud van alle nie-wit lys elemente in bykomend tot die elemente self te verwyder. As stel na 'n verskeidenheid van element name, sal Sanitize slegs die inhoud van die elemente (wanneer gefiltreer) te verwyder, en laat die inhoud van ander gefiltreer elemente. [Dankie aan Rafael Souza vir die opsie Array]
- 'n Bygevoeg: output_encoding config instelling om die karakter enkodering vir HTML uitvoer toelaat gespesifiseer word. Die standaard is 'utf-8'.
- Die omgewing hash geslaag in transformators sluit nou 'n: node_name item met die klein naam van die huidige HTML node (bv & quot; div & quot;) .
- enigiets anders as 'n Hash of nul Terugkeer van 'n transformator sal nou verhoog 'n betekenisvolle Sanitize :: Fout uitsondering eerder as 'n onbedoelde NameError.
Vereistes :
- Ruby 1.9.2 of hoër
- Nokogiri 1.4.4 of hoër
Kommentaar nie gevind