LanguageTool

Sagteware kiekie:
LanguageTool
Sagteware besonderhede:
Weergawe: 2.9 Opgedateer
Upload datum: 14 Apr 15
Ontwikkelaar: Daniel Naber
Lisensie: Gratis
Populariteit: 18

Rating: nan/5 (Total Votes: 0)

LanguageTool is 'n oop bron proeflees program is ontwerp om foute wat gereeld speltoetser gereedskap nie kan opspoor vind. Dit is 'n reël-gebaseerde styl en grammatikatoetser foute waarvoor 'n reël is gedefinieer in die XML konfigurasielêers, soos meng & ldquo sal vind, hulle & rdquo; met & ldquo;. daar & rdquo;


Ontdek verskeie grammatika probleme

Die program kan ook verskeie grammatika probleme op te spoor en kom met ondersteuning vir meer as 20 tale, insluitend Engels, Duits, Pools, Frans, Spaans, Sweeds, Grieks, Chinese, Deense, Japannees, Yslands, Portugees en Brasiliaanse Portugees.
Verder, dit spog met 'n maklik-om-te gebruik, eenvoudig en grafiese gebruikerskoppelvlak wat dit moontlik maak om iemand te teks wat moet uitspel nagegaan plak. Dit kan die teks so die knipbord, tag teks knip / kopie / plak die teks, en woon in die gebied system tray.


Ontdek 'n wye verskeidenheid van probleme

Van die dialoog Options, kan jy in staat stel watter tipe probleme die aansoek kan opspoor, insluitend slegte styl, grammatika foute, slang, punktuasie, moontlik typos, oortollige frases, woorde wat verwar, kollokasies, hoofletters, semantiek, asook as nie-standaard frases.


LanguageTool vir LibreOffice en OpenOffice

Behalwe dat 'n selfstandige toepassing, LanguageTool is ook beskikbaar as 'n uitbreiding vir twee van die mees gewilde en kragtige open-source office suites, LibreOffice en Apache OpenOffice.org, sodat die gebruiker om hul tekste reggemaak word deur regs te klik op uitgesoekte frases of paragrawe.


LanguageTool vir Mozilla Firefox

In Daarbenewens het die aansoek is ook beskikbaar vir aflaai as 'n add-on vir die wêreld en rsquo; s mees gewilde open-source web browser in die wêreld, Mozilla Firefox. Dit verg geen herlaai en plaas 'n klein knoppie op die hoof nutsbalk, sodat jy gemerkte teks proeflees van webtuistes of vorms.


Onder die enjinkap en beskikbaarheid

Die aansoek is heeltemal geskryf in die Java-programmeertaal, wat beteken dat dit & rsquo; SA kruis-platform sagteware, ontwerp om te werk met enige GNU / Linux verspreiding, sowel as die BSD, Solaris, Microsoft Windows en Mac OS X bedryfstelsel stelsels, waar die Java Runtime Environment is geïnstalleer.

Wat is nuut in hierdie release:

  • Katalaans:
  • opgedateer POS tag woordeboek
  • nuwe reëls bygevoeg
  • vaste vals alarms
  • English:
  • Bygevoeg 'n paar reëls en 'n vaste 'n paar vals alarms
  • Bygevoeg baie reëls nuwe styl bygedra deur Heikki Lehvaslaiho. As hierdie valse alarms kan veroorsaak, is dit nie geaktiveer deur verstek. Jy kan dit aktiveer deur die draai op al die reëls in die nuwe "Plain English kategorie.
  • Esperanto:
  • 'n paar nuwe reëls bygevoeg
  • French
  • opgedateer POS tag woordeboek en Hunspell woordeboek om Dicollecte-5,3
  • Duits:
  • 'n paar nuwe reëls en vaste vals alarms bygevoeg
  • 'n Nuwe reël dat tjeks vir onderwerp werkwoord ooreenkoms. Vir nou, net gevalle met 'ist "," sind "," oorlog "en" Was' ondersteun. Voorbeeld vir foute wat opgespoor: ". Der Hund sind SCHA & para; N", "Die Autos ist Schnell." Om hierdie reël te laat werk, is frases nou verenig in disambiguation.xml: byvoorbeeld, 'Mann' in die frase "Ein Mann 'sal net sy nominatief lees behou (SUB: NOM: SONDE: MAS), terwyl dit gebruik word om ook akkusatief en datief lesings (SUB: AKK: SONDE: MAS, SUB: DAT: SONDE: MAS). (Https://github.com/languagetool-org/languagetool/issues/233)
  • Italiaans:
  • verbeter 'n paar reëls
  • Pools:
  • bygevoeg verskeie nuwe reëls
  • Portugees:
  • bygevoeg / verbeterde verskeie reëls
  • 3695 saamgestelde woorde (pre-hervorming) - die grootste gratis databasis
  • Russies:
  • bygevoeg en verbeterde reëls
  • Oekraïens:
  • 'n groot woordeboek update
  • nuwe taalreëls
  • nuwe eenvoudige vervang reël vir sagte voorstelle
  • verbeterings disambiguator
  • saamgestelde kodering en spelling verbeterings

  • Verbeterings
  • voorletters kodering
  • sin en woord tokenizing verbeterings
  • verbeter hantering van stres simbool en sagte koppelteken
  • Bitext reëls:
  • 'n eenvoudige reël bygevoeg om seker te maak of vertalings eindig met dieselfde leesteken as die oorspronklike (dit sluit net.?! Karakters).
  • Dit is nou moontlik om eksterne bitext reël lêers op die command line, deur die gebruik van
  • -bitextrule opsie. Die pad van die lêer is 'n absolute moet wees. Nota:. Dit laat die gebruik van bitext reëls ook vir tale wat geen bitext reëls ingesluit by verstek het
  • Spelling:
  • Die nuwe lêers op /hunspell/spelling.txt gebruik kan word om aanvaarde woorde toe te voeg tot die speltoetser wat ook oorweeg word wanneer die skep van voorstelle vir verkeerd gespelde woorde. Dit is soortgelyk aan die /hunspell/ignore.txt lêers, wat lys aanvaar woorde wat * nie * gebruik wanneer die skep van voorstelle vir verkeerd gespelde woorde.
  • API
  • JLanguageTool.activateDefaultPatternRules () en JLanguageTool.activateDefaultFalseFriendRules () is verwyder - al patroon reëls en valse vriend reëls (indien 'n tweede taal is gespesifiseer) is nou geaktiveer outomaties wanneer die constructor van JLanguageTool genoem word. Moet jy 'n checker sonder die patroon reëls XML-gebaseerde nodig het, uit te brei jou taal klas (bv "Engels") met die een wat die getPatternRules () metode oor skryf en gee 'n leë lys is daar.
  • ManualTagger.lookup () is vervang deur ManualTagger.tag () nadat hy afgekeur sedert die nuutste vrystelling
  • Alle statiese metodes en velde van die klas se taal 'is verskuif na die nuwe klas' Tale '. Vir nou, die metodes / velde in die klas taal steeds bestaan, maar is afgekeur.
  • LanguageIdentifierTools verwyder is. Gebruik LanguageIdentifier plaas.
  • verwyder (Standaard) ResourceDataBroker.setResourceDir () en setRulesDir () as hierdie kan ingestel word met die constructor
  • Skoon UP klas bydraer, bv verwydering getRemark ()
  • Category.setDefaultOff () is verwyder, kan dit gestel word via constructor nou
  • Herdoop klasse: o.lt.rules.patterns.Element = & gt; o.lt.rules.patterns.PatternToken o.lt.rules.patterns.ElementMatcher = & gt; o.lt.rules.patterns.PatternTokenMatcher
  • Ander klein API skoonmaak wat nie moet invloed op die algemene gebruik gevalle, bv IncorrectExample.getCorrections () opbrengste en unmodifiable lys nou, verwydering van afgekeur metodes.
  • Embedded bediener:
  • XML ontsnapping vasgestel is, kan dit ongeldig XML dokumente laat teruggekeer
  • nuwe config lêer opsie 'maxWorkQueueSize' waarmee jy die maksimum grootte van die versoek tou stel - as dit groter is as hierdie kry, sal versoeke verwerp (503 Diens nie beskikbaar nie)
  • Die bediener reageer nou met meer spesifieke HTTP status kode op hierdie fout voorwaardes: 413 Versoek Entiteit te groot - as teks oorskry maksimum teks grootte 503 Diens nie beskikbaar nie - as tjek oorskry maksimum tjek tyd
  • GUI:
  • Die stand-alone GUI kan nou 'n gewone teks lêer as 'n argument te neem, hierdie lêer sal dan op opstart (GitHub kwessie # 232) gelaai.
  • Command-line:
  • Dit is nou moontlik om 'n eksterne reël lêer wanneer ek bel LanguageTool uit die opdrag lyn te voeg. Gebruik --rulefile na 'n lêer by te voeg. As die lêer naam het 'n formaat wat 'n taal naam bevat, sal dit saam met ander reëls gebruik word; Andersins, dit sal die reëls vervang. Jy kan ook 'n eksterne lêer met vals vriende laai deur gebruik te maak van die opsie --falsefriends. Die lêernaam moet 'n absolute pad van die lêer wees, en valse vriend lêers is altyd by die mense wat gelaai vir die taal. (GitHub kwessie # 192)
  • Reël sintaksis:
  • 'n reël kan nou 'n enkele voorbeeld sin solank dit 'n 'regstelling' kenmerk - dit kan 'n paar ontslag red as die enigste korrekte sin is dieselfde as die verkeerde sin met die regstelling toegepas. Voor, 'n reël wat nodig ten minste twee voorbeeld sinne.
  • 'n voorbeeld 'element: type = "verkeerde" is nou opsioneel indien daar is 'n' regstelling 'kenmerk. Die 'regstelling' kenmerk impliseer dat die vonnis is verkeerd.
  • 'n voorbeeld 'element: type = "korrekte" is nou opsioneel. Geen 'tipe' kenmerk en geen "regstelling" kenmerk impliseer dat die vonnis korrek is.
  • Interne:
  • Ons het oorgeskakel van Apache Tika taal-detector (https://github.com/optimaize/language-detector) vir outomaties die identifisering van die teks taal. Dit moet vinniger en resultate meer betroubaar wees. Opsporing van Asturies en Galisies moes afgeskakel word omdat die opsporing kwaliteit te laag en ook geraak opsporing van die Spaanse was.
  • Vaste 'n regressie dat dit onmoontlik is om eksterne reël lêers te laai in die GUI gemaak.

Wat is nuut in weergawe 2.8:

  • Asturies:
  • verwyder afhanklikheid van Hunspell, gebruik nou Morfologik vir speltoetser
  • Breton:
  • bygevoeg en verbeter 'n paar reëls
  • Katalaans:
  • opgedateer woordeboek
  • bygevoeg en verbeterde reëls
  • vaste vals alarms
  • Nederlands:
  • bygevoeg en verbeter baie reëls
  • English:
  • 'n paar nuwe reëls (met dank aan Nick Hough)
  • opgedateer die tagger en synthesizer woordeboeke, vas kwessie # 202
  • nuwe filter gebruik word vir wat ooreenstem met die partofspeech van dele van woorde, bv. In * Dit sal slegs hou wedstryde vir woorde wat begin met 'in' en waar die gedeelte na die 'in' is 'n byvoeglike naamwoord (POS tag 'JJ). Die 'no: 1' is die teken posisie, dws hier die eerste (en enigste) bypassende verwys na
  • .
  • Frans:
  • bygevoeg en verbeter 'n paar reëls
  • Duits:
  • bygevoeg en verbeter 'n paar reëls
  • Pools:
  • bygevoeg en verbeterde verskeie reëls
  • bygevoeg en verbeterde valse vriende met Engels
  • Portugees:
  • bygevoeg / verbeterde verskeie reëls
  • Spaans:
  • verwyder afhanklikheid van Hunspell, gebruik nou Morfologik vir speltoetser
  • microverfilmde reëls lêer
  • Bygevoeg meer reëls
  • Tagalog:
  • verwyder afhanklikheid van Hunspell, gebruik nou Morfologik vir speltoetser
  • die paneelbord karakter ("") is 'n delimiter nou toe tokenizing die teks
  • Russies:
  • bygevoeg en verbeterde reëls
  • 'n paar valse vriend reëls bygevoeg (Russies / Engels)
  • Oekraïens:
  • baie nuwe reëls (insluitend ooreenkoms met Woorde, tyd uitdrukkings ens)
  • verbetering reël dekking
  • woordeboek update (groot verbeterings vir eiename en vokatief)
  • nuwe tag en regeer te waarsku oor alternatiewe spelling
  • bygevoeg woord frekwensie inligting spelling voorstelle te verbeter
  • 'n paar nuwe disambiguator reëls
  • Reël Syntax:
  • ... kan nou bygevoeg word om 'n rulegroup om al die reëls van die groep beïnvloed
  • As jy jou eie reëls wat nie deel is van LT kan jy nou voeg eksterne = "ja" om jou kategorieë op die reël skakel voorkom community.languagetool.org verskyn in ons selfstandige GUI ontwikkel (die skakel nie werk vir die reëls wat nie deel is van die belangrikste verspreiding van LT). (GitHub kwessie # 223)
  • As 'n reël groep spesifiseer verstek = "af", is die reëls in die reël groep mag ook nie die standaard spesifiseer = "on" / "af".
  • API
  • verwyder klasse en metodes wat reeds afgekeur sedert 2,7 of langer
  • Embedded bediener:
  • Die config lêer opsies 'requestLimit' en 'requestLimitPeriodInSeconds' kan nou ook gebruik word vir die HTTP-bediener (nie net vir die HTTPS-bediener)
  • New config lêer opsie 'trustXForwardForHeader': stel dit na 'waar' as jy die bediener agter 'n omgekeerde proxy hardloop en wil die versoek limiet om te werk aan die oorspronklike IP adresse wat deur die 'Xforwardedfor' HTTP kop, gewoonlik deur te stel die volmag. As jy hardloop agter 'n proxy maar hierdie eiendom nie waar, kan 'n gebruiker al die versoeke te gebruik sodat ander gebruikers ook 'n fout boodskap sal kry as gevolg van die versoek limiet.
  • Fix reaksie van na die sperdatum af: ... soms leeg, verwarrend die teks tjek in WordPress
  • Bitext reëls is nie behoorlik afgeskakel, selfs al is hulle met 'n gespesifiseerde behoorlike parameter vir die bediener; nou is dit vaste
  • Vaste probleem met onbehoorlike posisies vir 'n paar bitext reëls (uitgawe # 218)
  • GUI:
  • 'n nuwe instelling 'errorColors' is bygevoeg om die languagetool.cfg konfigurasielêer. Dit kan gebruik word om die agtergrond kleur van foute te stel. Byvoorbeeld, errorColors = tipografiese: # b8b8ff, styl: # ffb8b8 sal 'tipografiese' foute met 'n blou agtergrond en 'styl' foute met 'n rooi agtergrond in die boonste deel van die venster LT wys. 'Tipografiese "en" styl is die tipe wat in grammar.xml as "type = ...". Daar is nog geen gebruikerskoppelvlak hierdie kleure te stel. Let daarop dat jy net die languagetool.cfg lêer wanneer LT nie loop moet wysig.
  • Interne:
  • Bugfix: reëls binne 'n reël groep nie geaktiveer as 'n vorige reël van dieselfde rulegroup gebruik verstek = "af"
  • Woorde is nie meer geïgnoreer deur die speltoetser net omdat hulle voorkom in die voorstel 'n reël nie. As jy wil hê dat die speltoetser woorde wêreldwyd te ignoreer, voeg dit by hunspell / ignore.txt. Om te ignoreer hulle, afhangende van die konteks, voeg 'n 'ignore_spelling reël om disambiguation.xml.
  • 'n lêer 'hunspell / prohibit.txt' kan nou gebruik word om woorde as spelfoute te merk, selfs as die speltoetser hulle normaalweg sou aanvaar. Dit is nuttig om die LanguageTool speltoetser verbeter sonder om te wag vir die stroomop checker opgedateer word. Die 'prohibit.txt 'n lêer is die teenoorgestelde van' ignore.txt ', wat die speltoetser woorde ignoreer veroorsaak.
  • Die partofspeech tagger vir die meeste tale kan nou uitgebrei word deur inskrywings te voeg tot die lêer org / languagetool / hulpbron / XX / added.txt (XX synde die taal-kode). Die formaat is "fullform baseform postag", drie kolomme geskei deur tabs. Dit maak dit makliker vir gebruikers (en ontwikkelaars) aan die woordsoortetiketteerder brei, as hulle nie nodig het om uit te voer, te verander, en herskep die binêre woordeboek vir elke verandering.

Wat is nuut in weergawe 2.7:

  • Breton:
  • bygevoeg en verbeterde reëls
  • New reël dat tjeks as 'n weeksdag by 'n datum, bv ontdek "Gwener 28 'n wete Eost 2014", soos daardie datum is nie 'n Vrydag.
  • Katalaans:
  • bygevoeg en verbeterde reëls
  • vaste vals alarms
  • Nederlands:
  • bygevoeg en verbeter baie reëls
  • oorgeskakel na Morfologik-gebaseerde speltoetser
  • -Engels:
  • Wil jy deel van die span wat die wêreld se mees kragtige Open Source proeflees instrument ontwikkel word? Ons is op soek na 'n onderhouer vir die Engelse reëls in LanguageTool. Sien http://wiki.languagetool.org/tasks-for-language-maintainers vir meer besonderhede.
  • Alle Engelse woordeboeke is uitgebrei na die woord frekwensie klasse bevat om die speltoetser voorstelle te verbeter (die frekwensie data is geneem uit https://github.com/mozilla-b2g/gaia/tree/master/apps/keyboard/js / IMES / latin / woordeboeke, soos vir ander tale wat reeds hierdie funksie te gebruik).
  • Beter voorstelle vir Engelse leerders: onreëlmatige werkwoorde, naamwoorde, adjektiewe en nou het gewoonlik 'n beter voorstel. Byvoorbeeld, 'thinked' dui 'gedink', 'Dames' dui "vroue".
  • Meer spelfoute voorstelle nou, bv 'Waarborge (waarborg),' dankbaar '(dankbaar). Dit kan 'n afname van prestasie ~ 10% (meer vir tekste met 'n baie onbekende woorde) veroorsaak.
  • New reël dat tjeks as 'n weeksdag by 'n datum, bv ontdek "Maandag, Oktober 7, 2014", soos daardie datum is nie 'n Maandag. Hierdie reël sal slegs werk as dit die datum formaat in gebruik ontdek. So ver, is hierdie formate word ondersteun: * "Maandag, Oktober 7, 2014" * "Maandag, Oktober 7, 2014" * "Maandag, Oktober 7, 2014" * "Maandag, Oktober 7, 2014" * (dit werk ook met verkorte week dae soos Mo of Mon vir Maandag)
  • Esperanto:
  • New reël dat tjeks as 'n weeksdag by 'n datum, bv ontdek "Vendredon la 28-n de AAgusto 2014", soos daardie datum is nie 'n Vrydag.
  • Frans:
  • opgedateer POS tag woordeboek en Hunspell woordeboek om Dicollecte-5,2
  • bygevoeg 'n sintetiseerder - die ooreenkoms reël kan nou voorstelle te maak vir 'n paar foute
  • bygevoeg / verbeterde verskeie reëls
  • New reël dat tjeks as 'n weeksdag by 'n datum, bv ontdek "vendredi 28/08/2014", soos daardie datum is nie 'n Vrydag.
  • Duits:
  • Vaste 'n seldsame NullPointerException en 'n ArrayIndexOutOfBoundsException
  • Vaste verskeie vals alarms
  • Added en verbeterde reëls
  • New reël dat tjeks vir sinne sonder 'n werkwoord (afgeskakel by verstek as gevolg van die risiko van vals alarms)
  • New reël dat tjeks as 'n weeksdag by 'n datum, bv ontdek "tour, 2014/09/29", soos daardie datum is nie 'n Dinsdag.
  • verbeterings Prestasie vir speltoets voorstelle
  • Persiese:
  • bygevoeg aanvanklike ondersteuning vir Persiese (Farsi)
  • Pools:
  • bygevoeg en verbeter paar reëls
  • nuwe reël wat tjeks as 'n weeksdag by 'n datum
  • Portugees:
  • bygevoeg / verbeterde verskeie reëls
  • bygevoeg baie dekades van saamgestelde woorde
  • Russies:
  • nuwe reëls bygevoeg
  • los SourceForge funksie versoek # 38 (kyk vir verskillende aanhalingstekens)
  • 'n paar valse vriend reëls bygevoeg (Russies / Engels)
  • nuwe reël wat tjeks as 'n weeksdag by 'n datum, bv Ontdek "ÐонеÐ'еÐ"NŒÐ½Ð¸Ðº, 30 N ?? & ETH; & mikro; & ETH; & frac12; N & sbquo; N ?? & ETH; & plusmn; N & euro; N ?? 2014 & ETH; & sup3 ;. ", soos daardie datum is nie 'n Maandag
  • .
  • uitgebrei Russiese saamgestelde reël met nuwe woorde uit postag woordeboek
  • Spaans:
  • Bygevoeg nuwe POS kategorie Z (vir gespel getalle, bv 'uno "," dos, ...)
  • gespel getalle kan nou opgespoor en bestuur beide in dubbelsinnigheidsbladsy en reëls.
  • Vaste sommige verkeerde lemmas in POS woordeboek.
  • Bygevoeg Hybrid chunker-disambiguator.
  • Tamil:
  • Bygevoeg aanvanklike ondersteuning vir Tamil. As die font vir Tamil nie behoorlik vertoon op jou rekenaar en jy Windows gebruik, moet jy dalk die toepassing van die werk hier rond beskryf: https://bugs.openjdk.java.net/browse/JDK-8008572
  • Oekraïens:
  • 'n groot update vir POS woordeboek (fixes en nuwe woorde)
  • 'n POS tag herdoop vir konsekwentheid; nuwe tags vir afkortings en skaars woorde
  • baie nuwe reëls en fixes vir bestaande reëls
  • nuwe reël wat tjeks as 'n weeksdag by 'n datum, bv ontdek "& ETH; & ETH; & frac34; & ETH; & frac12; & ETH; & mikro; & ETH; 'N- & ETH," & ETH; & frac34; & ETH; & ordm ;, 7 & ETH; & para; & ETH; & frac34; & ETH; & sup2; 2014 ", soos daardie datum is nie 'n Maandag
  • teken normalisering prestasie verbetering
  • LibreOffice integrasie:
  • Moet nie verwar word deur voetnote in LibreOffice 4,3 en later (dit bied ons nou met die voetnoot posisies as meta data, so kan ons hulle ignoreer).
  • API
  • Groot prestasie verbeterings vir die multi-draad gebruik geval waar JLanguageTool kry geskep per draad, maar die taal voorwerp (bv 'Duitse') kry net een keer geskep. Oorhoofse vir die skep van JLanguageTool moet nou baie laer.
  • Verwyder verskeie klasse en metodes wat reeds afgekeur sedert weergawe 2.6
  • verwyder DutchSpellerRule - gebruik MorfologikDutchSpellerRule plaas
  • Die handtekening van Language.getRelevantRules () verander
  • Die JLanguageTool en MultiThreadedJLanguageTool vervaardigerskampioenskap nie verklaar om 'n IOException meer gooi
  • WhitespaceRule is herdoop tot MultipleWhitespaceRule (WhitespaceRule bestaan ​​steeds, maar is afgekeur)
  • Afgekeurde paar metodes wie sigbaarheid sal verminder (bv uit die openbare beskermde)
  • MorfologikSpellerRule.getRuleMatch (String, int) is herdoop tot MorfologikSpellerRule.getRuleMatches (String, int)
  • Die RuleMatch constructor gooi nou 'n uitsondering as toPosition is nie groter as fromPosition
  • 'n nuwe abstrakte klas TextLevelRule dat Reël strek en wat gebruik kan word vir die reëls wat meer as enkele sinne te dek.
  • Command line:
  • aktiveer of te deaktiveer spesifieke reëls op dieselfde tyd is nou toegelaat. Ten einde te toets net 'n paar reëls, wat voorheen gedoen is met 'n "enable LIST_OF_RULES" (al die res aanskakel), wat nou gebruik "--enabledonly enable LIST_OF_RULES" (of "-eo -e LIST_OF_RULES").
  • Embedded bediener:
  • Twee nuwe opsies kan ingestel word in die eienskappe lêer te maak LanguageTool dieselfde XML formaat terugkeer as na die sperdatum (ATD). Hierdie manier kan dit gebruik word as 'n drop-in plaasvervanger vir ATD: * af - 'LanguageTool' of 'AfterTheDeadline' * afterTheDeadlineLanguage - kode verstek taal as modus is ingestel op 'AfterTheDeadline' NOTA: die modus 'AfterTheDeadline' beskou moet word eksperimentele vir nou.
  • Die nuwe opsie 'maxCheckThreads' laat opstel van die maksimum aantal drade wat op versoeke in parallel. Die standaard is 10, as dit gebruik word.
  • Internals:
  • New abstrakte reël AbstractDateCheckFilter wat toelaat dat indien 'n week dag en datum wedstryd te kyk. Byvoorbeeld "Dinsdag, September 29, 2014" kon opgespoor word, soos 29 September, 2014 is nie eintlik 'n Dinsdag. Dit maak gebruik van die nuwe eksperimentele RuleFilter koppelvlak wat genoem kan word van XML met die nuwe "filter" element. 'Filter' neem hierdie eienskappe: "klas": die ten volle gekwalifiseerde naam van 'n Java klas wat RuleFilter implemente, bv "Org.languagetool.rules.de.DateCheckFilter" argumente ": 'n string soos" jaar: 1 maand 2 dag 3 weekdag: 4 ", dit wil sê 'n ruimte geskei lys van sleutel / waarde pare waar x kry besluit om teken die waarde van die patroon se (soos in die 'boodskap' element)
  • Die saamgestelde reël ignoreer nou tekens dat geïmmuniseer in die disambiguation.xml
  • Die "filter" aksie in die disambiguator is nou net op POS tags wat ooreenstem met die POS tag gegee. As hulle nie aan te pas, is die reël nie toegepas nie.
  • As jy die XML reëls is die uitbreiding soos beskryf by http://wiki.languagetool.org/tips-and-tricks#toc2, die eksterne reël en dubbelsinnigheidsbladsy lêers kan nou op 'n wagwoord-beskermde bediener aangebied deur die spesifiseer 'n URL soos hierdie: http: // gebruiker: password@example.org/path/user-rules.xml
  • Die em aandagstreep ("a & euro;" ") is nou 'n tokenizing karakter vir alle tale
  • Nuwe funksie:
  • Gebruik van taal modelle
  • LanguageTool kan nou gebruik van ngram data te maak. ngram data is inligting oor hoe dikwels frases voorkom in 'n taal. Tans is hierdie gebruik frases lengte van 3.
  • Die data word gebruik deur 'n Engelse reël homofone foute vind, soos meng growwe / kursus of flair / flare. LanguageTool het 'n paar reëls van hierdie soort voor, maar die nuwe reël ondersteun nou sowat 900 van so 'n woord pare / stelle.
  • Die wat nodig is vir hierdie inligting is 'n groot (7GB vir Engels) en dus nie deel of LanguageTool.
  • Die data (Engels net vir nou) en meer dokumentasie is beskikbaar by http://wiki.languagetool.org/finding-errors-using-big-data
  • Die gebruik van ngrams maak LanguageTool effens stadiger wanneer die data wat gestoor word op 'n SSD.
  • Indien nie gestoor word op 'n SSD, kan die prestasie drasties verminder.
  • Gebruik die nuwe --languagemodel opsie met die command line kliënt op die reël dat die data gebruik te aktiveer. Dat die opsie is nog nie beskikbaar vir die stand-alone GUI.

Wat is nuut in weergawe 2.4.1:

  • Opdateer Morfologik biblioteke 1.8.3 stadige voorstelle te los in die speltoetser wat geraak ten minste en-Amerikaanse

Wat is nuut in weergawe 2.4:

  • Breton:
  • SRX vonnis tokenization
  • bygevoeg / verbeter 'n paar reëls
  • vaste paar vals alarms
  • verkeerde voorstelle danksy bygevoeg toetse vasgestel op regstellings
  • Katalaans:
  • bygevoeg / verbeterde verskeie reëls
  • vaste vals alarms
  • gemaak toevoegings en verbeterings aan die tagger woordeboek
  • verwyder sommige van die woorde van sintese woordeboek (sien filterarchaic.txt)
  • frekwensie data na die tagger woordeboek bygevoeg; frekwensie woordelys kom uit die Gaia projek met Apache-lisensie, weergawe 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
  • English:
  • bygevoeg / verbeter 'n paar reëls
  • vaste paar vals alarms
  • Frans:
  • bygevoeg / verbeterde verskeie reëls
  • vaste paar vals alarms
  • Duits:
  • bygevoeg / verbeterde verskeie reëls
  • bygevoeg 'n sintetiseerder die ooreenkoms reël kan nou voorstelle te maak vir 'n paar foute (nie alle voorstelle is korrek, maar)
  • Pools:
  • bygevoeg / verbeterde verskeie reëls, veral vir koppelteken en aandagstreep gebruik
  • bygevoeg frekwensie inligting vir spellchecking dictionary; frekwensie woordelys kom uit die Gaia projek met Apache-lisensie, weergawe 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
  • vaste paar vals alarms
  • Portugees:
  • bygevoeg / verbeterde verskeie reëls (dit sluit nou geslag reëls "'n" / "o")
  • dit nou 3400+ saamgestelde woorde
  • die JAR lêer is herdoop tot languagetool.jar, uit voorheen languagetoolstandalone.jar verwarring oor wat 'n selfstandige 'beteken in hierdie konteks (GitHub kwessie # 29) te vermy
  • vir tale met baie reëls (soos die Franse of Duitse) prestasie op lang tekste is met sowat 2030%
  • oplossing vir threadsafety (kan veroorsaak hang in MultiWordChunker)
  • Vaste 'n fout waar stuk annotasies nie getoets in groepe
  • fix: 1 en het nie geëvalueer in ...
  • Vaste 'n fout in die eenwording meganisme wat sommige van die wat ooreenstem met interpretasies vroeg weggegooi
  • bygevoeg ondersteuning vir stuk annotasies in die disambiguator en in filter tekens vaste een fout met stuk annotasies
  • opgedateer Morfologik biblioteke 1.8.2 (foutherstellings, strenger insette gesonde verstand nagaan, frekwensie data toe te voeg tot woordeboeke)
  • bygevoeg die opsie insluitend frekwensie data te taggging of spelling woordeboeke. Die verwagte formaat van die frekwensie Woordenlijsten is die een in die Gaia projek met Apache-lisensie, weergawe 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries)
  • nuwe command line gereedskap uit te voer en die skep van binêre woordeboeke:
  • org.languagetool.dev.DictionaryExporter
  • org.languagetool.dev.POSDictionaryBuilder
  • LibreOffice / OpenOffice integrasie:
  • bygevoeg 'n oplossing vir verkeerde vonnis opsporing vir die geval dat 'n voetnoot verskyn ná 'n sin vol stop (Sourceforge fout # 191)
  • selfstandige GUI:
  • Die dialoog deur die "More ..." item geopen in die konteks kieslys van 'n fout sal ook nou vertoon regte en verkeerde voorbeeld sinne
  • API
  • SentenceTokenizer is nou 'n koppelvlak, die implementering is verskuif na RegexSentenceTokenizer, maar dit is afgekeur en SRXSentenceTokenizer moet eerder gebruik word
  • Sommige metodes van org.languagetool.tools.StringTools is verskuif na die klas org.languagetool.gui.Tools in die languagetoolguicommons projek
  • LanguageToolListener.languageToolEventOccured () is herdoop tot LanguageToolListener.languageToolEventOccurred ()
  • org.languagetool.tools.SymbolLocator is nie openbare meer (moet raak nie enige iemand)
  • verwyder DanishSentenceTokenizer wat was afgekeur vir drie jaar
  • Rule.getCorrectExamples () en Rule.getIncorrectExamples () nie nietig nie terugkeer, maar 'n leë lys as daar geen voorbeelde. Gevolglik hoef setCorrectExamples () en setIncorrectExamples () nie meer aanvaar null.
  • Rule.getId () kan nou enige string terug, nie net ASCIIonly snare (eintlik het dit die geval voor, as die ASCIIonly beperking nooit afgedwing en slegs in die javadoc genoem)
  • languagetoolwikipedia: die command line opsies vir die beheer van 'n Wikipedia dump is vereenvoudig. Die opdrag kan nou genoem soos hierdie: java jar languagetoolwikipedia.jar checkdata l en f enwiki20130621pagesarticles.xml Bel net "java jar languagetoolwikipedia.jar checkdata" om 'n boodskap te kry gebruik. Meer as een lêer kan gespesifiseer word met die opsie f. Daarbenewens Wikipedia XML stortingsterreine, CSV lêers van Tatoeba (http://tatoeba.org) is nou ook ondersteun, moet hulle eers gefiltreer om slegs die relevante taal bevat.

Wat is nuut in weergawe 2.3:

  • Breton:
  • bygevoeg / verbeter 'n paar reëls
  • vaste vals alarms
  • opgedateer POS woordeboek uit Apertium (svn r47282)
  • Katalaans:
  • bygevoeg ondersteuning vir die taal-kode ca-ES-valencia (Katalaans Valencia), om gebruik te word in LibreOffice 4.2.0
  • bygevoeg 'n eenvoudige reël te vervang met honderde vervanging voorstelle
  • bygevoeg / verbeterde verskeie reëls
  • vaste vals alarms
  • Chinese:
  • bygevoeg 'n oplossing vir 'n StringIndexOutOfBoundsException (http://sourceforge.net/p/languagetool/bugs/186/)
  • English:
  • vervanging patrone bygevoeg vir die spelling checker voorstelle beter te maak (bied nou 'geleer' vir 'docent')
  • bygevoeg / verbeter 'n paar reëls
  • Frans:
  • bygevoeg / verbeter 'n paar reëls
  • vaste vals alarms
  • opgedateer POS tag woordeboek en Hunspell woordeboek om Dicollecte-4.12
  • Duits:
  • bygevoeg / verbeterde verskeie reëls
  • Portugees:
  • bygevoeg / verbeter 'n paar reëls
  • dit nou 3300+ saamgestelde woorde
  • Oekraïens:
  • bygevoeg / verbeterde verskeie reëls
  • die bronkode is verskuif na GitHub: https://github.com/languagetool-org/languagetool
  • LanguageTool vereis Java 7 nou
  • LanguageTool maak gebruik van verskeie drade nou vir die teks nagaan op moderne hardeware, die verbetering van die prestasie (dit beïnvloed die stand-alone weergawe, die command line weergawe en die LibreOffice / OpenOffice uitbreiding)
  • Reël sintaksis:
  • voorlopige steun vir die nuwe min / max eienskappe wat toelaat dat 'n element wat die gegewe aantal kere verskyn pas. Byvoorbeeld: cat sal niks of "cat", dit wil sê pas "cat" is opsioneel cat sal "cat" of "cat cat" cat sal niks aan te pas, "cat", of "cat cat" Gebruik maksimum = ooreenstem "- 1" onbeperkte voorkomste toelaat. Vir min, slegs 0 of 1 ondersteun (1 is die verstek).
  • steun vir of-state. Byvoorbeeld: 'n interne en run-time, 'n reël wat OF-state is omskep in 'n paar reëls sonder OR-state
  • .
  • English het nou 'n chunker op te spoor, onder andere, enkelvoud en meervoud naamwoord stukke. Dit is gedokumenteer op http://wiki.languagetool.org/using-chunks
  • selfstandige weergawe:
  • Die selfstandige weergawe beklemtoon nou foute met 'n rooi (spelling foute) of blou (ander foute) lyn (Panagiotis Minos)
  • Onthou die taal keuring vir die volgende begin
  • Verbeterde venster en dialoog plasing in 'n multi-monitor setup
  • ingeboude bediener: gebruik standaard poort (8081) weer as begin sonder argumente
  • opgedateer die morfologik spruit biblioteek weergawe 1.7.1 om beter voorstelle, insluitende behoorlike hantering van diakritiese tekens en vervanging patrone in staat stel (ekwivalente van MAP en REP funksies in hunspell woordeboeke)
  • OpenOffice / LibreOffice integrasie:
  • fix: die "About" dialoog nie werk in Apache OpenOffice 4.0
  • fix: spesifieke reëls land (soos vir Britse Engels) nie werk nie
  • API
  • In die klas taal, het getCountryVariants () is herdoop tot getCountries (), en 'n nuwe metode getVariant is bygevoeg.
  • Sommige metodes is afgekeur
  • Sommige metodes is verskuif uit die klas Tools (languagetool-kern) van die nuwe CommandLineTools klas (languagetool-instruksies)










Wat is nuut in weergawe 2.2:



Wat is nuut in weergawe 2.1:





Wat is nuut in weergawe 2.0:







Vereistes :

  • Java 2 Standard Edition Runtime Environment

Ander sagteware ontwikkelaar Daniel Naber

LanguageTool
LanguageTool

21 Jan 15

Jwordsplitter
Jwordsplitter

21 Jan 15

Kommentaar te LanguageTool

Kommentaar nie gevind
Kommentaar te lewer
Draai op die foto!