DKPro Core is 'n oop bron sagteware geskryf in die Java-programmeertaal en ontwerp as 'n versameling van aansoeke vir natuurlike taal verwerking (NLP).
Onder sommige van die funksies wat deur DKPro Core se komponente, kan ons praat tokenization, segmentering, saamgestelde verdeel, wat spruit, lemmatisering deel-van-spraak kodering, morfologiese analise, sintaktiese ontleding, afhanklikheid parsing, coreferentie resolusie, taal identifikasie, spelling korreksie, en grammatika kontrole.
Word gebaseer op die Apache UIMA raamwerk, DKPro Core die projek is oorspronklik ontwikkel deur Ubiquitous Kennis Processing Lab (ukp) by die Technische Universit & auml; t Darmstadt, Duitsland.
DKPro Core versprei as afsonderlike uitgawes, DKPro Core GPL en DKPro Core ASL, gelisensieer onder GPLv3 en Apache sagteware lisensie. Elke uitgawe bevat 'n ander funksie te stel
Wat is nuut in hierdie release:.
- New API modules
- api.phonetics - Annotation tipes vir die fonetiese vlak
- api.semantics - Annotation tipes vir semantiese inligting (semantiese velde en semantiese rol etikettering)
- New I / O modules
- io.conll - leser en skrywer vir die CONLL 2006 formaat
- io.tcf - leser en skrywer vir die Clarin TCF formaat
- io.tgrep - skrywer vir TGrep2 corpus lêers
- io.tiger - Reader vir die Tiger XML-formaat
- New analise modules
- commonscodec - Fonetiese transkripsie gebaseer op die Apache Commons Kodek biblioteek
- decompounding - Buigsame stel van komponente vir decompounding, gebaseer op verskillende verdeel en posisie algoritmes
- mate-gereedskap - wrapper vir die mate-gereedskap suite
- morpha - wrapper vir die morpha Stemmer / lemmatizer
- mstparser - wrapper vir die mstparser
- sfst - Nuwe module vir SFST-gebaseerde morfologiese analiseerder
- umlautnormalizer - Normalizer vir umlauts in Duits tekste (ASL)
- Verdere hoogtepunte in hierdie release sluit in:
- Bygevoeg steun vir die oplossing van modelle van afgeleë bronne by runtime
- BygevoegTypeCapabilities annotasies verklaar wat annotasies hulle verbruik en produseer
- Bygevoeg motor-gegenereerde XML beskrywers vir UIMA komponente (via uimafit-Maven-plugin)
- Bygevoeg ondersteuning vir ClearNLP Semantic Rol Etikettering
- Bygevoeg ondersteuning vir GATE Hepple woordsoortetiketteerder
- Bygevoeg ondersteuning vir OpenNLP parser en die naam finder
- opgradeer na Apache uimaFIT 2.0.0
- opgradeer na Apache UIMA 2.4.2
- Opdateer te ArkTweet-NLP 0.3.2
- opgradeer na ClearNLP 1.3.1
- opgradeer na CoreNLP 3.2.0
- Upgrade tot poort 7.1
- opgradeer na jweb1t 1.3.0
- opgradeer na LanguageTool 2.2
- opgradeer na Maltparser 1.7.2
- Upgrade to-Tools Mate Anna 3.5
- opgradeer na OpenNLP 1.5.3
- Sommige modules word nie meer onderhou en is nie oorweeg vir die gebruik van die algemene publiek, bv die io.mmax2 module en die io.wsdl module. Hulle is afgetree en is nie ingesluit in hierdie weergawe.
- Wanneer die opgradering, asseblief gedagte dat jy nie die verskillende weergawes van DKPro Core komponente moet meng in jou projekte -. Hulle kan nie versoenbaar met mekaar wees
Vereistes :
- Java 2 Standard Edition Runtime Environment
Kommentaar nie gevind