TLU (Tuning en Analise Nut) is 'n program en prestasie analise-instrument raamwerk vir 'n hoë-prestasie parallelle en verspreide computing.
TLU bied 'n suite van gereedskap vir statiese en dinamiese analise van programme wat geskryf is in C, C ++, FORTRAN 77/90, Python, High Performance FORTRAN en Java.
In die besonder, TLU bied 'n state-of-the-art prestasie profilering en die opsporing fasiliteit wat ondersteun 'n algemene skaalbare parallel uitvoering model gebaseer op nodes, kontekste, en drade.
Die doel van die TLU projek is program en prestasie analise tegnologie wat aan beide die uitdagings van veranderende skaalbare parallel rekenaar stelsels en die behoeftes van die ontwikkeling metodologieë wat gebruik word vir die volgende generasie wetenskaplike toepassings te ontwikkel.
TLU moet in staat wees om die diversiteit van die rekenaar paradigmas en masjiene en terselfdertyd 'n raamwerk van draagbare en herconfigureerbare meting en analise komponente wat geskik kan word en uitgebrei te teiken.
Wat is nuut in hierdie weergawe:
- Hierdie weergawe voeg 'n hawe Linux, Intel MIC platforms, CUDA te bewapen 5.0 ondersteuning, UPC Runtime instrumentasie vir Cray CCE en BUPC, verbeterings in die MPI wrapper, ondersteuning aan ParaProf 3D vir IBM BG / Q, en ARM Linux.
Wat is nuut in die weergawe 2.21.2:
- Groot veranderinge sluit SHMEM profilering vir Cray en SGI, NVIDIA OpenCL en AMD OpenCL ondersteuning, 'n tau_rewrite hulpmiddel gebaseer op MAQAO, OpenSHMEM Profiling, telling-P Atoom / Konteks Events, OpenMP 3.0 instrumentasie met Opari2, NVIDIA CUPTI v4.1, H2 databasis in PerfDMF, ontfouting met TAU_TRACK_SIGNALS, MinGW samesteller ondersteuning vir Windows, UPC bron vlak instrumentasie met behulp van die Rose parser die Cray CCE vertaler te ondersteun, en PDT 3.17 met Rose en MAQAO binêre instrumentor.
Wat is nuut in die weergawe 2.19.1:
- ParaProf:
- ParaProf het 'n nuwe uitdrukking venster wat jou toelaat om maklik te skep
- afgelei statistieke (Options - & gt;. Wys Afgelei metrieke Panel Jy kan ook slaag
- 'n lys van uitdrukkings in 'n lêer te paraprof en die uitdrukkings van toepassing op
- 'n vlak (aansoek, eksperiment, verhoor in 'n profiel lêer of in 'n
- databasis. Hierdie venster verskyn ook in perfexplorer.
- Paraprof het 'n updated 3D kommunikasie venster wat gekenmerk sliders
- en kruis hare vir akkuraat die evaluering van die mate van punt-tot-punt
- kommunikasie tussen sender en ontvanger nodes. Die kommunikasie te gebruik
- matriks vertoon in paraprof, stel asseblief die TAU_COMM_MATRIX omgewing
- veranderlike 1 voor die uitvoering van die trum aansoek.
- 'n nuwe groep wisselaar venster is beskikbaar vir die verandering van die groep
- lidmaatskap van die gebeure tydens die analise fase. Hierdie venster (toeganklik
- via Windows - & gt; Groep wisselaar kan jy 'n subset van roetines te kies
- die gebruik van verskeie keuse of wildcards (bv HDF5 en assosieer dit met 'n
- nuwe groep (bv, IO. U kan die lêer stoor, laai dit in 'n databasis en
- gebruik dit in PerfExplorer se vensters (bv 'Charts - & gt; Group% van die totale
- runtime 'die afskaling van IO bedrywighede te sien.
- Die filter box kan jy gereelde uitdrukkings te gebruik om te filtreer wat
- funksies / streke wat jy wil verander. Daar is 'n implisiete * bygevoeg
- die einde van die filter, sodat jy kan net tik MPI_ en jy sal sien
- al die MPI roetines byvoorbeeld.
- As jy een of meer funksie / streke kies, die huidige en beskikbaar
- groepe sal vertoon word. As die funksies wat jy gekies het het nie
- dieselfde stel van die groepe, dan is die kruising van hul groepe sal wees
- swart, en die res sal grys, sodat jy kan óf voeg die groep
- die res, of verwyder dit van alle van hulle.
- Vaste boom seleksie model na die veranderinge wat gemaak is vir 'n multi-keuse.
- Nou as jy regs-kliek op 'n ongemerkte voorwerp, word dit die kies
- voorwerp en die pop-up verskyn slegs vir hierdie.
- 3D visualisering werk nou op IBM BG / P behulp ppc64 JOGL.
- Beter Perfsuite ondersteuning vir die ontleding van perfsuite 1.0.0a4 profiele.
- PerfExplorer:
- Perfexplorer se kode is opgedateer om boek van Weka 3.6.1. Jy sal nodig hê om te
- hardloop perfexplorer_configure aan 'n ouer PerfDMF installasie in die nuwe gebruik
- perfexplorer. DBSCAN groepering is nou in werking is, en jy kan die loods
- boek van Weka Explorer direk uit 'n dataset. Aanvanklik het die top 10
- & quot; interessante & quot; funksies word uitgevoer na 'n CSV-lêer, en outomaties
- gelaai boek van Weka. Van daar is, kan jy dit doen alle vorme van pret data-ontginning.
- Die DBSCAN metode sal eerste normaliseer die data, dan vind die k-afstande
- vir elke proses, waar k die minimum aantal punte te vinde in
- die cluster. Toe het die k-afstande word gesorteer neerdaal en die
- k-afstande probeer verskeie buurt afstande vir die
- groepering. Enige groepering wat vind 'n nuwe nommer van die trosse is gered.
- Opdateer skrifte die nuwe weergawe van Jython (2.5.1 om dit te ondersteun
- ondersteun 'n werklike up-to-date standaard vir Python, weergawe 2.5. Die nuwe
- weergawe vereis 'n register lêer, en 'n gebruiker-skryfbare plek die te sit
- cachefiles wanneer die pype is pre-verwerkte simbole te vind.
- Maak 'n nut wat 'n Paraver spoor rekonstrueer uit TLU EBS monsters.
- tau_instrumentor:
- Die tau_instrumentor instrument nou ondersteun die outomatiese lus vlak
- instrumentasie in die SPEC af. Die spec af kan tau_instrumentor na
- insetsel instrumentasie oproepe in 'n afskrif van die oorspronklike bron-kode vir 'n
- hulpmiddel. Vroeër hierdie deur instrumente wat gebruik word, soos Scalasca vir roetine vlak
- instrumentasie alleen. Nou, dit word ondersteun lus vlak instrumentasie vir
- eksterne gereedskap sowel.
- Hybrid bron en samesteller-gebaseerde instrumentasie:
- Wanneer die outomatiese bron vlak instrumentasie (met behulp van PDT en
- samestelling nie 'n .o lêer produseer (as gevolg van 'n moontlike parseerfout,
- TLU gebruik om terug te keer na die oorspronklike samestelling command line. Nou, dit
- beroep op die samesteller samesteller-gebaseerde toerusting te gebruik in te voeg
- roetine vlak instrumentasie in die kode. Dit lei tot 'n beter
- instrumentasie dekking van die kode. Hierdie verandering deursigtig moet wees
- die gebruiker. Hierdie nuwe funksie uit te skakel, moet die gebruiker uitdruklik slaag die
- -optNoCompInst opsie in die TAU_OPTIONS omgewing veranderlike. Sorg moet
- geneem word terwyl die definisie uitsluit of sluit lyste van roetines en lêers in
- selektiewe instrumentasie lêers. Die roetine name kan verskil (vir PDT en
- samesteller-gebaseerde instrumentasie en TLU se samesteller skrifte is geval
- sensitief, maar hulle toelaat dat die gebruik van wildcards in name.
- Ondersteuning vir eksterne pakkette.
- TLU ondersteun nou die onlangse PAPI-C 4.0.0 vrylating asook Scalasca 1.3.0 en DyninstAPI 6.1 release.
- New Platforms:
- TLU ondersteun die Cray CCE opstellers (vir C, C ++ en Fortran op die Cray
- XT stelsels (net roep 'module vrag PrgEnv-Cray' voor die instel
- TLU. Samesteller-gebaseerde instrumentasie is nog nie ondersteun nie. TLU ook
- funksies IBM BG / P opset verbeteringe.
- Outreach:
- Ons sal gee 'n volle dag POINT handleiding by die LCI'10 konferensie in
- Pittsburgh (Maart 8. Ons sal die verspreiding word op die punt VI-HPS LiveDVDs
- vir opleiding.
Wat is nuut in die weergawe 2.18.1:
- Ondersteuning is bygevoeg vir GPGPUs in BGA samesteller en vir BGA opstellers op Mac OS X.
- Workflow ondersteuning onder Eclipse, Charm ++ ondersteuning, en OpenMP ondersteuning is verbeter.
- Die Python API is versnel.
- Die dokumentasie is opgedateer.
- Verwerking foute is vasgestel.
Wat is nuut in die weergawe 2.17.3:
- Updates sluit samesteller-gebaseerde toerusting vir Intel, GNU en PathScale opstellers, 'n nuwe Python API vir die geheue dop, fixes vir IBM BG / P opset, en ondersteuning vir CQoS analise en teken kaarte van script lêers in PerfExplorer.
Kommentaar nie gevind