Arch is 'n oop bron uitbreiding van Apache Nutch ( 'n gewilde, hoogs haalbare algemene doel soek enjin) vir intranet soek. Nie tevrede met jou korporatiewe soektog? Nie verbasend nie, baie min mense is. Na die beste van ons kennis, is daar geen intranet enjins wat sowel as die Google se wêreldwye search Web werk nie. Daar is 'n fundamentele rede hiervoor: die algoritmes wat gebruik word deur Google op die globale Web (of soortgelyke) werk nie naastenby so goed op intranette vir die gebrek aan statistiese data. Arch (uiteindelik!) Hierdie probleem oplos. Dit maak gebruik van 'n nuwe metode om 'n hoë presisie resultate wat 'n groot werk te lewer. Moet dit nie glo nie? Blinde toets evaluering instrumente is ingesluit. Jy kan Arch sit en sy prestasie te vergelyk met jou huidige soektog en / of Google (op die openbare deel van jou site) met behulp van 'n blinde toets metodiek.
Benewens die uitstekende search gehalte, Arch het baie funksies van kritieke belang vir korporatiewe omgewings:
- Document vlak sekuriteit. Gebruikers kan slegs dokumente wat hulle gemagtig is om te sien kry.
- Goedkoop indeks updates. Arch is in staat om indekse op datum te hou en te verhoed dat gereelde volledige webwerf weer word gecrawld.
- 24/7 beskikbaarheid. Daar is altyd 'n werkende indeks beskikbaar is, selfs al is 'n crawl versuim.- Ondersteuning vir gelyktydige kruip en soek na verskeie webtuistes, met die vermoë om te soek en afsonderlik te administreer enige plek, indien nodig. Dinamiese optel en verwydering van webwerwe is maklik.
- 'N outomaties gegenereerde webwerf gids.
- Lae koste ondersteuning eens ontplooi.
- Dubbele koppelvlak (PHP en Java) vir maklike ontplooiing en aanpassing.
- Fasette soek "out of the box".
- 'N Omvattende en skaal stel parsers vir die pars eer van 'n verskeidenheid van lêer formate: HTML, PHP, PDF, MS Office, Open Office, ens
- 'N modulêre,-plugin gebaseer argitektuur wat maklik aangepas word en uitgebrei.
- Die bron-kode is ingesluit.
- High performance en scalability. Arch kan hardloop op 'n rekenaar clusters te indeks baie groot datastelle
Wat is nuut in hierdie release:.
Weergawe 1.9.2: verbeterde dokument parsing, oorgedra op Nutch 1.9 .
Wat is nuut in weergawe 1.7:.
bykomende veiligheid skandering, oorgedra op Nutch 1.7
Vereistes :
Java 1.7, Cygwin
Kommentaar nie gevind