2010-02-21 13 views
6

Jestem w trakcie budowy korporacyjnej strony internetowej. Szukamy jakiejkolwiek otwartej lub płatnej wyszukiwarki opartej na ASP.NET. Powinien on być w stanie:Wyszukiwarka ASP.NET

  1. Przeszukać zawartość internetową wszystkich stron w witrynie.
  2. Wszystkie dokumenty biurowe. itd.
  3. Jeśli mamy jakieś rewizje, to filtrowanie polega na filtrowaniu w oparciu o typ użytkownika i styg.

Proszę dać mi znać jakie narzędzia lub oprogramowanie musimy wziąć pod uwagę.

Odpowiedz

7

Spróbuj Lucene.NET

Apache Lucene jest wysokiej wydajności, pełni funkcjonalny tekst wyszukiwarka biblioteki napisany całkowicie w Javie. To to technologia odpowiednia dla niemalże dowolnej aplikacji, która wymaga pełnotekstowego wyszukiwania , zwłaszcza na wielu platformach.

Lucene.Net jest kod źródłowy, klasa-per-klasy API-per-API i algorithmatic portu silnika wyszukiwania Java Lucene do C# i .NET wykorzystaniem platformy Microsoft .NET Framework .

Oto kilka linków tutoriali na początek:

2

Solr jest kolejnym świetnym rozwiązaniem, to skutecznie fasada szczycie lucene, która zapewnia miłe API oparte na REST/url. Dostępna jest również dojrzała biblioteka .Net do współpracy z nią.

http://lucene.apache.org/solr/

http://code.google.com/p/solrnet/

Od swoje pytanie jednak szukasz rzeczywistego silnika bazowego lub szukasz czegoś również indeksować/trawers treści budowania indeksów wybranej wyszukiwarce?

-

Montaż odpowiedzieć na komentarz z oryginalnego plakatu.

Masz dwie połówki równania do rozwiązania.

Najpierw wybieramy wyszukiwarkę, która odpowiada na dane wejściowe (słowa kluczowe), a następnie odpytuje swoje indeksy i zwraca to, co uważa za stosowne. Druga połowa równania polega na znalezieniu mechanizmu do wypełnienia indeksu wyszukiwania wybranego silnika.

W odniesieniu do silnika, Lucene została zasugerowana, i zasugerowałem wariant Lucene, który zapewnia (prawdopodobnie) ulepszony interfejs programisty.Jeśli chodzi o budowanie korpusu wyszukiwania, to jest trochę inaczej. Tutaj możesz albo napisać własne oprogramowanie, które pobiera fragment treści i dodaje go do indeksu. Zaletą jest to, że masz drobną kontrolę ziarna, co idzie do wyszukiwarki i kiedy. Wadą jest pisanie nowego kodu - na szczęście nowoczesne wyszukiwarki takie jak Lucene/Solr sprawiają, że jest to całkiem proste.

Drugą opcją jest użycie czegoś do automatycznego indeksowania treści i dodanie jej do indeksu. Problem polega na identyfikacji i nauce konfiguracji odpowiedniej opcji. W zależności od wybranego typu przeszukiwacza może on, ale nie musi, wykonać dobrą robotę indeksowania dokumentów znajdujących się w systemie plików (np. W korporacyjnej witrynie SharePoint).

Nutch to robot z Apache (twórcy Lucene i Solr), który może być potencjalnie używany, jeśli zdecydujesz się nie pisać własnego kodu. http://wiki.apache.org/nutch/

+0

Budujemy witrynę korporacyjną. Gdzie każdy odwiedzający witrynę powinien mieć możliwość przeszukiwania całej treści internetowej. – user171523

Powiązane problemy