Solr jest kolejnym świetnym rozwiązaniem, to skutecznie fasada szczycie lucene, która zapewnia miłe API oparte na REST/url. Dostępna jest również dojrzała biblioteka .Net do współpracy z nią.
http://lucene.apache.org/solr/
http://code.google.com/p/solrnet/
Od swoje pytanie jednak szukasz rzeczywistego silnika bazowego lub szukasz czegoś również indeksować/trawers treści budowania indeksów wybranej wyszukiwarce?
-
Montaż odpowiedzieć na komentarz z oryginalnego plakatu.
Masz dwie połówki równania do rozwiązania.
Najpierw wybieramy wyszukiwarkę, która odpowiada na dane wejściowe (słowa kluczowe), a następnie odpytuje swoje indeksy i zwraca to, co uważa za stosowne. Druga połowa równania polega na znalezieniu mechanizmu do wypełnienia indeksu wyszukiwania wybranego silnika.
W odniesieniu do silnika, Lucene została zasugerowana, i zasugerowałem wariant Lucene, który zapewnia (prawdopodobnie) ulepszony interfejs programisty.Jeśli chodzi o budowanie korpusu wyszukiwania, to jest trochę inaczej. Tutaj możesz albo napisać własne oprogramowanie, które pobiera fragment treści i dodaje go do indeksu. Zaletą jest to, że masz drobną kontrolę ziarna, co idzie do wyszukiwarki i kiedy. Wadą jest pisanie nowego kodu - na szczęście nowoczesne wyszukiwarki takie jak Lucene/Solr sprawiają, że jest to całkiem proste.
Drugą opcją jest użycie czegoś do automatycznego indeksowania treści i dodanie jej do indeksu. Problem polega na identyfikacji i nauce konfiguracji odpowiedniej opcji. W zależności od wybranego typu przeszukiwacza może on, ale nie musi, wykonać dobrą robotę indeksowania dokumentów znajdujących się w systemie plików (np. W korporacyjnej witrynie SharePoint).
Nutch to robot z Apache (twórcy Lucene i Solr), który może być potencjalnie używany, jeśli zdecydujesz się nie pisać własnego kodu. http://wiki.apache.org/nutch/
Budujemy witrynę korporacyjną. Gdzie każdy odwiedzający witrynę powinien mieć możliwość przeszukiwania całej treści internetowej. – user171523