2012-07-13 18 views
5

Chcę zrozumieć, jak Google nie obsługuje spacji między dwoma słowami. Na przykład są 2 słowa - słowo 1 i słowo 2. Piszę w polu wyszukiwania "word1word2", to znaczy, że masz na myśli "słowo1 słowo2" lub po prostu rozumie, aby wyszukać słowo "słowo1 słowo2". Wszelkie informacje na temat struktury danych i algorytmu, z których korzystają? Widzę w tej odpowiedzi How to split text without spaces into list of words?, zaleca się stosowanie struktury danych Trie.Jak Google rozpoznaje 2 słowa bez spacji?

+0

Najlepiej byłoby zapytać programistę Google. –

+1

nie dotyczy to struktur danych, ale głównie statystyk i prognoz prawdopodobieństwa – usamec

Odpowiedz

1

Może szukają w słowniku używając wpisanego prefiksu?

1

Zakładam, trzeba mieć skrypt (przy użyciu Ajax dla exemple http://net.tutsplus.com/tutorials/javascript-ajax/adding-a-jquery-auto-complete-to-your-google-custom-search-engine/)

Zasadniczo sprawdzenie słowa w słowniku. Przestrzeń nie może być warunkiem sprawdzenia słowa, ale tylko możliwością. Na przykład proste algo (naprawdę proste) brzmi: "kilka słów" sprawdzasz list z 3 pierwszych liter, nic? Następnie należy sprawdzić 4 nowatorskich rozwiązań ...

Oto kilka wyjaśnień o wyszukiwarce Google: https://developers.google.com/search-appliance/documentation/60/admin_searchexp/ce_improving_search

Może tutaj mogą pomóc też: http://tm.durusau.net/?cat=1106

4

W pokoleniu kandydackiej korektora pisowni, ty dopuść jako możliwość pominięcia spacji, tak jak pozwalasz na pominięcie innych liter ... Być może popatrz na wykład korekcyjny ortografii tutaj: http://nlp-class.org/ [przykro, autopromocja] lub wstęp Petera Norviga: http://norvig.com/spell-correct.html

Powiązane problemy