2009-02-14 10 views

Odpowiedz

6

Są badania na ten temat, nazywa się Computational Humor. Jest to obszar interdyscyplinarny, który wykorzystuje elementy z lingwistyki komputerowej, psycholingwistyki, sztucznej inteligencji, uczenia maszynowego itp. Próbują oni dowiedzieć się, co sprawia, że ​​historie lub dowcipy są zabawne (np. Nieoczekiwane połączenie lub zaskakujący temat tabu; itp.) i zastosować go do tekstu (aby wygenerować zabawną historię lub zmierzyć "funniness" tekstu).

Istnieje books i artykuły na ten temat (np. Przez Graeme Ritchie).

0

Jedynym sposobem na wyciągnięcie tego jest uzyskanie kilku tysięcy osób (małpy nie będą, przepraszam), aby przejrzały tysiące zabawnych zdań/opowiadań, oceń je, a następnie zbuduj jakiś system ekspercki/sieć neuronowa. Biorąc pod uwagę zakres problemu i jego subiektywność (rzecz zabawna dla jednej osoby może nie być zabawna - nawet obraźliwa - dla innej osoby), powiedziałbym, że to niemożliwe.

5

Tak, powinieneś użyć Korporacji Treningowej do zbudowania modelu predykcyjnego zdolnego do wykrywania zabawnych zdań. Czasami jest to znane w literaturze jako "Analiza nastrojów". Zapoznaj się z tym artykułem na temat Sentiment Analysis with LingPipe.

Jeśli możesz używać Javy, możesz użyć ich biblioteki (zobacz license matrix). Okazało się, że jest to bardzo przydatne, a nie dokładnie w tym samym kontekście, co ty.

0

Możesz użyć tej samej techniki, co filtry antyspamowe. Zamiast spamu/nie-spamu klasyfikujesz na śmiesznym/nie-zabawnym. Zajrzyj do naiwnych klasyfikatorów bayesowskich po więcej informacji.

http://en.wikipedia.org/wiki/Naive_Bayesian_classification

+1

To nie jest szczególnie dobra dla humoru, ponieważ podejście naiwne Bayesa zakłada niezależność między poszczególnymi słowami („efekty”). W humorze, który jest niewiarygodnie słabym założeniem, ponieważ konstrukcje wyższego poziomu sprawiają, że humor jest dobry, a nie tylko pojedyncze zdarzenia. –

Powiązane problemy