Poszukuję sposobu automatycznego generowania streszczenia, w zasadzie pierwszych sentances/akapitów wpisu blogu, do wyświetlenia na liście artykułów (które są napisane w markdown). Obecnie robię coś takiego:Abstrakty artykułów komputerowych
def abstract(article, paras=3):
return '\n'.join(article.split('\n')[0:paras])
po prostu chwytam kilka pierwszych linii tekstu, ale nie jestem całkowicie zadowolony z wyników.
To, czego naprawdę szukam, to skończyć z około 1/3 ekranu sformatowanego tekstu, który zostanie wyświetlony na liście wpisów, ale z użyciem powyższego algorytmu, pobrana kwota kończy się na niezwykle zmiennych kwotach, tak niewiele jak linia lub dwie, często miesza się z bardziej abstrakcyjnymi abstrakcjami.
Czy istnieje biblioteka, która jest dobra w tego typu sprawach? jeśli nie, czy masz jakieś sugestie, aby poprawić wyniki?
Co oznacza "niezupełnie szczęśliwy"? Czy możesz podać przykłady "złych" i "właściwych" abstraktów? –