7

Mam około 300 milionów plików tekstowych, od 50kb do 100kb, które muszę przeczytać i podawać na stronie internetowej.Wydajność Azure Blob kontra Azure Tabela

Uwagi:

Na Azure tabeli, to muszę podzielić niektóre pliki tekstowe, aby upewnić się, że nie przekracza maksymalnie 64kb jednej kolumnie.

Na platformie Azure Blob nie miałabym problemu z dzieleniem, ale musiałabym przechowywać odniesienie do nich w tabeli Azure SQL/Azure.

OK, intro jest gotowe! Teraz w mojej aplikacji Azure Web App:

  1. Czy można szybciej odczytać plik tekstowy z Azure Blob lub z Azure Table?
  2. Czy tabela Azure może przetwarzać więcej żądań?
+0

Zrobiłem kilka testów i, ku mojemu zdziwieniu, czytanie pliku z Blob jest szybsze niż z Tabeli. Zgadzam się również, że w przypadku wyszukiwania zamierzam użyć usługi Azure Search. –

Odpowiedz

4

Zgadzam się z Andrei M. Najlepszym rozwiązaniem jest pamięć typu "blob" z usługą tabeli lub nawet bazą danych SQL do przechowywania referencji.

Jeszcze jedna rzecz, jeśli planujesz wyszukać zawartość w tych plikach, żadna usługa table/blob nie będzie na to dobra. W takim przypadku zalecamy ustawienie maszyny wirtualnej z elastycznym wyszukiwaniem/solr i zindeksowanie tych treści.

PS: istnieje również usługa Azure Search, do której możesz również spróbować.

+1

Teraz można wyszukiwać w Blob. https://docs.microsoft.com/en-us/azure/search/search-howto-indexing-azure-blob-storage Dokumenty indeksujące w magazynie Azure Blob z usługą Azure Search Indeksator obiektów typu blob może wyodrębniać tekst z następujące formaty dokumentów: PDF formaty Microsoft Office: DOCX/DOC, XLSX/XLS, PPTX/PPT, MSG (Outlook e-maile) HTML XML pocztowy EML pliki tekstowe JSON (patrz funkcję indeksowania JSON plamy preview) CSV (zobacz Indeksowanie podglądu obiektów blobowych CSV) –

5

Przechowywanie plam jest lepsze niż przechowywanie w tabeli, jeśli chcesz pracować z plikami. Zdecydowanie nie chciałbym zajmować się porcjami plików w tabeli. Jeśli chcesz zachować odniesienia do twoich obiektów blob, to co z łączeniem dwóch opcji i używanie tabeli przechowywania referencji? Myślę, że byłby to najlepszy pod względem wydajności :).

+0

Zapytania punktowe (z kluczem partycji i kluczem wiersza) są bardzo szybkie przy przechowywaniu w tabeli. Trzeba by samemu wykonać test perfekcyjny, ale fakt ten czyni odpowiedź Andrei tym bardziej prawdziwą. –

+0

Nawet pracując z ciągami, blob jest szybszy. Testowałem. Odzyskaj 2kb z pliku w obszarze typu blob lub z magazynu tabeli? Blob wygrywa 9 ou z 10 –

Powiązane problemy