Mam duży plik (A.txt
) z 2 GB zawierający listę ciągów znaków ['Question','Q1','Q2','Q3','Ans1','Format','links',...]
.Sprawdź, czy ciąg znaków znajduje się na liście ciągów o wielkości 2 GB w pythonie
Teraz mam inny większy plik (1TB) zawierający powyższe ciągi w 2. pozycji:
wyjściowa:
a, Question, b
The, quiz, is
This, Q1, Answer
Here, Ans1, is
King1, links, King2
programming,language,drupal,
.....
chcę zachować linie, których druga pozycja zawiera ciągi w wykazie przechowywane w pliku A.txt
. Oznacza to, że chcę zachować (sklep w innym pliku) Poniższa wspomniane linie:
a, Question, b
This, Q1, Answer
Here, Ans1, is
King1, links, King2
wiem, jak to zrobić, gdy długość listy w pliku (A.txt) jest 100..using ' każdy'. Ale nie rozumiem, jak powinienem się do tego zabrać, gdy długość listy w pliku (A.txt) wynosi 2 GB.
Wygląda na to, że 0,5 gb właśnie przeskoczyło do 2 GB w edycji ... –
@JonClements: Opcja cofania, sqlite. –
Niezbyt konieczne, ale zapytanie może zostać przepisane jako IN/ANY lub EXISTS - lub jeśli ktoś ma serwer redis lub podobny, który będzie działał ładnie ... –