Pierwszy punkt: pyton db-api.cursor
jest iterator, więc chyba naprawdę trzeba załadować całą partię w pamięci na raz, można po prostu zacząć przy użyciu tej funkcji, czyli zamiast:
cursor.execute("SELECT * FROM mytable")
rows = cursor.fetchall()
for row in rows:
do_something_with(row)
może po prostu:
cursor.execute("SELECT * FROM mytable")
for row in cursor:
do_something_with(row)
Następnie, jeśli realizacja Twojego łącznika db nadal nie czyni właściwego wykorzystania tej funkcji, to będzie czas, aby dodać LIMIT i OFFSET do mieszanki:
cursor.execute("SELECT count(*) FROM mytable")
count = cursor.fetchone()[0]
batch_size = 42 # whatever
for offset in xrange(0, count, batch_size):
cursor.execute(
"SELECT * FROM mytable LIMIT %s OFFSET %s",
(batch_size, offset))
for row in cursor:
do_something_with(row)
Twoje rozwiązanie jest o wiele czystsze niż moje! –