Pożyczanie od similar question, jedną z opcji pobrania pełnej listy kluczy obiektów z przedrostka bucket + jest użycie rekursji z użyciem metody list_objects_v2.
Ta metoda rekursywnie pobierze listę kluczy obiektów po 1000 kluczy jednocześnie.
Każde żądanie do list_objects_v2
używa argumentu StartAfter
, aby kontynuować wyświetlanie kluczy po ostatnim kluczu z poprzedniego żądania.
import boto3
if __name__ == '__main__':
client = boto3.client('s3',
aws_access_key_id = 'access_key',
aws_secret_access_key = 'secret_key'
)
def get_all_object_keys(bucket, prefix, start_after = '', keys = []):
response = client.list_objects_v2(
Bucket = bucket,
Prefix = prefix,
StartAfter = start_after
)
if 'Contents' not in response:
return keys
key_list = response['Contents']
last_key = key_list[-1]['Key']
keys.extend(key_list)
return get_all_object_keys(bucket, prefix, last_key, keys)
object_keys = get_all_object_keys('your_bucket', 'prefix/to/files')
print(len(object_keys))