假设我在Google Cloud Storage上有一些存储桶/子目录,该存储桶的地址为:
gs://test-monkeys-example/training_data/cats
在这个cats子目录中,我有一堆猫的图像,所有图像都是jpg。我如何在python中循环通过cats子目录并打印出其中的所有文件名?
就像是:
for x in directory('gs://test-monkeys-example/training_data/cats'):
print(x)
显然,目录('gs:// test-monkeys-example / training_data / cats')不是如何执行此操作,而只是psuedocode-我将如何执行此操作?
使用存储模块:
import google.datalab.storage as storage
cats = [o.key for o in storage.Bucket('test-monkeys-example').objects()
if o.key.startswith('training_data/cats')]
这为您提供了此类猫的清单。
另外,您可以使用Objects
该类:
cats = [o.key for o in storage.Objects('test-monkeys-example', '', '')
if o.key.startswith('training_data/cats')]
如果不需要将列表放在变量中,则可以使用%gcs
魔术,它更容易:
%gcs list -o gs://test-monkeys-example/training_data/cats/*
这将显示键的HTML表。请注意,这是完整的GCS路径,以开头gs://
。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句