Cloud ML无法在Google Cloud Storage上找到文件

100

阿迪亚·鲍德（Aditya Borde）

我正在使用以下命令读取数据文件：

data_dir = arguments['data_dir']
data = pd.read_csv(data_dir + "/train.csv")

我正在使用这些数据在Google Cloud ML上训练我的模型，我能够成功安排工作，但在提取文件时遇到以下IO错误：

IOError: File gs://cloud-bucket/data/train.csv does not exist

该文件的地址正确，因为我已使用上述存储桶中的控制台上传了该文件。另外，Cloud ML在与我的存储桶相同的区域中工作并配置有相同的项目

rhaertel80

GCS不是POSIX文件系统，因此，您通常不能使用“常规”文件库来处理GCS上的文件（例如，请参见this，this和this），当然包括便利功能，例如pd.read_csv。

对于大熊猫，您可以传递文件句柄，因此，根据上述文章，我建议使用TensorFlow的文件包装器，该文件包装器可以从GCS或标准POSIX文件系统读取，以使您能够在本地和云上运行相同的代码：

from tensorflow.python.lib.io import file_io

data_dir = arguments['data_dir']
with file_io.FileIO(data_dir + "/train.csv", mode ='r') as f:
  data = pd.read_csv(f)

在提交云作业之前，通过在本地运行代码并传递GCS文件名来测试代码也可能会有所帮助。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-28

我来说两句

0 条评论

登录后参与评论

上一篇：对ConcurrentHashMap的写入是否可立即用于所有后续Servlet请求？

在Google Cloud ML中写入文件

如何在google-cloud-ml作业或Google Cloud Storage中加载numpy npz文件？

如何读取 Google Cloud Storage 上的私有文件

Google Cloud Storage与Google Cloud CDN

使用Google Cloud Dataflow合并Google Cloud Storage中的文件

从Cloud Function（Python）写入Google Cloud Storage

Google Cloud ML Engine培训师是否必须明确知道Google Cloud Storage URI？

我无法在“ dev_appserver.py”上创建Google Cloud Storage文件。

TensorBoard无法读取Google Cloud Storage上的摘要

Google Cloud 构建无法找到 git 路径

Hadoop无法连接到Google Cloud Storage

无法签署Google Cloud Storage的URL

Alamofire无法将文件上传到Google Cloud Storage

无法使用Firebase功能删除Google Cloud Storage文件

从Google Cloud上运行的Cloud访问Cloud SQL

Google Cloud ML Tensorflow版本

用于推荐的 Google Cloud ML

Google Cloud：如何在 Cloud Datalab 中使用 Cloud ML

在Google Cloud Storage上还原存储桶

Google Cloud Storage上的gsutil zip目录

Cloud ML的Google存储（gs）包装文件输入/输出？

从Google Cloud Storage流式传输文件

Google Cloud Storage加入多个csv文件

如何从Google Cloud Storage解密文件？

Google Cloud Storage中的Concat Avro文件

无法使用Google Cloud Storage和Cloud Functions for Firebase下载文件

在Google Cloud Shell上设置环境以使用Cloud ML时出错

无法在Google Cloud Run上安装jsonnet

Google Cloud Storage ACL混淆

TOP 榜单

文章

Cloud ML无法在Google Cloud Storage上找到文件

Cloud ML无法在Google Cloud Storage上找到文件

UITableView的项目向下滚动后更改颜色，然后快速备份

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Mac OS X更新后的GRUB 2问题

验证REST API参数

Java Eclipse中的错误13，如何解决？

带有错误“ where”条件的查询如何返回结果？

ggplot：对齐多个分面图-所有大小不同的分面

尝试反复更改屏幕上按钮的位置 - kotlin android studio

如何从视图一次更新多行（ASP.NET - Core）

计算数据帧中每行的NA

蓝屏死机没有修复解决方案

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

离子动态工具栏背景色

VB.net将2条特定行导出到DataGridView

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

在Windows 7中无法删除文件（2）

python中的boto3文件上传

当我尝试下载 StanfordNLP en 模型时，出现错误

Node.js中未捕获的异常错误，发生调用