将gsutil输出到文件

Lam*_*lex 2 pipe google-cloud-storage gsutil

问候StackOverflow,

我正在开发一个Windows上的小项目,需要读取GSUTIL复制功能的输出.问题是,复制功能的输出似乎不能通过标准输出工作.此外,GSUTIL的行为不一致:管道输出不能与复制功能一起使用,但使用列表功能确实有效.

当我在命令提示符中使用以下命令时,输出将显示在命令提示符中,但不会重定向到文本文件.此命令无法正常工作:

C:\gsutil> python gsutil cp "file://C:/test_files/*" gs://gs_teststore/ > gsutil_cp.txt
Run Code Online (Sandbox Code Playgroud)

另一方面,当我使用list函数(ls)时,输出通过标准输出工作,并在我希望的工作:

C:\gsutil> python gsutil ls gs://gs_teststore/ > gsutil_ls.txt
Run Code Online (Sandbox Code Playgroud)

有没有办法从GSUTIL的复制功能中捕获输出?

jte*_*ace 8

您可以使用-L选项生成已复制的所有文件的清单文件.从文档:

-L <file>输出清单日志文件,其中包含有关已复制的每个项目的详细信息.此清单包含每个项目的以下信息:

  • 源路径.
  • 目的地路径.
  • 来源大小.
  • 字节转移.
  • MD5哈希.
  • UTC日期和时间传输以ISO 8601格式启动.
  • UTC日期和时间传输以ISO 8601格式完成.
  • 如果执行了可恢复上传,则上传ID.
  • 尝试上传,成功或失败的最终结果.
  • 失败详情,如果有的话.

一个具体的例子:

$ echo "hey" | gsutil cp -L manifest.txt - gs://mybucket/hey.txt
Copying from <STDIN> [Content-Type=application/octet-stream]...

$ cat manifest.txt 
Source,Destination,Start,End,Md5,UploadId,Source Size,Bytes Transferred,Result,Description
file://-,gs://mybucket/hey.txt,2013-05-29T21:29:31.847715Z,2013-05-29T21:29:32.115624Z,081ecc5e6dd6ba0d150fc4bc0e62ec50,,,0,OK,
Run Code Online (Sandbox Code Playgroud)


Mik*_*rtz 8

Jeff关于使用gsutil cp -L的答案是您尝试做的正确解决方案.

只是补充一些细节,说明为什么你无法按照预期的方式捕获gsutil cp输出:gsutil将状态消息输出到stderr,只有当有问题的输出是你命令的目的时才输出到stdout运行.因此,例如,gsutil ls输出到stdout,因为输出是命令的目的,而相反,gsutil cp命令的进度指示器消息实际上是关于底层目的(复制数据)的状态 - 所以输出转到stderr.

Google云存储团队Mike Schwartz