小智 242
只需在此处添加一条注释:现在已经过了3年,但当您输入"如何搜索S3存储桶"时,此帖子在Google中排名第一.
也许你正在寻找一些更复杂的东西,但是如果你在这里试图弄清楚如何通过它的标题找到一个对象(文件),这很简单:
打开存储桶,在右侧选择"无",然后开始输入文件名.
http://docs.aws.amazon.com/AmazonS3/latest/UG/ListingObjectsinaBucket.html
Abe*_*ker 95
以下是使用AWS CLI执行搜索文件名的简短方法:
aws s3 ls s3://your-bucket --recursive | grep your-search | cut -c 32-
Run Code Online (Sandbox Code Playgroud)
Cod*_*lan 27
S3没有一个本土"搜索这个桶",因为实际内容是未知的-也是,S3是基于有一次,提供一个更ALA传统的数据存储访问许多节点没有本地方向键/值(SELECT * FROM ... WHERE ...)(在SQL模型).
您需要做的是执行ListBucket以获取存储桶中的对象列表,然后迭代执行您实现的自定义操作的每个项目 - 这是您的搜索.
Edu*_*bes 23
有(至少)两种不同的用例,可以描述为"搜索桶":
搜索存储在存储桶中的每个对象内的内容; 这假定了该桶中所有对象的通用格式(比如文本文件)等等.对于这样的事情,你被迫做了Cody Caughlan刚才回答的事情.AWS S3 docs的示例代码显示了如何使用AWS SDK for Java执行此操作:列出键使用AWS SDK for Java(您还可以找到PHP和C#示例).
列表项搜索该存储桶中包含的对象键中的内容; S3 确实对此有部分支持,允许前缀完全匹配+在分隔符后折叠匹配.AWS S3开发人员指南中对此进行了更详细的说明.例如,这允许通过使用类似的对象键来实现"文件夹"
folder/subfolder/file.txt如果遵循此约定,大多数S3 GUI(例如AWS控制台)将显示存储桶的文件夹视图.
Jan*_*sky 19
有多种选择,没有一种是简单的"一次性"全文解决方案:
密钥名称模式搜索:搜索以某些字符串开头的密钥 - 如果您仔细设计密钥名称,那么您可能有相当快速的解决方案.
搜索附加到密钥的元数据:将文件发布到AWS S3时,您可以处理内容,提取一些元信息,并将此元信息以自定义标头的形式附加到密钥中.这使您可以获取密钥名称和标头,而无需获取完整内容.搜索必须顺序完成,没有"sql like"搜索选项.使用大文件可以节省大量网络流量和时间.
将数据库存储在SimpleDB上:如前所述,但将元数据存储在SimpleDB上.这里你有像select语句的sql.在大型数据集的情况下,您可能会遇到SimpleDB限制,这可以克服(跨多个SimpleDB域的分区元数据),但如果您走得很远,您可能需要使用另一个metedata类型的数据库.
内容的连续全文搜索 - 逐个处理所有密钥.非常慢,如果你有太多的钥匙要处理.
我们每天存储1440个文件版本(每分钟一个)几年,使用版本化的存储桶,很容易实现.但是获得一些旧版本需要时间,因为必须按版本顺序进行版本化.有时我使用简单的CSV索引和记录,显示发布时间和版本ID,有了这个,我可以很快地跳转到旧版本.
如您所见,AWS S3不是专为全文搜索而设计的,它是简单的存储服务.
hel*_*bye 19
AWS发布了一个使用SQL查询S3存储桶的新服务:Amazon Athena https://aws.amazon.com/athena/
如果您使用的是 Windows 并且没有时间找到一个不错的grep选择,那么一种快速而肮脏的方法是:
aws s3 ls s3://your-bucket/folder/ --recursive > myfile.txt
然后在 myfile.txt 中进行快速搜索
“文件夹”位是可选的。
PS,如果您没有安装 AWS CLI - 这是使用 Chocolatey 包管理器的单衬
choco install awscli
PPS 如果您没有 Chocolatey 包管理器 - 获取它!您在 Windows 上的生活将变得更好 10 倍。(我与 Chocolatey 没有任何关系,但是嘿,这是必须的,真的)。
我尝试了以下方式
aws s3 ls s3://Bucket1/folder1/2019/ --recursive |grep filename.csv
Run Code Online (Sandbox Code Playgroud)
这输出文件存在的实际路径
2019-04-05 01:18:35 111111 folder1/2019/03/20/filename.csv
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
145190 次 |
| 最近记录: |