如何从 AWS Lambda 中的 s3 存储桶读取 csv 文件？

Question

如何从 AWS Lambda 中的 s3 存储桶读取 csv 文件？

Ang*_*iri 4 python amazon-s3 boto3 aws-lambda aws-serverless

我正在尝试读取上传到 s3 存储桶上的 csv 文件的内容。为此，我从触发 lambda 函数的事件中获取存储桶名称和文件键，并逐行读取。这是我的代码：

import json
import os
import boto3
import csv

def lambda_handler(event,  context):
    for record in event['Records']:
        bucket = record['s3']['bucket']['name']
        file_key = record['s3']['object']['key']
        s3 = boto3.client('s3')
        csvfile = s3.get_object(Bucket=bucket, Key=file_key)
        csvcontent = csvfile['Body'].read().split(b'\n')
        data = []
        with open(csvfile['Body'], 'r') as csv_file:
          csv_file = csv.DictReader(csv_file)
          data = list(csv_file)

Run Code Online (Sandbox Code Playgroud)

我在 CloudWatch 上遇到的确切错误是：

[ERROR] TypeError: expected str, bytes or os.PathLike object, not list
Traceback (most recent call last):
  File "/var/task/lambda_function.py", line 19, in lambda_handler
    with open(csvcontent, 'r') as csv_file:

Run Code Online (Sandbox Code Playgroud)

有人可以帮我解决这个问题吗？感谢您提供的任何帮助，因为我是 lambda 的新手

Answer 1

小智 10

要以正确且易于检索的索引格式从 s3 存储桶中获取 CSV 文件数据，下面的代码对我有很大帮助：

key = 'key-name'
bucket = 'bucket-name'
s3_resource = boto3.resource('s3')
s3_object = s3_resource.Object(bucket, key)

data = s3_object.get()['Body'].read().decode('utf-8').splitlines()

lines = csv.reader(data)
headers = next(lines)
print('headers: %s' %(headers))
for line in lines:
    #print complete line
    print(line)
    #print index wise
    print(line[0], line[1])

Run Code Online (Sandbox Code Playgroud)

Answer 2

tza*_*man 7

csvfile = s3.get_object(Bucket=bucket, Key=file_key)
csvcontent = csvfile['Body'].read().split(b'\n')

Run Code Online (Sandbox Code Playgroud)

在这里，您已经检索了文件内容并将其分成几行。我不确定你为什么要open再次尝试某些事情，你可以传递csvcontent给你的读者：

csv_data = csv.DictReader(csvcontent)

Run Code Online (Sandbox Code Playgroud)

归档时间：	6 年，6 月前
查看次数：	23786 次
最近记录：	5 年，8 月前