ChatGPT 的网络界面可以轻松上传 pdf 文件。openAI 有没有可以接收 pdf 的 API?
我知道有 3rd 方库可以读取 pdf,但考虑到 pdf 中有图像和其他重要信息,如果像 GPT 4 Turbo 这样的模型提供实际的 pdf 可能会更好。
我将陈述我的用例以添加更多上下文。我打算做RAG。这是我的pdf,这是提示。通常我会在提示末尾附加文本。如果我自己提取pdf文件,我仍然可以做到这一点。
这就是我应该做的吗?代码来自此处https://platform.openai.com/docs/assistants/tools/code-interpreter
# Upload a file with an "assistants" purpose
file = client.files.create(
file=open("example.pdf", "rb"),
purpose='assistants'
)
# Create an assistant using the file ID
assistant = client.beta.assistants.create(
instructions="You are a personal math tutor. When asked a math question, write and run code to answer the question.",
model="gpt-4-1106-preview",
tools=[{"type": "code_interpreter"}],
file_ids=[file.id]
)
Run Code Online (Sandbox Code Playgroud)
还有一个上传端点,但这些端点的目的似乎是用于微调和助手。我认为 RAG 用例是一个正常的用例,与助手没有必然关系。
我只是采用 Eventbridge ETL 设计模式,但在部署时它给了我这个错误:
\n[100%] 失败: docker login --username AWS --password-stdin https://315997497220.dkr.ecr.us-west-2.amazonaws.com退出,错误代码 1:
\n\n\n\xe2\x9d\x8c the-eventbridge-etl 失败:错误:无法发布一个或多个\nassets。请参阅上面的错误消息以获取更多信息。在\nObject.publishAssets\n(/home/mubashir/.nvm/versions/node/v16.3.0/lib/node_modules/aws-cdk/lib/util/asset-publishing.ts:25:11)\nat processTicksAndRejections (节点:内部/进程/task_queues:96:5)\ nat Object.deployStack \ n(/home/mubashir/.nvm/versions/node/v16.3.0/lib/node_modules/aws-cdk/lib/api/deploy- stack.ts:237:3)\nat CdkToolkit.deploy\n(/home/mubashir/.nvm/versions/node/v16.3.0/lib/node_modules/aws-cdk/lib/cdk-toolkit.ts:194: 24)\nat initCommandLine\n(/home/mubashir/.nvm/versions/node/v16.3.0/lib/node_modules/aws-cdk/bin/cdk.ts:267:9)\n无法发布一项或多项资产。请参阅上面的错误消息以了解\n更多信息。
\n
我采取的步骤。Github 仓库有一个我关注的视频
\nnpx cdkp init the-eventbridge-etl --lang=python\ncd the-eventbridge-etl\npython3 -m venv .env\nsource .env/bin/activate\npip install -r requirements.txt\ncdk synth\ncdk deploy\nRun Code Online (Sandbox Code Playgroud)\n我收到的第一个错误与引导有关。所以我引导。
\nexport CDK_NEW_BOOTSTRAP=1\nnpx cdk bootstrap aws://315997497220/us-east-2 --cloudformation-execution-policies arn:aws:iam::aws:policy/AdministratorAccess --trust 315997497220 aws://315997497220/us-east-2\nRun Code Online (Sandbox Code Playgroud)\n我自然地更新了 cdk.json 文件以使用上述引导技术。我已经尝试了所有引导技术,无论是否带有限定符,以及随后对 cdk.json 的更改。我不认为这是引导程序问题。
\n我收到上述错误,但我不知道问题是什么。我没有对代码进行任何更改。
\n