小编use*_*793的帖子

使用 Python 和 langchain 从 ChromaDb 获取所有文档

我正在使用 langchain 来处理 Mongo 数据库中的一大堆文档。

我可以使用 langchain 将所有文档加载到 chromadb 矢量存储中。这里没有什么花哨的事情。这是我的代码:


from langchain.embeddings.openai import OpenAIEmbeddings
embeddings = OpenAIEmbeddings()

from langchain.vectorstores import Chroma
db = Chroma.from_documents(docs, embeddings, persist_directory='db')
db.persist()

Run Code Online (Sandbox Code Playgroud)

现在,存储数据后,我想获取所有带有 id 的文档和嵌入的列表。

这样我就可以将它们存储回 MongoDb 中。

我还想将它们通过 Bertopic 来获取主题类别。

问题1:如何获取刚刚存储在Chroma 数据库中的所有文档?我想要文档和所有元数据。

非常感谢您的帮助!

langchain chromadb py-langchain

12
推荐指数
2
解决办法
2万
查看次数

ChromaDb 添加单个文档,仅当它不存在时

我正在使用 python 处理 langchain 和 ChromaDb。

现在,我知道如何使用文档加载器。例如,下面将一堆文档加载到 ChromaDb 中:

from langchain.embeddings.openai import OpenAIEmbeddings
embeddings = OpenAIEmbeddings()

from langchain.vectorstores import Chroma
db = Chroma.from_documents(docs, embeddings, persist_directory='db')
db.persist()
Run Code Online (Sandbox Code Playgroud)

但是如果我想一次添加一个文档怎么办?更具体地说,我想在添加文档之前检查该文档是否存在。这样我就不会不断添加重复项。

如果文档不存在,只有那时我才想要获取嵌入并添加它。

我如何使用 langchain 来做到这一点?我想我主要了解 langchain,但不知道如何完成这样看似基本的任务。

python langchain chromadb

12
推荐指数
2
解决办法
1万
查看次数

如何在Google App Engine(Python)中处理删除

我是一名新手程序员,也是Google App Engine和webapp2等的新手.所以这可能是一个非常基本的问题.

我正在创建一个将图像存储到BlobStore的应用程序.我的模型存储描述,blob_key,图像URL和日期.

我能够保存所有东西,所以这一点都没关系.

但是现在我想创建一个删除按钮,它不仅会删除数据存储区中的项目,还会删除保存在blobstore中的图像.

我创建了一个DeleteHandler,并在html中有一个表单,传递我想要删除的项的键.在DeleteHandler中,我使用发布的密钥从数据存储中删除项目.我也在尝试使用密钥来删除保存在blobstore中的图像.

到目前为止,我在删除表单帖子上得到了404,即使我已经过去了,我也不确定我的DeleteHandler是否正确处理我正在寻找的功能.

任何帮助将非常感激..

Main.py:

import os
import urllib
import webapp2
from google.appengine.ext.webapp import template
from google.appengine.ext import blobstore
from google.appengine.ext.webapp import blobstore_handlers
from google.appengine.api import images
#Models
from google.appengine.ext import db

class ImageItem(db.Model):
    description = db.StringProperty(required=True)
    img_url = db.StringProperty()
    blob_key = blobstore.BlobReferenceProperty()
    when = db.DateTimeProperty(auto_now_add=True)


#Handlers (Views)
class MainHandler(webapp2.RequestHandler):
  def get(self):
    upload_url = blobstore.create_upload_url('/upload')
    imgs = db.GqlQuery(
        'SELECT * FROM ImageItem '
        'ORDER BY when DESC')
    imgs_dict = {'imgs': imgs}
    self.response.out.write( template.render( 'main.html',locals() ) …
Run Code Online (Sandbox Code Playgroud)

python google-app-engine blobstore webapp2

9
推荐指数
1
解决办法
2388
查看次数

使用Python的Google Docs API

使用Google Document API,我正在尝试创建新文档,并在我的Google文档中提供特定文件夹中所有当前文档的列表.我开始使用python开发,所以我仍然有点粗糙.

我想做的事情:

  1. 如果该名称尚不存在,则仅创建名称为[文件夹名称]的集合(或文件夹)
  2. 在[文件夹名称]中创建文档
  3. 仅从[文件夹名称]获取文档列表以及文档本身的链接

我相信我正在使用Google Docs API 3.0并且正在使用gdata-2.0.16 helper for python.

代码到目前为止:


    import gdata.docs.data
    import gdata.docs.client

    class SampleConfig(object):
        APP_NAME = 'GDataDocumentsListAPISample-v1.0'
        DEBUG = False

    client = gdata.docs.client.DocsClient()
    client.ClientLogin('[email_address]','[password]',source=SampleConfig.APP_NAME )

    col = gdata.docs.data.Resource(type='folder', title='Folder Name')
    col = client.CreateResource(col)

    doc = gdata.docs.data.Resource(type='document', title='I did this')
    doc = client.CreateResource(doc, collection=col)

所以现在回答问题:我无可救药地陷入困境:

  1. 如何检查[文件夹名称]是否存在?
  2. 如何检索仅[文件夹名称]的内容?
  3. 如何获取我在此文件夹中创建的所有文档的绝对链接?

我知道我离这里已经很远了,但是你能提供的任何帮助或建议都会很棒.

提前致谢!

python gdata-api google-docs-api

5
推荐指数
1
解决办法
3377
查看次数

如何在 Nuxt 构建过程中访问远程数据并将其写入文件?

我是 Nuxt JS 的新手。我想弄清楚如何从远程 URL 源下载 JSON 文件以在本地使用作为 nuxt 构建过程的一部分?

例如,如果 JSON 文件位于:

https://path/to/my/json
Run Code Online (Sandbox Code Playgroud)

然后在我的 nuxt 应用程序中,我不想远程连接到该 JSON 文件,而是在本地使用它。因此,当我发布我的网站时,我不希望它依赖于外部资源。

目前,我正在使用该gulp-download-files插件通过 gulp 来完成此操作。

json vue.js nuxt.js

4
推荐指数
1
解决办法
3483
查看次数