我正在使用 langchain 来处理 Mongo 数据库中的一大堆文档。
我可以使用 langchain 将所有文档加载到 chromadb 矢量存储中。这里没有什么花哨的事情。这是我的代码:
from langchain.embeddings.openai import OpenAIEmbeddings
embeddings = OpenAIEmbeddings()
from langchain.vectorstores import Chroma
db = Chroma.from_documents(docs, embeddings, persist_directory='db')
db.persist()
Run Code Online (Sandbox Code Playgroud)
现在,存储数据后,我想获取所有带有 id 的文档和嵌入的列表。
这样我就可以将它们存储回 MongoDb 中。
我还想将它们通过 Bertopic 来获取主题类别。
问题1:如何获取刚刚存储在Chroma 数据库中的所有文档?我想要文档和所有元数据。
非常感谢您的帮助!
我正在使用 python 处理 langchain 和 ChromaDb。
现在,我知道如何使用文档加载器。例如,下面将一堆文档加载到 ChromaDb 中:
from langchain.embeddings.openai import OpenAIEmbeddings
embeddings = OpenAIEmbeddings()
from langchain.vectorstores import Chroma
db = Chroma.from_documents(docs, embeddings, persist_directory='db')
db.persist()
Run Code Online (Sandbox Code Playgroud)
但是如果我想一次添加一个文档怎么办?更具体地说,我想在添加文档之前检查该文档是否存在。这样我就不会不断添加重复项。
如果文档不存在,只有那时我才想要获取嵌入并添加它。
我如何使用 langchain 来做到这一点?我想我主要了解 langchain,但不知道如何完成这样看似基本的任务。
我是一名新手程序员,也是Google App Engine和webapp2等的新手.所以这可能是一个非常基本的问题.
我正在创建一个将图像存储到BlobStore的应用程序.我的模型存储描述,blob_key,图像URL和日期.
我能够保存所有东西,所以这一点都没关系.
但是现在我想创建一个删除按钮,它不仅会删除数据存储区中的项目,还会删除保存在blobstore中的图像.
我创建了一个DeleteHandler,并在html中有一个表单,传递我想要删除的项的键.在DeleteHandler中,我使用发布的密钥从数据存储中删除项目.我也在尝试使用密钥来删除保存在blobstore中的图像.
到目前为止,我在删除表单帖子上得到了404,即使我已经过去了,我也不确定我的DeleteHandler是否正确处理我正在寻找的功能.
任何帮助将非常感激..
Main.py:
import os
import urllib
import webapp2
from google.appengine.ext.webapp import template
from google.appengine.ext import blobstore
from google.appengine.ext.webapp import blobstore_handlers
from google.appengine.api import images
#Models
from google.appengine.ext import db
class ImageItem(db.Model):
description = db.StringProperty(required=True)
img_url = db.StringProperty()
blob_key = blobstore.BlobReferenceProperty()
when = db.DateTimeProperty(auto_now_add=True)
#Handlers (Views)
class MainHandler(webapp2.RequestHandler):
def get(self):
upload_url = blobstore.create_upload_url('/upload')
imgs = db.GqlQuery(
'SELECT * FROM ImageItem '
'ORDER BY when DESC')
imgs_dict = {'imgs': imgs}
self.response.out.write( template.render( 'main.html',locals() ) …Run Code Online (Sandbox Code Playgroud) 使用Google Document API,我正在尝试创建新文档,并在我的Google文档中提供特定文件夹中所有当前文档的列表.我开始使用python开发,所以我仍然有点粗糙.
我想做的事情:
我相信我正在使用Google Docs API 3.0并且正在使用gdata-2.0.16 helper for python.
代码到目前为止:
import gdata.docs.data
import gdata.docs.client
class SampleConfig(object):
APP_NAME = 'GDataDocumentsListAPISample-v1.0'
DEBUG = False
client = gdata.docs.client.DocsClient()
client.ClientLogin('[email_address]','[password]',source=SampleConfig.APP_NAME )
col = gdata.docs.data.Resource(type='folder', title='Folder Name')
col = client.CreateResource(col)
doc = gdata.docs.data.Resource(type='document', title='I did this')
doc = client.CreateResource(doc, collection=col)
所以现在回答问题:我无可救药地陷入困境:
我知道我离这里已经很远了,但是你能提供的任何帮助或建议都会很棒.
提前致谢!
我是 Nuxt JS 的新手。我想弄清楚如何从远程 URL 源下载 JSON 文件以在本地使用作为 nuxt 构建过程的一部分?
例如,如果 JSON 文件位于:
https://path/to/my/json
Run Code Online (Sandbox Code Playgroud)
然后在我的 nuxt 应用程序中,我不想远程连接到该 JSON 文件,而是在本地使用它。因此,当我发布我的网站时,我不希望它依赖于外部资源。
目前,我正在使用该gulp-download-files插件通过 gulp 来完成此操作。