如何在“vertexai”中对预训练(野牛)聊天模型的令牌进行编码/解码?

Nei*_*ski 6 google-ai-platform google-cloud-vertex-ai

vertexai预训练的聊天和文本模型(例如bison)中是否存在与 tiktoken 等效的东西google.cloud.aiplatform

我希望能够在发送请求之前对令牌进行计数,以便我可以通过编程方式确定将哪些信息以及多少信息放入contextexamplesmessage_history属性中。

我能找到的最接近的东西是对返回所使用的计费令牌的 API 端点的引用:https://cloud.google.com/vertex-ai/docs/generative-ai/get-token-count。我不想仅仅为了获得计数而进行缓慢的 HTTPS 往返。

此外,send_message当输入大小是导致其无法用作截断信号的原因时,异常并不清楚。例外的是这个相当模糊的消息:

400 无法处理请求。最可能的原因是提供的输入超出了模型的输入令牌限制。