我对使用 Microsoft 的认知服务还很陌生。我想知道 MS Computer Vision API 和 MS Custom Vision API 有什么区别?
我已完成此快速入门,并创建了 Azure OpenAI 资源 + 创建了状态成功的模型部署。我还在https://oai.azure.com/中尝试过它并且它在那里工作。
但是,如果我尝试从 REST API 访问它,则会返回 404 Resource Not Found。我定义了header,并从 Playground 内部的->api-key
获取了 url 和 json 。Code View
json
我正在执行
发布 https://raz-openai.openai.azure.com/openai/deployments/raz-model-2/completions?api-version=2022-12-01 {“提示”:“”,“max_tokens”:100 }带有 api-key 标头
我还错过了另一个步骤吗?
我在 Unity 中使用 Microsoft.CognitiveServices.Speech ( https://www.nuget.org/packages/Microsoft.CognitiveServices.Speech )。
在具有 Windows 目标的编辑器中,一切工作正常,但我在 Linux 专用服务器构建(在 Ubuntu 22.04 LTS 上运行)中遇到错误。
错误:
ApplicationException: Runtime error: Failed to initialize platform (azure-c-shared). Error: 2153
at Microsoft.CognitiveServices.Speech.Internal.SpxExceptionThrower.ThrowIfFail (System.IntPtr hr) [0x0005d] in <439ae8e654bd4287a1d7ffd07bb64d43>:0
at Microsoft.CognitiveServices.Speech.SpeechSynthesizer.FromConfig (Microsoft.CognitiveServices.Speech.SpeechConfig speechConfig, Microsoft.CognitiveServices.Speech.Audio.AudioConfig audioConfig) [0x00030] in <439ae8e654bd4287a1d7ffd07bb64d43>:0
at Microsoft.CognitiveServices.Speech.SpeechSynthesizer..ctor (Microsoft.CognitiveServices.Speech.SpeechConfig speechConfig, Microsoft.CognitiveServices.Speech.Audio.AudioConfig audioConfig) [0x00000] in <439ae8e654bd4287a1d7ffd07bb64d43>:0
at Evo.TTS.TTSClientMicrosoft.ConvertTextToSpeechAsync (Evo.Gender gender, System.String text) [0x0004c] in <dbdd55022f014a4e90cc144f717d0703>:0
at Evo.TTS.TTSClient.ConvertTextToSpeechAsync (Evo.Gender gender, System.String text) [0x00073] in <dbdd55022f014a4e90cc144f717d0703>:0
at Evo.TTS.VoiceController.TextToAudioData (System.String text) [0x0007c] in <dbdd55022f014a4e90cc144f717d0703>:0
at Evo.TTS.VoiceController.CmdSpeak (System.String …
Run Code Online (Sandbox Code Playgroud) 我想使用Microsoft的REST API转录更长的音频文件(至少5分钟)。有很多不同的产品和名称,例如语音服务API或Bing语音API。到目前为止,我尝试过的REST API都不支持转录更长的音频文件。
该文档指出有一个完全适合这种情况的REST API:https : //docs.microsoft.com/zh-cn/azure/cognitive-services/speech-service/batch-transcription
该服务的终点是什么?
speech-to-text microsoft-speech-api azure-cognitive-services
我正在尝试在 Azure 中部署表单识别器应用程序的实例。为此,我遵循文档中的说明:https : //docs.microsoft.com/en-us/azure/cognitive-services/form-recognizer/deploy-label-tool
我已经创建了 docker 实例和连接,但是创建 APP 的步骤失败了。这是我正在使用的参数:
Display Name: Test-form
Source Connection: <previuosly created connection>
Folder Path: None
Form Recognizer Service Uri: https://XXX-test.cognitiveservices.azure.com/
API Key: XXXXX
Description: None
Run Code Online (Sandbox Code Playgroud)
这是错误并得到:
我们正在使用标准层的 Azure OpenAI gpt-3.5-turbo 模型对聊天机器人应用程序进行原型设计。
我们面临着随机的延迟突发,有时会持续 3 到 20 分钟。下面是门户网站提供的指标的屏幕截图。正如您所看到的,使用/速率限制并不表示高负载。
事实上,该应用程序尚未部署到生产环境中,它仅被我们的开发团队用于测试目的。了解这些延迟峰值将帮助我们证明我们的 PoC 并在生产中使用 Azure OpenAI 服务。
关于如何解决这个问题有什么想法吗?
模型属性 模型名称:gpt-35-turbo 模型版本:0301 部署类型:标准 内容过滤器:每分钟默认令牌数 速率限制(千):120 速率限制(每分钟令牌数):120000 速率限制(每分钟请求数):720
图表
我正在尝试使用 Microsoft 认知服务的 Vision API(分析图像)。我想知道如何通过 REST API 调用将本地图像发送到 Vision API,并使用 Python 请求结果。有人可以帮我解决这个问题吗?
Microsoft 在其网站上提供的测试选项仅接受 URL,我尝试将本地路径转换为 URL 并将其作为输入,但这不起作用。
我正在使用Azure认知服务自定义视觉服务来检测捕获图像中的形状.根据他们的文档,我按照他们的格式得到了回复.
但是我在绘制图像上方的形状时遇到了问题.
{
"id": "0fbda4ee-8956-4979-bf57-a252441af98d",
"project": "9ca4032b-beeb-40ad-9396-1c3fcfd9ba89",
"iteration": "27c85265-a158-4fc4-b22a-d535dd758d80",
"created": "2018-06-11T09:34:29.9496528Z",
"predictions": [
{
"probability": 0.0102891214,
"tagId": "677afcf8-bc4a-493f-b588-707663286125",
"tagName": "ball",
"boundingBox": {
"left": 0.2889924,
"top": 0.0169312358,
"width": 0.7007024,
"height": 0.8284572
}
},
{
"probability": 0.012788726,
"tagId": "ca844f08-b6c0-4d9a-9010-73945d442708",
"tagName": "cricket ball",
"boundingBox": {
"left": 0.304018974,
"top": 0.413163722,
"width": 0.299461246,
"height": 0.436399817
}
},
{
"probability": 0.0229086485,
"tagId": "ca844f08-b6c0-4d9a-9010-73945d442708",
"tagName": "cricket ball",
"boundingBox": {
"left": 0.2889924,
"top": 0.0169312358,
"width": 0.7007024,
"height": 0.8284572
}
},
{
"probability": 0.0100123268,
"tagId": "4672144d-5593-446f-be63-5144a35d0e6e",
"tagName": …
Run Code Online (Sandbox Code Playgroud) computer-vision microsoft-cognitive azure-cognitive-services
使用 Microsoft Speech API 转录中型/大型音频文件(每个文件约 6-10 分钟)的最佳方法是什么?像批量音频文件转录之类的东西?
我使用了https://learn.microsoft.com/en-us/azure/cognitive-services/speech-service/speech-to-text-sample中提供的代码来连续转录语音,但它在某些时候停止转录观点。转录有什么限制吗?我只使用免费试用帐户 atm。
顺便说一句,我认为 Bing Speech API 和新的语音服务 API 之间没有区别,对吗?
感谢大家!
speech-recognition speech-to-text bing-api microsoft-speech-api azure-cognitive-services
我正在按照 Microsoft 的教程(https://learn.microsoft.com/nl-nl/azure/cognitive-services/Computer-vision/quickstarts-sdk/client-library?pivots=programming-language-python)来使用认知服务。我在这里使用 Visual Code 并使用命令行通过 pip 安装 Azure:
pip install azure-cognitiveservices-vision-customvision
Run Code Online (Sandbox Code Playgroud)
我使用第一个代码(参见下面的代码)并尝试运行代码。但它返回以下错误:
(myvenv) PS C:\Users\erikh\OneDrive\Documenten\Git\Python Testlab> & "c:/Users/erikh/OneDrive/Documenten/Git/Python Testlab/myvenv/Scripts/python.exe" "c:/Users/erikh/OneDrive/Documenten/Git/Python Testlab/readText.py"
Traceback (most recent call last):
File "c:/Users/erikh/OneDrive/Documenten/Git/Python Testlab/readText.py", line 1, in <module>
from azure.cognitiveservices.vision.computervision import ComputerVisionClient
ModuleNotFoundError: No module named 'azure.cognitiveservices'
Run Code Online (Sandbox Code Playgroud)
这是我尝试执行的代码:
from azure.cognitiveservices.vision.computervision import ComputerVisionClient
from azure.cognitiveservices.vision.computervision.models import OperationStatusCodes
from azure.cognitiveservices.vision.computervision.models import VisualFeatureTypes
from msrest.authentication import CognitiveServicesCredentials
from array import array
import os
from PIL import Image
import sys
import time
# Add your Computer …
Run Code Online (Sandbox Code Playgroud) azure ×5
python ×2
.net ×1
api ×1
azure-openai ×1
bing-api ×1
c# ×1
docker ×1
gpt-3 ×1
openai-api ×1
python-3.x ×1
vision-api ×1