我是机器学习的新手,但在过去的两天里我读了很多关于强化学习的内容。我有一个获取项目列表的应用程序(例如从 Upwork)。有一个主持人可以手动接受或拒绝项目(基于下面解释的一些参数)。如果项目被接受,我想发送项目提案,如果被拒绝,我将忽略它。我希望用人工智能取代该主持人(以及其他原因),所以我想知道我应该使用哪种强化算法。
参数:下面列出了一些决定代理是否接受或拒绝项目的参数。假设我只想接受与 Web 开发相关的项目(特别是后端/服务器端),这里是参数应如何影响代理。
我认为 Q-Learning 或 SARSA 能够帮助我,但我看到的大多数例子都与悬崖行走问题有关,其中各州相互依赖,这不适用于我的情况,因为每个项目都不同于前一个。
注意:我希望代理能够自学,这样如果将来我也开始奖励它前端项目,它应该学习这种行为。因此,提出“纯粹的”监督学习算法是行不通的。
编辑 1:我想补充一点,我有 3000 个项目的数据(部门、类别、标题、雇主评级等)以及该项目是否被我的主持人接受或拒绝。
我试图让我的应用程序仅在纵向和反向纵向模式下工作(而不是横向)。这是我的应用程序的 SDK 详细信息
minSdkVersion 15
targetSdkVersion 23
Run Code Online (Sandbox Code Playgroud)
在 AndroidManifest.xml 文件中,我在每个活动标签中都有以下行
android:screenOrientation="sensorPortrait"
Run Code Online (Sandbox Code Playgroud)
我尝试了很多其他答案,但没有一个对我有用。请帮我解决这个问题。谢谢。
I am trying to get the POST and GET requests working (via Postman) but this is what I'm getting,
GET Request
curl -X GET http://localhost:8080/api/v1/namespaces/default/pods/mypod/exec
Run Code Online (Sandbox Code Playgroud)
GET Response
{
"kind": "Status",
"apiVersion": "v1",
"metadata": {
},
"status": "Failure",
"message": "the server could not find the requested resource",
"reason": "NotFound",
"details": {
},
"code": 404
}
Run Code Online (Sandbox Code Playgroud)
POST Request
curl -X POST 'http://localhost:8080/api/v1/namespaces/default/pods/mypod/exec?command=ls&container=my-container&stderr=true&stdout=true'
Run Code Online (Sandbox Code Playgroud)
POST Response
{
"kind": "Status",
"apiVersion": "v1",
"metadata": {
},
"status": "Failure",
"message": "Upgrade request required",
"reason": "BadRequest",
"code": 400 …Run Code Online (Sandbox Code Playgroud)