我正在寻找构建或改编优选基于RL理论的模型,该模型可以解决以下问题.非常感谢任何指导或指示.
我有一个连续的动作空间,可以在10-100(含)范围内选择动作.根据值函数,每个动作与某个强化值相关联,范围从0到1(也包括).到现在为止还挺好.这是我开始介入的地方:
并发症1:
值函数V根据给定动作x和目标动作A之间的距离将动作映射到强化.两者之间的距离越小,强化越大(即,强化与abs(A - x)成反比.但是,对于接近A的动作,值函数仅为非零(abs(A - x)较小)比如说epsilon)和其他地方的零.所以:
**V**正比于1 / abs(**A** - **x**)对abs(**A** - **x**) < epsilon,和
**V** = 0对abs(**A** - **x**) > epsilon.
并发症2:
我不确切地知道每一步采取了什么行动.我大致知道它们是什么,因此我知道它们属于x +/- sigma 范围,但不能将单个动作值与我收到的强化完全关联起来.
我想要解决的确切问题如下:我有一系列嘈杂的动作估计和精确的强化值(例如在试验1中我可能有~15-30的x和0的强化;在试验2我可能有x约为25-40,强化为0;在试验3中,x约为80-95,强化为0.6.)我想构建一个模型,该模型表示每个步骤后目标动作A最可能位置的估计值.,可能根据某些学习速率参数对新信息进行加权(因为确定性会随着样本的增加而增加).
artificial-intelligence machine-learning reinforcement-learning
我有以下问题,我试图将内容从我的 StringBuilder 获取到我的 .csv 文件:
public String GetCSV()
{
System.Text.StringBuilder sb = new StringBuilder();
sb.Append(m_ID.ToString());
sb.Append(";");
sb.Append(m_Starttime.ToString());
sb.Append(";");
sb.Append(m_EndTime.ToString());
sb.Append(";");
sb.Append(m_IsSerie.ToString());
sb.Append(";");
sb.Append(m_Title);
sb.Append(";");
sb.Append(m_Description);
sb.Append(";");
sb.Append(m_Lastchange.ToString());
sb.Append(";");
return sb.ToString();
WriteCSV();
}
public void WriteCSV()
{
string csvpath = @"c:\Temp\Kalender.csv";
if (File.Exists(csvpath))
{
File.Delete(csvpath);
}
using (StreamWriter sw = File.CreateText(csvpath))
{
foreach (string CalendarItem in CalendarItem)
{
if (sb.Length > 0)
sb.Append(", ");
sb.Append(part);
}
}
}
Run Code Online (Sandbox Code Playgroud)
现在我已经知道如何创建 CSV 文件了,但我不知道如何用来自 StringBuilder 的内容填充它,我确定这将由 foreach 循环处理,对吗?
这是我的问题,我有一个带有复选框的列表视图,我想得到所选行的索引我想得到行的索引以在验证后禁用此行
我尝试不同的方法
CheckBox cbx = sender as CheckBox.tag;
if (cbx != null) {
var index = cbx.Tag.ToString();
}
(((ContentPresenter)((CheckBox)sender).TemplatedParent)).IsEnabled = false; with this i disable just the checkbox
CheckBox cbx = sender as CheckBox.tag;
int index = (int)(sender as CheckBox).Tag;
Run Code Online (Sandbox Code Playgroud) 我正在尝试向 Api Rest 发出 get 请求,但我总是收到 404,但是如果尝试在浏览器或 postMan 中复制 queryUrl,它可以完美运行。
restTemplate.getForObject(queryUrl, entity ,Integer.class);
我也试过这个:
HttpHeaders httpHeaders = new HttpHeaders();
httpHeaders.setContentType(MediaType.APPLICATION_JSON);
HttpEntity entity = new HttpEntity(httpHeaders);
log.debug("请求头:" + entity.getHeaders());
ResponseEntity response = restTemplate.exchange(queryUrl,
HttpMethod.GET, entity, String.class);
但什么都没有改变。谁能帮我?
快速提问:
我有这个字符串m_Author, m_Editor但我在字符串中有一些奇怪的ID东西,所以如果我这样做WriteLine它会看起来像:
'16; #Luca Hostettler'
我知道我可以做到以下几点:
string author = m_Author.Replace("16;#", "");
string editor = m_Editor.Replace("16;#", "");
Run Code Online (Sandbox Code Playgroud)
之后我会有名字,但我想将来我会有其他人和其他身份证.
所以问题是:我可以告诉String.Replace("#AndEverythingBeforeThat", "")
所以我也可以
'14; #Luca Hostettler'
'15; #Hans Meier'
并且会得到输出:Luca Hostettler,Hans Meier,而无需手动更改代码m_Editor.Replace("14;#", ""), m_Editor.Replace("15;#", "")......?