我目前正在使用Q-Learning尝试教一个机器人如何在一个充满墙壁/障碍物的房间里移动.它必须从房间的任何地方开始并进入目标状态(例如,这可能是带有门的瓷砖).目前,当它想要移动到另一个磁贴时,它将转到该磁贴,但我想在将来我可能会添加一个随机的机会去另一个磁贴,而不是那个.它只能向上,向下,向左和向右移动.达到目标状态会产生+100,其余的操作将产生0.
我正在使用此处找到的算法,可以在下面的图像中看到.

现在,关于这一点,我有一些问题:
我也听说过TD(时间差异),它似乎用下面的表达式表示:
Q(a, s) = Q(a, s) * alpha * [R(a, s) + gamma * Max { Q(a', s' } - Q(a, s)]
Run Code Online (Sandbox Code Playgroud)
对于alpha = 1,只是看起来在图片中首先显示的那个.这个伽玛有什么不同呢?
language-agnostic artificial-intelligence reinforcement-learning genetic-algorithm
由于Rails升级,我们刚刚使用了redirect_to break,这导致了一个问题.我一直在尝试,我似乎还没有找到一种方法,使用redirect_to的用户发送到与查询参数的非Rails的页面追加,除了通过手动构造URL字符串,这似乎是一个耻辱.以前,只是一个简单的:
redirect_to "http://www.web.com/myurl" "parm"
Run Code Online (Sandbox Code Playgroud)
工作 - 它将"parm"附加到URL,并正确处理多个parms.情况已经不再如此,所以我想知道是否有新的/更好的方法来做到这一点.文档暗示包含哈希应该有效,但它不会:
redirect_to ("http://www.web.com/myurl", :parm => "foo")
redirect_to ("http://www.web.com/myurl", { :parm => "foo" } )
Run Code Online (Sandbox Code Playgroud)
两者都不起作用.手动构建URL字符串工作正常,但有没有人有一个咒语,使这项工作更好的方式?
我知道他们的问题是什么,你如何链接它们,或者当你在不同的表中有相同的名字时它们是自动链接的.这是一个例子:
假设我有一个[orders]表和一个[customer]表.[orders]表中的每一行都有一个customer_id号,该号码与[customer]表中的customer_id相关联.那么如何通过参考订单获取客户信息?什么是SQL查询?
在C#中,我如何检查存储在字符串对象中的值(例如:字符串strOrderId ="435242A")是否为十进制?
在我的程序中,有一个地方需要访问从工厂解决的单件并附加到其事件:
void MyMethod()
{
myFactory.Resolve<MySingleton>().DoWork += WorkMethod;
}
Run Code Online (Sandbox Code Playgroud)
问题是MyMethod可以执行多次,但我想只附加一次事件(否则我会接到多次调用).所以我只想在以前没有依恋的时候才能附上.它有什么比这更好的了
myFactory.Resolve<MySingleton>().DoWork -= WorkMethod;
myFactory.Resolve<MySingleton>().DoWork += WorkMethod;
Run Code Online (Sandbox Code Playgroud) 我正在尝试从我的应用程序控制外部OSX应用程序的窗口.我想1.移动屏幕上的窗口2.调整屏幕上的窗口大小3.更改应用程序的当前活动窗口4.获取当前活动的窗口.
(我想通过ObjC/C/C++ apis这样做).
考虑到我有想要控制的窗口的CGWindowID,我应该寻找什么样的API调用?也就是说,我希望找到的功能与类似的东西签名:MoveWindow(CGWindowID winId, int x, int y),ResizeWindow(CGWindowID winId, int width, int height),Activatewindow(CGWindowID winId),CGWindowID GetCurrentlyActivatedWindow().
对于3,我已经习惯SetFrontProcess将一个进程拉到前面,但是这不允许我选择一个进程的特定窗口,如果它有多个.
我正在尝试使用XSLT将一些XML转换为HTML.
问题:
我无法让它发挥作用.有人能告诉我我做错了什么吗?
XML:
<ArrayOfBrokerage xmlns:i="http://www.w3.org/2001/XMLSchema-instance" xmlns="http://www.test.com/">
<Brokerage>
<BrokerageID>91</BrokerageID>
<LastYodleeUpdate>0001-01-01T00:00:00</LastYodleeUpdate>
<Name>E*TRADE</Name>
<Validation i:nil="true" />
<Username>PersonalTradingTesting</Username>
</Brokerage>
</ArrayOfBrokerage>
Run Code Online (Sandbox Code Playgroud)
XSLT:
<xsl:stylesheet version="1.0" xmlns="http://www.test.com/" xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xslFormatting="urn:xslFormatting">
<xsl:output method="html" indent="no"/>
<xsl:template match="/ArrayOfBrokerage">
<xsl:for-each select="Brokerage">
Test
</xsl:for-each>
</xsl:template>
</xsl:stylesheet>
Run Code Online (Sandbox Code Playgroud) 如何在shell脚本中检查文件编码?我需要知道文件是用utf-8还是iso-8859-1编码的.
谢谢
请注意下表.我想将新创建的BEST_SELLER列的默认值设置为"N".
我该怎么做呢?
Create Table Mystery
(Book_Code Char(4) Primary Key,
Title Varchar2(40),
Publisher_Code Char(2),
Price Number(4,2))
Run Code Online (Sandbox Code Playgroud) 我在python中编写一个与ldap服务器通信的包.我希望它能在CPython和Jython中运行.为了使它与CPython一起使用,我已成功编写了针对python-ldap的代码.但是,要使它与Jython一起使用,我必须使用java jar.
我如何使用我的包分发jar文件,这样如果它可以"导入java",它就知道它的jython,并动态地将java jar添加到路径中并使用它.但是,如果失败,它会知道它的CPython并使用python-ldap库.
有任何想法吗?