小编Sta*_*ler的帖子

Q学习与时间差异与基于模型的强化学习

我正在大学里学习一门名为"智能机器"的课程.我们介绍了3种强化学习方法,并且我们给出了直接使用它们的直觉,并引用:

  1. Q-Learning - 无法解决MDP的最佳选择.
  2. 时间差异学习 - 当MDP已知或可以学习但无法解决时最佳.
  3. 基于模型 - 在无法学习MDP时最佳.

是否有任何好的例子说明何时选择一种方法而不是另一种方法?

machine-learning reinforcement-learning temporal-difference q-learning

20
推荐指数
1
解决办法
1万
查看次数

在[0,2k]之间对一系列n个数进行排序,每对之间存在:| Ai-Aj |> = k/n

A1,A2,...,An介于实数[0,2k](k为常数).据了解,对于任何一对Ai,AJ随后|Ai-Aj|>=k/n,

描述在O(n)运行时最坏情况下对数字进行排序的算法.

我知道答案应该是桶式的.无法理解为什么,如果是这样,我如何选择正确数量的水桶?如何在|Ai-Aj|>=k/n实际上帮助?

sorting algorithm big-o bucket-sort

8
推荐指数
1
解决办法
206
查看次数

组的最常见值取决于选择查询

我对如何在SQL中执行此操作感到不满.我有一张桌子:

| User_id | Question_ID | Answer_ID |
|    1    |     1       |    1      |
|    1    |     2       |    10     |
|    2    |     1       |    2      |
|    2    |     2       |    11     |
|    3    |     1       |    1      |
|    3    |     2       |    10     |
|    4    |     1       |    1      |
|    4    |     2       |    10     |
Run Code Online (Sandbox Code Playgroud)

它保存用户对特定问题的答案.一个问题可能有多个答案.用户无法回答两次相同的问题.(因此,每{User_id,Question_ID}只有一个Answer_ID)

我正在尝试找到这个查询的答案:对于特定的问题和答案ID(与同一问题相关),我想找到给定答案的用户给出的其他问题最常见的答案.

例如,对于上表:

For question_id = 1 -> For Answer_ID = 1 - (Question 2 - …
Run Code Online (Sandbox Code Playgroud)

mysql

7
推荐指数
1
解决办法
210
查看次数

有没有办法在Java中使用Windows Indexer信息?

我想创建一个类似爬虫的程序,搜索文件系统并索引文件[它将在以后使用,但这是我现在关注的主要事项].

我想知道是否有一种方法可以使用Windows Indexer [已经有某种索引]而不是运行可能需要很长时间的文件?

谢谢.

java windows indexing

6
推荐指数
1
解决办法
337
查看次数

从SQL查询结果中删除域

说我使用命令[MYSQL]:

Select Username, UserType from USERS_DATABASE;
Run Code Online (Sandbox Code Playgroud)

我得到下一个结果:

Username:            UserType:         
someDomain/user1      User
someDomain/user2      User
diffDomain/user3      User
Run Code Online (Sandbox Code Playgroud)

有什么方法可以通过SQL查询删除域,还是需要解析然后删除?

域可以不同(长度,字符等)

谢谢。

sql

2
推荐指数
1
解决办法
2683
查看次数

设A是n个正整数的数组,已知数组中的最大数是k = n ^ 5.找到最好的排序

我在测验中得到了下一个问题:

设A是n个正整数的数组,已知数组中的最大数是k = n ^ 5.找到最佳的算法排序.

我的回答是:因为我知道最高数字(及其数字的数量),首先我会找到它的数字,然后我将使用基数排序.

官方答案是:基数排序,以n为基数,d = 6.

我不明白为什么?为什么d = 6?为什么选择n为基数?谢谢."

sorting

1
推荐指数
1
解决办法
97
查看次数