小编geo*_*lik的帖子

梯度下降和梯度上升之间有什么区别?

我无法找到有关渐变上升的任何信息.任何有关梯度上升的良好链接都可以说明它与梯度下降的不同之处.

optimization machine-learning mathematical-optimization

17
推荐指数
3
解决办法
2万
查看次数

Python/Django django-registration添加了一个额外的字段

我已经阅读了很多关于如何在使用Django-registration时添加额外字段的内容,例如此处,此处此处.代码片段是:forms.py(来自注册应用)

class RegistrationForm(forms.Form):
    username = forms.RegexField(regex=r'^\w+$', max_length=30, widget=forms.TextInput(attrs=attrs_dict), label=_("Username"), error_messages={ 'invalid': _("This value must contain only letters, numbers and underscores.") })
    email = forms.EmailField(widget=forms.TextInput(attrs=dict(attrs_dict, maxlength=75)), label=_("Email"))
    password1=forms.CharField(widget=forms.PasswordInput(attrs=attrs_dict, render_value=False), label=_("Password"))
    institute=forms.CharField(max_length=50) #This is the new!
    password2 = forms.CharField(widget=forms.PasswordInput(attrs=attrs_dict, render_value=False), label=_("Password (again)"))
    captcha = CaptchaField()
Run Code Online (Sandbox Code Playgroud)

我使用django的注册保存方法,它在默认的后端:

def register(self, request, **kwargs):
    username, email, password = kwargs['username'], kwargs['email'], kwargs['password1']
    if Site._meta.installed:
        site = Site.objects.get_current()
    else:
        site = RequestSite(request)
    new_user = RegistrationProfile.objects.create_inactive_user(username, email,
                                                                password, site)

    signals.user_registered.send(sender=self.__class__,
                                 user=new_user,
                                 request=request)
    return …
Run Code Online (Sandbox Code Playgroud)

django django-forms django-registration

5
推荐指数
2
解决办法
6633
查看次数

使用带有预训练向量的 gensim 短语

我正在尝试使用预先训练好的词嵌入来考虑短语。流行的预训练嵌入,例如GoogleNews-vectors-negative300.bin.gz对短语和一元词组有单独的嵌入,例如,New_York两个一元词组New和 的嵌入York。简单的单词标记化和字典查找忽略了二元嵌入。

Gensim 提供了一个很好的短语模型,给定一个文本序列,它可以学习紧凑的短语,例如,New_York而不是两个一元组NewYork。这是通过聚合和比较 unigram 和 bigram 之间的计数统计信息来完成的。1. 是否可以在Phrase不估计其他地方的计数统计数据的情况下使用预训练的嵌入?

  1. 是否可以在Phrase不估计其他地方的计数统计数据的情况下使用预训练的嵌入?
  2. 如果没有,有没有一种有效的方法来使用这些二元组?我可以想象一种使用循环的方法,但我认为它很丑陋(下)。

这是丑陋的代码。

from ntlk import word_tokenize
last_added = False
sentence = 'I love New York.'
tokens =  ["<s>"]+ word_tokenize(sentence) +"<\s>"]
vectors = []
for index, token in enumerate(tokens):
    if last_added:
        last_added=False
        continue
    if "%s_%s"%(tokens[index-1], token) in model:
        vectors.append("%s_%s"%(tokens[index-1], token))
        last_added = True
    else:
        vectors.append(tokens[index-1])
        lase_added = False
Run Code Online (Sandbox Code Playgroud)

python machine-learning phrase gensim

5
推荐指数
0
解决办法
330
查看次数

使用数组作为索引增加numpy数组元素

我试图有效地更新numpy数组A的一些元素,使用另一个数组b来指示要更新的A元素的索引.但是b可以包含被忽略的重复项,而我希望将其考虑在内.我想避免循环b.为了说明它:

>>> A = np.arange(10).reshape(2,5)
>>> A[0, np.array([1,1,1,2])] += 1
>>> A
array([[0, 2, 3, 3, 4],
       [5, 6, 7, 8, 9]])
Run Code Online (Sandbox Code Playgroud)

而我希望输出为:

array([[0, 3, 3, 3, 4],
       [5, 6, 7, 8, 9]])
Run Code Online (Sandbox Code Playgroud)

有任何想法吗?

python arrays numpy

4
推荐指数
1
解决办法
910
查看次数