小编geo*_*lik的帖子

梯度下降和梯度上升之间有什么区别？

我无法找到有关渐变上升的任何信息.任何有关梯度上升的良好链接都可以说明它与梯度下降的不同之处.

optimization machine-learning mathematical-optimization

use*_*423

2015 07-21

17
推荐指数

3
解决办法

2万
查看次数

Python/Django django-registration添加了一个额外的字段

我已经阅读了很多关于如何在使用Django-registration时添加额外字段的内容,例如此处,此处和此处.代码片段是:forms.py(来自注册应用)

class RegistrationForm(forms.Form):
    username = forms.RegexField(regex=r'^\w+$', max_length=30, widget=forms.TextInput(attrs=attrs_dict), label=_("Username"), error_messages={ 'invalid': _("This value must contain only letters, numbers and underscores.") })
    email = forms.EmailField(widget=forms.TextInput(attrs=dict(attrs_dict, maxlength=75)), label=_("Email"))
    password1=forms.CharField(widget=forms.PasswordInput(attrs=attrs_dict, render_value=False), label=_("Password"))
    institute=forms.CharField(max_length=50) #This is the new!
    password2 = forms.CharField(widget=forms.PasswordInput(attrs=attrs_dict, render_value=False), label=_("Password (again)"))
    captcha = CaptchaField()

Run Code Online (Sandbox Code Playgroud)

我使用django的注册保存方法,它在默认的后端:

def register(self, request, **kwargs):
    username, email, password = kwargs['username'], kwargs['email'], kwargs['password1']
    if Site._meta.installed:
        site = Site.objects.get_current()
    else:
        site = RequestSite(request)
    new_user = RegistrationProfile.objects.create_inactive_user(username, email,
                                                                password, site)

    signals.user_registered.send(sender=self.__class__,
                                 user=new_user,
                                 request=request)
    return …

Run Code Online (Sandbox Code Playgroud)

django django-forms django-registration

geo*_*lik

2017 05-23

5
推荐指数

2
解决办法

6633
查看次数

使用带有预训练向量的 gensim 短语

我正在尝试使用预先训练好的词嵌入来考虑短语。流行的预训练嵌入，例如GoogleNews-vectors-negative300.bin.gz对短语和一元词组有单独的嵌入，例如，New_York两个一元词组New和的嵌入York。简单的单词标记化和字典查找忽略了二元嵌入。

Gensim 提供了一个很好的短语模型，给定一个文本序列，它可以学习紧凑的短语，例如，New_York而不是两个一元组New和York。这是通过聚合和比较 unigram 和 bigram 之间的计数统计信息来完成的。1. 是否可以在Phrase不估计其他地方的计数统计数据的情况下使用预训练的嵌入？

是否可以在Phrase不估计其他地方的计数统计数据的情况下使用预训练的嵌入？
如果没有，有没有一种有效的方法来使用这些二元组？我可以想象一种使用循环的方法，但我认为它很丑陋（下）。

这是丑陋的代码。

from ntlk import word_tokenize
last_added = False
sentence = 'I love New York.'
tokens =  ["<s>"]+ word_tokenize(sentence) +"<\s>"]
vectors = []
for index, token in enumerate(tokens):
    if last_added:
        last_added=False
        continue
    if "%s_%s"%(tokens[index-1], token) in model:
        vectors.append("%s_%s"%(tokens[index-1], token))
        last_added = True
    else:
        vectors.append(tokens[index-1])
        lase_added = False

Run Code Online (Sandbox Code Playgroud)

python machine-learning phrase gensim

geo*_*lik

lucky-day

5
推荐指数

0
解决办法

330
查看次数

使用数组作为索引增加numpy数组元素

我试图有效地更新numpy数组A的一些元素,使用另一个数组b来指示要更新的A元素的索引.但是b可以包含被忽略的重复项,而我希望将其考虑在内.我想避免循环b.为了说明它:

>>> A = np.arange(10).reshape(2,5)
>>> A[0, np.array([1,1,1,2])] += 1
>>> A
array([[0, 2, 3, 3, 4],
       [5, 6, 7, 8, 9]])

Run Code Online (Sandbox Code Playgroud)

而我希望输出为:

array([[0, 3, 3, 3, 4],
       [5, 6, 7, 8, 9]])

Run Code Online (Sandbox Code Playgroud)

有任何想法吗？

python arrays numpy

geo*_*lik

2015 12-03

4
推荐指数

1
解决办法

910
查看次数

标签统计

machine-learning ×2

python ×2

arrays ×1

django ×1

django-forms ×1

django-registration ×1

gensim ×1

mathematical-optimization ×1

numpy ×1

optimization ×1

phrase ×1

梯度下降和梯度上升之间有什么区别？

Python/Django django-registration添加了一个额外的字段

使用带有预训练向量的 gensim 短语

使用数组作为索引增加numpy数组元素

标签 统计

小编geo_lik的帖子

标签统计