标签: normalize

在幂律分布之后标准化/缩放/标准化多个变量的正确方法,用于线性组合

我想将社交网络图中的一些节点指标组合成单个值,以便对节点进行排序:

in_degree + betweenness_centrality = informal_power_index

问题在于,in_degree并且betweenness_centrality在不同的尺度上进行测量,例如0-15对0-35000,并遵循幂律分布(至少绝对不是正态分布)

有没有一种很好的方法来重新调整变量,以便在确定变量时不会主导另一个变量informal_power_index

三种明显的方法是:

  • 标准化变量(减去mean和除以stddev).这似乎会破坏分布太多,隐藏长尾值和高峰值之间的巨大差异.
  • 通过减去min(variable)和除以,将变量重新调整到[0,1]范围max(variable).这似乎更接近解决问题,因为它不会改变分布的形状,但也许它不会真正解决问题?特别是手段会有所不同.
  • 通过将每个值除以来均衡均值mean(variable).这不会解决尺度上的差异,但平均值可能对比较更重要?

还有其他想法吗?

linear-equation graph normalize rescale power-law

6
推荐指数
1
解决办法
2万
查看次数

规范化gnuplot中的直方图箱

我正在尝试绘制一个直方图,其中的箱子通过箱子中的元素数量进行归一化.

我正在使用以下内容

binwidth=5
bin(x,width)=width*floor(x/width) + binwidth/2.0
plot 'file' using (bin($2, binwidth)):($4) smooth freq with boxes
Run Code Online (Sandbox Code Playgroud)

得到一个基本的直方图,但我希望每个bin的值除以bin的大小.我如何在gnuplot中进行此操作,或在必要时使用外部工具?

gnuplot normalize histogram bins

6
推荐指数
3
解决办法
2万
查看次数

如何将正负十进制数列表标准化为特定范围

我有一个十进制数列表如下:

[-23.5, -12.7, -20.6, -11.3, -9.2, -4.5, 2, 8, 11, 15, 17, 21]
Run Code Online (Sandbox Code Playgroud)

我需要规范化这个列表以适应范围[-5,5].
我怎么能在python中做到这一点?

python list range normalize

6
推荐指数
1
解决办法
1万
查看次数

如何规范化名称

我正在使用pandas数据帧,我有数据,我每个公司都有客户.但是,公司的标题略有不同,但最终会影响数据.例:

Company    Customers
AAAB       1,000
AAAB Inc.  900
The AAAB Inc.  20
AAAB the INC   10
Run Code Online (Sandbox Code Playgroud)

我希望从具有非标准名称的公司的几个不同公司的数据库中获得总客户.知道我应该从哪里开始吗?

python nlp normalize pandas

6
推荐指数
2
解决办法
3064
查看次数

Redux嵌套的reducers或规范化状态?

我正在使用React制作表单组件,并希望使用Redux存储表单和字段状态.

所以我有一个表格减速器和一个formField减速器.

我首先遵循我的直觉,并尝试将formField减速器嵌套在减速器中.这基本上意味着在form reducer和formField reducer中都有与formField相关的开关案例.

这感觉有点乱(重复代码),所以我在文档中阅读了更多内容,并发现建议将状态标准化.所以我拿走了嵌套的formFields并将它们放在与表单相同的级别.

这使得reducer变得干净漂亮,但是现在为特定表单检索formFields感觉非常糟糕.我基本上每次循环遍历所有formFields,只返回具有正确"formId"参数的那些.

Redux文档声明您应该将状态视为规范化数据库,但是他不会忘记您没有能够查询结果的奢侈吗?

我在这里错过了吗?推荐的解决方法是什么?

nested normalize reducers redux

6
推荐指数
1
解决办法
3316
查看次数

为React + Redux应用发送回规范化或非规范化的API响应更好吗

我正在编写一个react-redux应用程序。首先,它调用单个端点,该端点返回大量数据作为高度嵌套的JSON。然后,我对其进行规范化并将其放入我的redux-orm模式。
对我来说,在后端创建嵌套数据只是为了遍历前端的嵌套数据以对其进行规范化似乎是很愚蠢的,因为它来自标准化的PostgreSQL数据库。

Database = Normalized --> 
API = Denormalized --> 
Frontend = Normalized
Run Code Online (Sandbox Code Playgroud)

只是发送回标准化的API响应是最佳实践吗?

normalize denormalization reactjs redux redux-orm

6
推荐指数
1
解决办法
815
查看次数

在Silverlight中删除变音符号(String.Normalize issue)

我创建了一个函数,将变音字符转换为非变音字符(基于这篇文章)

这是代码:

Public Function RemoveDiacritics(ByVal searchInString As String) As String
    Dim returnValue As String = ""

    Dim formD As String = searchInString.Normalize(System.Text.NormalizationForm.FormD)
    Dim unicodeCategory As System.Globalization.UnicodeCategory = Nothing
    Dim stringBuilder As New System.Text.StringBuilder()


    For formScan As Integer = 0 To formD.Length - 1
        unicodeCategory = System.Globalization.CharUnicodeInfo.GetUnicodeCategory(formD(formScan))
        If unicodeCategory <> System.Globalization.UnicodeCategory.NonSpacingMark Then
            stringBuilder.Append(formD(formScan))
        End If
    Next

    returnValue = stringBuilder.ToString().Normalize(System.Text.NormalizationForm.FormC)

    Return returnValue

End Function
Run Code Online (Sandbox Code Playgroud)

不幸的是,由于String.Normlize不是Silverlight的一部分,我需要找到另一种编写此函数的方法.

到目前为止我找到的唯一解决方案是在服务器端创建一个服务,该服务将调用String.Normalize函数,然后将其返回给客户端...但这会产生巨大的性能问题.

必须有一个更好的选择但正确知道我不知道如何解决这个问题.

string silverlight normalize diacritics

5
推荐指数
1
解决办法
1682
查看次数

如何在 javascript 中创建模型以确保所有属性确实存在

我想知道如何在 javascript 中创建模型?

示例对象用户:应该具有这些属性[name,username,password],并且不应有其他属性。

现在我想发送任何值,它应该返回具有这 3 个属性的对象并忽略任何其他属性。

我尝试使用

var UserFactory = props => ({
  user    :props.user||'',
  username:props.username||'',
  ..etc
})
Run Code Online (Sandbox Code Playgroud)

现在,当我传递用户对象时,我确信所有属性确实存在,并且不会发生未定义的错误。

我想要这个的原因是在获取/发布到服务器时标准化数据。

是否已经有最佳实践来做到这一点?

ps:如果重要的话,我正在一个react-redux学习项目中使用它..

谢谢

使用上面的代码编辑问题:

  1. 我无法进行类型检查,因为工厂返回的是一个普通对象而不是模型的实例,userFactory({}) instanceOf UserObject === false那么如何确定变量内部是否包含 userObject?
  2. 它很冗长,但如果我使用 Object.assign(),我可能会在我的对象中得到不需要的属性,所以我不确定这是否是最好的方法。

javascript model normalize redux

5
推荐指数
1
解决办法
2万
查看次数

(pytorch)我想将 [0 255] 整数张量标准化为 [0 1] 浮点张量

我想将 [0 255] 整数张量标准化为 [0 1] 浮点张量。

我使用 cifar10 数据集并想要处理整数图像张量。
所以当我加载数据集时,我将它们设为整数张量,我使用“transforms.ToTensor()”,因此值设置为 [0 1] float

tensor([[[0.4588, 0.4588, 0.4588,  ..., 0.4980, 0.4980, 0.5020],
         [0.4706, 0.4706, 0.4706,  ..., 0.5098, 0.5098, 0.5137],
         [0.4824, 0.4824, 0.4824,  ..., 0.5216, 0.5216, 0.5294],
         ...,
         [0.3098, 0.3020, 0.2863,  ..., 0.4549, 0.3608, 0.3137],
         [0.2902, 0.2902, 0.2902,  ..., 0.4431, 0.3333, 0.3020],
         [0.2706, 0.2941, 0.2941,  ..., 0.4157, 0.3529, 0.3059]],

        [[0.7725, 0.7725, 0.7725,  ..., 0.7569, 0.7569, 0.7608],
         [0.7765, 0.7765, 0.7765,  ..., 0.7608, 0.7608, 0.7686],
         [0.7765, 0.7765, 0.7765,  ..., 0.7608, 0.7608, 0.7725],
         ...,
         [0.6510, …
Run Code Online (Sandbox Code Playgroud)

python casting normalize pytorch tensor

5
推荐指数
1
解决办法
2万
查看次数

如何在规范化后保留我的 pandas 数据帧的索引。json

我从 json 加载中获取一个 json 对象。然后我制作一个 pd df 现在我需要规范化隐藏在唯一列 ['open'] 中的大量嵌套信息,但我想保留原始索引,索引有我的订单 id

这是 json

{'error': [], 'result': {'open': {'OOACET-BMAFM-HNCONR': {'refid': None, 'userref': 0, 'status': 'open', 'opentm': 1605592530.3912, 'starttm': 0, 'expiretm': 0, 'descr': {'pair': 'XBTEUR', 'type': 'sell', 'ordertype': 'limit', 'price': '14650.0', 'price2': '0', 'leverage': 'none', 'order': 'sell 0.00100000 XBTEUR @ limit 14650.0', 'close': ''}, 'vol': '0.00100000', 'vol_exec': '0.00000000', 'cost': '0.00000', 'fee': '0.00000', 'price': '0.00000', 'stopprice': '0.00000', 'limitprice': '0.00000', 'misc': '', 'oflags': 'fciq'}, 'OXJ3XN-56LKL-AJ47T4': {'refid': None, 'userref': 0, 'status': 'open', 'opentm': 1605560760.209, 'starttm': …
Run Code Online (Sandbox Code Playgroud)

python indexing json normalize pandas

5
推荐指数
1
解决办法
3979
查看次数