标签: sampling

最简单的方法是从音频输入中捕获原始音频,以便在mac上进行实时处理

什么是从内置音频输入捕获音频的最简单方法,并且能够在请求时实时读取原始采样值(如.wav中),例如从套接字读取.

希望代码使用Apple的一个框架(音频队列).文档不是很清楚,我需要的是非常基础的.

audio core-audio sampling

4
推荐指数
1
解决办法
4692
查看次数

r中的递归采样

我试图模拟死亡超过7年的累积概率如下:

tab <- data.frame(id=1:1000,char=rnorm(1000,7,4))

cum.prob <- c(0.05,0.07,0.08,0.09,0.1,0.11,0.12)
Run Code Online (Sandbox Code Playgroud)

如何tab$id根据累积概率以矢量化方式从无需替换的样本中进行采样cum.prob?从年1开始采样的ids不一定能在2年内再次采样.因此,lapply(cum.prob,function(x) sample(tab$id,x*1000))它不起作用.有可能对此进行矢量化吗?

//中号

r sampling

4
推荐指数
1
解决办法
393
查看次数

从C ++中的离散概率分布中采样

我是C ++的新手,对缺少可访问的通用概率操作工具(即Boost和标准库中缺少内容)感到非常惊讶。我已经用其他语言完成了许多科学编程工作,但是标准和/或无所不在的第三方插件始终包含各种概率工具。一位朋友宣称Boost是C ++的无处不在的附加组件,但是当我阅读Boost文档时,即使它似乎缺少我认为极其基础的内置组件。

我找不到一个内置的,采用某种离散概率数组并生成根据这些概率选择的索引的内建函数。我当然可以为此编写自己的函数,但是我只是想检查是否缺少执行此操作的标准方法。

我觉得必须以这样低的级别编写自己的函数是一件坏事,但是我正在为大型项目编写一个新的仿真模块,而该项目全部使用C ++。我通常的战术是用Python编写并将Python链接到C ++,但是因为一旦完成我的代码,其他几个人将不得不管理该代码,而且他们都不知道Python,我认为它将谨慎使用C ++交付给他们。

更一般而言,人们在C ++中如何处理诸如从标准分布中进行采样之类的事情,尤其是像多元正态分布这样基本的东西?

c++ boost probability sampling

4
推荐指数
1
解决办法
4000
查看次数

你如何获得AudioFileID的采样率?

在iOS中很容易获得加载的.wav文件中的字节数:

UInt64 dataSize = 0;  // dataSize
UInt32 ps = sizeof(UInt64); // property size
if( AudioFileGetProperty(fileId, kAudioFilePropertyAudioDataByteCount, &ps, &dataSize) )
  puts( "error retriving data chunk size" );
return dataSize ;
Run Code Online (Sandbox Code Playgroud)

但是在文档中我似乎无法找到有关如何确定PCM波形文件采样率的任何信息.

wav rate sampling ios

4
推荐指数
1
解决办法
775
查看次数

在3D numpy网格中绘制/采样球体

我想做一个基于体素的球形物体测量,以numpy数组表示.由于采样,这些球体被表示为一组立方体(因为它们在阵列中被采样).我想通过此网格限制模拟引入的错误.有没有办法在numpy网格中绘制3D球体来运行我的模拟?(所以基本上,单位长度为1的球体,将是阵列中的一个点)

或者是否有其他方法来计算采样引入的误差?

二维似乎很容易......二维采样

geometry drawing numpy sampling

4
推荐指数
1
解决办法
2019
查看次数

Android加速度计:采样率?

我想要

[1]提高手机加速度计的采样率。(SENSOR_DELAY_FASTEST 在Xperia上的最大频率约为 100Hz,而在Nexus4上的最大频率为180Hz,我希望我的工作延迟大约为1ms或更短。

[2]如果无法使用[1],我可以使Rate为常数

mSensorManager.registerListener(this, mAccelerometer,10000);//10000 in microsec
Run Code Online (Sandbox Code Playgroud)

上面的代码不会给我10ms的延迟。我知道这只是对Android的建议。

我知道手机中的这些加速度计能够提供更小的延迟。他们的数据表中提到了它。他们的任何方法或驱动程序/ ADC编程也是[1]或[2]。我正在使用ADT工具。还有其他工具可以做到这一点吗?

PS:我读过

Android:如何提高加速度计采样率?

无法更改加速度计的速度

android accelerometer rate sampling android-sensors

4
推荐指数
2
解决办法
2万
查看次数

Pandas TimeSeries随着事件的持续时间

我已经谷歌搜索了一段时间,并没有找到一个合适的解决方案.我有一个时间序列,有几百万行,结构相当奇怪:

VisitorID Time              VisitDuration
1         01.01.2014 00:01  80 seconds
2         01.01.2014 00:03  37 seconds
Run Code Online (Sandbox Code Playgroud)

我想知道在某个时刻网站上有多少人.为此,我必须将这些数据转换为更大的数据:

Time             VisitorsPresent
01.01.2014 00:01 1
01.01.2014 00:02 1
01.01.2014 00:03 2 
...
Run Code Online (Sandbox Code Playgroud)

但做这样的事情似乎非常低效.我的代码是:

dates = {}
for index, row in data.iterrows(): 
    for i in range(0,int(row["duration"])):
        dates[index+pd.DateOffset(seconds=i)] = dates.get(index+pd.DateOffset(seconds=i), 1) + 1
Run Code Online (Sandbox Code Playgroud)

然后我可以将它转换成一个系列并能够重新取样:

result = pd.Series(dates)
result.resample("5min",how="mean").plot()
Run Code Online (Sandbox Code Playgroud)

你能指出我正确的方向吗?

编辑 - -

嗨HYRY这是一个头()

    uid        join_time_UTC      duration 
    0  1  2014-03-07 16:58:01      2953     
    1  2  2014-03-07 17:13:14      1954    
    2  3  2014-03-07 17:47:38       223

python time-series sampling pandas

4
推荐指数
1
解决办法
2233
查看次数

如何在熊猫的条件下采样?

我有一个数据帧df,如下所示:

   Col1      Col2
0  1         T
1  1         B 
2  3         S
3  2         A
4  1         C
5  2         A
etc...
Run Code Online (Sandbox Code Playgroud)

我想创建两个数据帧:df1是10行的随机样本,这样Col2 =='T'.df2是df减去df1中的行.

python sampling pandas

4
推荐指数
1
解决办法
4043
查看次数

Spark:如何在LabeledPoint上执行欠采样?

我的数据中有一些不平衡的数据LabeledPoint.我想做的是选择所有正面和n次数更多负面(随机).例如,如果我有100正面和30000负面,我想LabeledPoint用所有100正面和300负面创建新的(n=3).

在实际情况中,我并没有在开始时有多少积极和消极.

scala sampling apache-spark

4
推荐指数
1
解决办法
580
查看次数

何时使用交叉验证和网格搜索在imblearn管道中进行特征选择

目前,我正在建立数据严重不平衡的分类器。我正在使用imblearn管道首先到达StandardScaling,SMOTE,然后使用gridSearchCV进行分类。这确保了在交叉验证期间完成了升采样。现在,我想将feature_selection包含到我的管道中。我应该如何将这一步骤纳入管道中?

model = Pipeline([
        ('sampling', SMOTE()),
        ('classification', RandomForestClassifier())
    ])

param_grid = { 
    'classification__n_estimators': [10, 20, 50],
    'classification__max_depth' : [2,3,5]
}

gridsearch_model = GridSearchCV(model, param_grid, cv = 4, scoring = make_scorer(recall_score))
gridsearch_model.fit(X_train, y_train)
predictions = gridsearch_model.predict(X_test)
print(classification_report(y_test, predictions))
print(confusion_matrix(y_test, predictions))
Run Code Online (Sandbox Code Playgroud)

python sampling feature-selection imblearn

4
推荐指数
1
解决办法
688
查看次数