什么是从内置音频输入捕获音频的最简单方法,并且能够在请求时实时读取原始采样值(如.wav中),例如从套接字读取.
希望代码使用Apple的一个框架(音频队列).文档不是很清楚,我需要的是非常基础的.
我试图模拟死亡超过7年的累积概率如下:
tab <- data.frame(id=1:1000,char=rnorm(1000,7,4))
cum.prob <- c(0.05,0.07,0.08,0.09,0.1,0.11,0.12)
Run Code Online (Sandbox Code Playgroud)
如何tab$id根据累积概率以矢量化方式从无需替换的样本中进行采样cum.prob?从年1开始采样的ids不一定能在2年内再次采样.因此,lapply(cum.prob,function(x) sample(tab$id,x*1000))它不起作用.有可能对此进行矢量化吗?
//中号
我是C ++的新手,对缺少可访问的通用概率操作工具(即Boost和标准库中缺少内容)感到非常惊讶。我已经用其他语言完成了许多科学编程工作,但是标准和/或无所不在的第三方插件始终包含各种概率工具。一位朋友宣称Boost是C ++的无处不在的附加组件,但是当我阅读Boost文档时,即使它似乎缺少我认为极其基础的内置组件。
我找不到一个内置的,采用某种离散概率数组并生成根据这些概率选择的索引的内建函数。我当然可以为此编写自己的函数,但是我只是想检查是否缺少执行此操作的标准方法。
我觉得必须以这样低的级别编写自己的函数是一件坏事,但是我正在为大型项目编写一个新的仿真模块,而该项目全部使用C ++。我通常的战术是用Python编写并将Python链接到C ++,但是因为一旦完成我的代码,其他几个人将不得不管理该代码,而且他们都不知道Python,我认为它将谨慎使用C ++交付给他们。
更一般而言,人们在C ++中如何处理诸如从标准分布中进行采样之类的事情,尤其是像多元正态分布这样基本的东西?
在iOS中很容易获得加载的.wav文件中的字节数:
UInt64 dataSize = 0; // dataSize
UInt32 ps = sizeof(UInt64); // property size
if( AudioFileGetProperty(fileId, kAudioFilePropertyAudioDataByteCount, &ps, &dataSize) )
puts( "error retriving data chunk size" );
return dataSize ;
Run Code Online (Sandbox Code Playgroud)
但是在文档中我似乎无法找到有关如何确定PCM波形文件采样率的任何信息.
我想做一个基于体素的球形物体测量,以numpy数组表示.由于采样,这些球体被表示为一组立方体(因为它们在阵列中被采样).我想通过此网格限制模拟引入的错误.有没有办法在numpy网格中绘制3D球体来运行我的模拟?(所以基本上,单位长度为1的球体,将是阵列中的一个点)
或者是否有其他方法来计算采样引入的误差?
二维似乎很容易......
我想要
[1]提高手机加速度计的采样率。(SENSOR_DELAY_FASTEST 在Xperia上的最大频率约为 100Hz,而在Nexus4上的最大频率为180Hz,我希望我的工作延迟大约为1ms或更短。
[2]如果无法使用[1],我可以使Rate为常数。
mSensorManager.registerListener(this, mAccelerometer,10000);//10000 in microsec
Run Code Online (Sandbox Code Playgroud)
上面的代码不会给我10ms的延迟。我知道这只是对Android的建议。
我知道手机中的这些加速度计能够提供更小的延迟。他们的数据表中提到了它。他们的任何方法或驱动程序/ ADC编程也是[1]或[2]。我正在使用ADT工具。还有其他工具可以做到这一点吗?
PS:我读过
我已经谷歌搜索了一段时间,并没有找到一个合适的解决方案.我有一个时间序列,有几百万行,结构相当奇怪:
VisitorID Time VisitDuration
1 01.01.2014 00:01 80 seconds
2 01.01.2014 00:03 37 seconds
Run Code Online (Sandbox Code Playgroud)
我想知道在某个时刻网站上有多少人.为此,我必须将这些数据转换为更大的数据:
Time VisitorsPresent
01.01.2014 00:01 1
01.01.2014 00:02 1
01.01.2014 00:03 2
...
Run Code Online (Sandbox Code Playgroud)
但做这样的事情似乎非常低效.我的代码是:
dates = {}
for index, row in data.iterrows():
for i in range(0,int(row["duration"])):
dates[index+pd.DateOffset(seconds=i)] = dates.get(index+pd.DateOffset(seconds=i), 1) + 1
Run Code Online (Sandbox Code Playgroud)
然后我可以将它转换成一个系列并能够重新取样:
result = pd.Series(dates)
result.resample("5min",how="mean").plot()
Run Code Online (Sandbox Code Playgroud)
你能指出我正确的方向吗?
编辑 - -
嗨HYRY这是一个头()
uid join_time_UTC duration
0 1 2014-03-07 16:58:01 2953
1 2 2014-03-07 17:13:14 1954
2 3 2014-03-07 17:47:38 223
我有一个数据帧df,如下所示:
Col1 Col2
0 1 T
1 1 B
2 3 S
3 2 A
4 1 C
5 2 A
etc...
Run Code Online (Sandbox Code Playgroud)
我想创建两个数据帧:df1是10行的随机样本,这样Col2 =='T'.df2是df减去df1中的行.
我的数据中有一些不平衡的数据LabeledPoint.我想做的是选择所有正面和n次数更多负面(随机).例如,如果我有100正面和30000负面,我想LabeledPoint用所有100正面和300负面创建新的(n=3).
在实际情况中,我并没有在开始时有多少积极和消极.
目前,我正在建立数据严重不平衡的分类器。我正在使用imblearn管道首先到达StandardScaling,SMOTE,然后使用gridSearchCV进行分类。这确保了在交叉验证期间完成了升采样。现在,我想将feature_selection包含到我的管道中。我应该如何将这一步骤纳入管道中?
model = Pipeline([
('sampling', SMOTE()),
('classification', RandomForestClassifier())
])
param_grid = {
'classification__n_estimators': [10, 20, 50],
'classification__max_depth' : [2,3,5]
}
gridsearch_model = GridSearchCV(model, param_grid, cv = 4, scoring = make_scorer(recall_score))
gridsearch_model.fit(X_train, y_train)
predictions = gridsearch_model.predict(X_test)
print(classification_report(y_test, predictions))
print(confusion_matrix(y_test, predictions))
Run Code Online (Sandbox Code Playgroud) sampling ×10
python ×3
pandas ×2
rate ×2
android ×1
apache-spark ×1
audio ×1
boost ×1
c++ ×1
core-audio ×1
drawing ×1
geometry ×1
imblearn ×1
ios ×1
numpy ×1
probability ×1
r ×1
scala ×1
time-series ×1
wav ×1