我正在尝试将训练和测试数据帧加载到数据集对象中。将 pandas 数据帧加载到数据集对象中的常用方法是:
from datasets import Dataset
import pandas as pd
df = pd.DataFrame({"a": [1, 2, 3]})
dataset = Dataset.from_pandas(df)
Run Code Online (Sandbox Code Playgroud)
我的问题是如何将训练和测试两个 pandas 数据帧加载到数据集中?
例如,如果我有两个数据框:
from datasets import Dataset
import pandas as pd
df_train = pd.DataFrame({"a": [1, 2, 3]})
df_test = pd.DataFrame({"ab": [1, 2, 3]})
Run Code Online (Sandbox Code Playgroud)
如何加载这两个框架?
python dataframe pandas huggingface-transformers huggingface-datasets
我是 DSP 新手,尝试计算f(0)
音频文件每个分段帧的基频 ( )。F0估计的方法可以分为三类:
大多数示例都是基于频域的频率结构来估计基频,我正在寻找基于信号时域的时间动态的基频。
这篇文章提供了一些信息,但我仍然不清楚如何在时域中计算它?
https://gist.github.com/endolith/255291这是我发现的迄今为止使用的代码:
def freq_from_autocorr(sig, fs):
"""
Estimate frequency using autocorrelation
"""
# Calculate autocorrelation and throw away the negative lags
corr = correlate(sig, sig, mode='full')
corr = corr[len(corr)//2:]
# Find the first low point
d = diff(corr)
start = nonzero(d > 0)[0][0]
# Find the next peak after the low point (other than 0 lag). This bit is
# not reliable for long signals, due to the …
Run Code Online (Sandbox Code Playgroud) 我试图理解分裂功能,我试图在网上找到,但我找不到关于分裂的实用例子的好文档,所以我在这里问了几个问题,这样它会帮助初学者试图学习分裂:
首先,我混淆了splinter中的实际css选择器,我看到了两种方法:
browser.find_by_css()
Run Code Online (Sandbox Code Playgroud)
要么
browser.find_by_css_selector()
Run Code Online (Sandbox Code Playgroud)
它们之间有什么区别,为什么第二个不能在当前的分裂中工作?
现在我的原始问题是如何选择任何类下的任何标签,如何选择任何ID下的任何标签?
我试图找到,但我发现大多数stackoverflow问题的分裂"如何在下拉列表中选择选项值",并且分裂文档非常好,但问题是他们的方法没有足够实用的示例.
所以,如果我有这个HTML代码:
<div class="medium-widget success-story-category">
<h2 class="widget-title"><span aria-hidden="true" class="icon-get-started"></span>Getting Started</h2>
<p>Python can be easy to pick up whether you're a first time programmer or you're experienced with other languages. The following pages are a useful first step to get on your way writing programs with Python!</p>
<ul>
<li><a href="https://wiki.python.org/moin/BeginnersGuide/Programmers">Beginner's Guide, Programmers</a></li>
<li><a href="https://wiki.python.org/moin/BeginnersGuide/NonProgrammers">Beginner's Guide, Non-Programmers</a></li>
<li><a href="https://wiki.python.org/moin/BeginnersGuide/Download">Beginner's Guide, Download & Installation</a></li>
<li><a href="https://wiki.python.org/moin/BeginnersGuide/Examples">Code sample and snippets for Beginners</a></li>
</ul>
</div>
Run Code Online (Sandbox Code Playgroud)
然后 :
如何通过选择选择 …
我有一份列表,我试图按人口密度排序.但是,排序的函数似乎没有正确排序它们.
cnt_pop_within_range = [['China', '139.54'], ['United States of America', '32.19'], ['Brazil', '22.72'], ['Canada', '3.43'], ['Indonesia', '144.00'], ['Mexico', '65.32'], ['Egypt', '93.38'], ['France', '119.39'], ['Italy', '199.34'], ['South Africa', '44.98'], ['Colombia', '44.60']]
print(sorted(cnt_pop_within_range, key = itemgetter(1), reverse = True))
Run Code Online (Sandbox Code Playgroud)
这是打印到控制台上的内容:
> [['Egypt', '93.38'], ['Mexico', '65.32'], ['South Africa', '44.98'],
> ['Colombia', '44.60'], ['United States of America', '32.19'],
> ['Canada', '3.43'], ['Brazil', '22.72'], ['Italy', '199.34'],
> ['Indonesia', '144.00'], ['China', '139.54'], ['France', '119.39']]
Run Code Online (Sandbox Code Playgroud) 我正面临 tensorflow 模型权重恢复问题。
所以在训练模型期间,我在每 500 次迭代后保存了我的模型检查点,
if j%500==0:
with open('iterres.txt','a') as f:
f.write(str({'epoch': i, 'test_accuracy': evaluate_(model,batch_size=100),'iteration':j}) + '\n')
os.system('mkdir ' + str(i)+'epoch'+str(j))
saver.save(sess, '/home/g_cloud/exe_paul/'+str(i)+'epoch'+str(j)+'/'+str(i))
Run Code Online (Sandbox Code Playgroud)
现在我有一个包含所有权重和元数据的检查点文件夹:
我已经下载了权重并创建了一个名为“new_backup”的新文件夹,其中所有权重和元数据都在那里:
当我尝试从该文件夹加载该文件时:
import tensorflow as tf
labels_dict={
1: 'Yes',
0: 'No'
}
with tf.Session() as sess:
saver = tf.train.import_meta_graph('../new_backup/1.meta')
restore = saver.restore(sess,tf.train.latest_checkpoint('../new_backup/'))
graph=tf.get_default_graph()
query= graph.get_tensor_by_name("input:0")
result=graph.get_tensor_by_name("netout:0")
Run Code Online (Sandbox Code Playgroud)
然后我收到此错误:
NotFoundError: /home/g_cloud/exe_paul/1epoch1000; No such file or directory
Run Code Online (Sandbox Code Playgroud)
那是我的云帐户,1epoch1000 是旧文件夹,在训练期间保存了所有重量。我的问题是,如果我转到云并在存在文件夹 1epoch1000 时使用相同的脚本来恢复模型,则脚本正在运行,否则会出现该错误。
我如何更改元以重定向路径或如何在任何地方恢复模型?
python ×5
audio ×1
automation ×1
checkpoint ×1
dataframe ×1
numpy ×1
pandas ×1
python-3.x ×1
scipy ×1
selenium ×1
splinter ×1
tensorflow ×1