小编Aad*_*Ura的帖子

如何将两个 pandas 数据帧加载到 Hugginface 的数据集对象中?

我正在尝试将训练和测试数据帧加载到数据集对象中。将 pandas 数据帧加载到数据集对象中的常用方法是:

from datasets import Dataset
import pandas as pd
df = pd.DataFrame({"a": [1, 2, 3]})
dataset = Dataset.from_pandas(df)
Run Code Online (Sandbox Code Playgroud)

我的问题是如何将训练和测试两个 pandas 数据帧加载到数据集中?

例如,如果我有两个数据框:

from datasets import Dataset
import pandas as pd
df_train = pd.DataFrame({"a": [1, 2, 3]})
df_test = pd.DataFrame({"ab": [1, 2, 3]})
Run Code Online (Sandbox Code Playgroud)

如何加载这两个框架?

python dataframe pandas huggingface-transformers huggingface-datasets

3
推荐指数
1
解决办法
4531
查看次数

如何在时域计算基音基频f(0))?

我是 DSP 新手,尝试计算f(0)音频文件每个分段帧的基频 ( )。F0估计的方法可以分为三类:

  • 基于信号时域的时间动态;
  • 基于频域的频率结构,以及
  • 混合方法。

大多数示例都是基于频域的频率结构来估计基频,我正在寻找基于信号时域的时间动态的基频。

这篇文章提供了一些信息,但我仍然不清楚如何在时域中计算它?

https://gist.github.com/endolith/255291

这是我发现的迄今为止使用的代码:

def freq_from_autocorr(sig, fs):
    """
    Estimate frequency using autocorrelation
    """
    # Calculate autocorrelation and throw away the negative lags
    corr = correlate(sig, sig, mode='full')
    corr = corr[len(corr)//2:]

    # Find the first low point
    d = diff(corr)
    start = nonzero(d > 0)[0][0]

    # Find the next peak after the low point (other than 0 lag).  This bit is
    # not reliable for long signals, due to the …
Run Code Online (Sandbox Code Playgroud)

python audio signal-processing numpy scipy

2
推荐指数
1
解决办法
2261
查看次数

如何在splinter中选择class,div,tag?

我试图理解分裂功能,我试图在网上找到,但我找不到关于分裂的实用例子的好文档,所以我在这里问了几个问题,这样它会帮助初学者试图学习分裂:

首先,我混淆了splinter中的实际css选择器,我看到了两种方法:

browser.find_by_css() 
Run Code Online (Sandbox Code Playgroud)

要么

browser.find_by_css_selector()
Run Code Online (Sandbox Code Playgroud)

它们之间有什么区别,为什么第二个不能在当前的分裂中工作?

现在我的原始问题是如何选择任何类下的任何标签,如何选择任何ID下的任何标签?

我试图找到,但我发现大多数stackoverflow问题的分裂"如何在下拉列表中选择选项值",并且分裂文档非常好,但问题是他们的方法没有足够实用的示例.

所以,如果我有这个HTML代码:

<div class="medium-widget success-story-category">
                        <h2 class="widget-title"><span aria-hidden="true" class="icon-get-started"></span>Getting Started</h2>
<p>Python can be easy to pick up whether you're a first time programmer or you're experienced with other languages. The following pages are a useful first step to get on your way writing programs with Python!</p>
<ul>
    <li><a href="https://wiki.python.org/moin/BeginnersGuide/Programmers">Beginner's Guide, Programmers</a></li>
    <li><a href="https://wiki.python.org/moin/BeginnersGuide/NonProgrammers">Beginner's Guide, Non-Programmers</a></li>
    <li><a href="https://wiki.python.org/moin/BeginnersGuide/Download">Beginner's Guide, Download &amp; Installation</a></li>
    <li><a href="https://wiki.python.org/moin/BeginnersGuide/Examples">Code sample and snippets for Beginners</a></li>
</ul>

                    </div>
Run Code Online (Sandbox Code Playgroud)

然后 :

  • 如何通过选择选择 …

python selenium automation beautifulsoup splinter

1
推荐指数
1
解决办法
2836
查看次数

排序函数不返回列表列表的正确结果

我有一份列表,我试图按人口密度排序.但是,排序的函数似乎没有正确排序它们.

cnt_pop_within_range = [['China', '139.54'], ['United States of America', '32.19'], ['Brazil', '22.72'], ['Canada', '3.43'], ['Indonesia', '144.00'], ['Mexico', '65.32'], ['Egypt', '93.38'], ['France', '119.39'], ['Italy', '199.34'], ['South Africa', '44.98'], ['Colombia', '44.60']]
print(sorted(cnt_pop_within_range, key = itemgetter(1), reverse = True))
Run Code Online (Sandbox Code Playgroud)

这是打印到控制台上的内容:

> [['Egypt', '93.38'], ['Mexico', '65.32'], ['South Africa', '44.98'],
> ['Colombia', '44.60'], ['United States of America', '32.19'],
> ['Canada', '3.43'], ['Brazil', '22.72'], ['Italy', '199.34'],
> ['Indonesia', '144.00'], ['China', '139.54'], ['France', '119.39']]
Run Code Online (Sandbox Code Playgroud)

python

1
推荐指数
1
解决办法
51
查看次数

Tensorflow:NotFoundError:没有这样的文件或目录

我正面临 tensorflow 模型权重恢复问题。

所以在训练模型期间,我在每 500 次迭代后保存了我的模型检查点,

if j%500==0:
                    with open('iterres.txt','a') as f:
                        f.write(str({'epoch': i, 'test_accuracy': evaluate_(model,batch_size=100),'iteration':j}) + '\n')
                        os.system('mkdir ' + str(i)+'epoch'+str(j))
                        saver.save(sess, '/home/g_cloud/exe_paul/'+str(i)+'epoch'+str(j)+'/'+str(i))
Run Code Online (Sandbox Code Playgroud)

现在我有一个包含所有权重和元数据的检查点文件夹:

我已经下载了权重并创建了一个名为“new_backup”的新文件夹,其中所有权重和元数据都在那里:

当我尝试从该文件夹加载该文件时:

import tensorflow as tf


labels_dict={
              1: 'Yes', 
              0: 'No'
            }


with tf.Session() as sess:


    saver = tf.train.import_meta_graph('../new_backup/1.meta')
    restore = saver.restore(sess,tf.train.latest_checkpoint('../new_backup/'))
    graph=tf.get_default_graph()

    query= graph.get_tensor_by_name("input:0")
    result=graph.get_tensor_by_name("netout:0")
Run Code Online (Sandbox Code Playgroud)

然后我收到此错误:

NotFoundError: /home/g_cloud/exe_paul/1epoch1000; No such file or directory
Run Code Online (Sandbox Code Playgroud)

那是我的云帐户,1epoch1000 是旧文件夹,在训练期间保存了所有重量。我的问题是,如果我转到云并在存在文件夹 1epoch1000 时使用相同的脚本来恢复模型,则脚本正在运行,否则会出现该错误。

我如何更改元以重定向路径或如何在任何地方恢复模型?

python checkpoint python-3.x tensorflow

1
推荐指数
1
解决办法
4005
查看次数