小编use*_*623的帖子

大熊猫如何合并保留秩序?

我在pandas中有两个DataFrame,试图合并它们.但是熊猫不断改变秩序.我已经尝试设置索引,重置它们,无论我做什么,我都无法获得返回的输出以使行具有相同的顺序.有诀窍吗?请注意,我们从贷款订单'a,b,c'开始,但在合并之后,它是"a,c,b".

import pandas
loans = [  'a',  'b', 'c' ]
states = [  'OR',  'CA', 'OR' ]
x = pandas.DataFrame({ 'loan' : loans, 'state' : states })
y = pandas.DataFrame({ 'state' : [ 'CA', 'OR' ], 'value' : [ 1, 2]})
z = x.merge(y, how='left', on='state')
Run Code Online (Sandbox Code Playgroud)

但现在订单不再是原来的'a,b,c'.有任何想法吗?我正在使用熊猫版本11.

python pandas

23
推荐指数
3
解决办法
2万
查看次数

Visual Studio(不是 VS Code)可以进行远程 ssh 开发吗?文档说是的,但是

这似乎应该通过谷歌搜索来解决,但我在过去的一个小时里一直在努力寻找,但找不到它。有很多链接说 Visual Studio(不是 VS Code)支持远程 ssh 开发(例如https://learn.microsoft.com/en-us/cpp/linux/connect-to-your-remote-linux-computer?view =vs-2019)但没有一个实际显示最后一步。Visual Studio可以在Linux上远程开发而不需要在本地安装代码吗?

在 VS Code 上,通过 SSH 进行远程开发的功能允许您指定远程地址,然后您甚至不需要本地代码,因为所有编辑和调试都是远程的。Visual Studio也有这个功能吗?上面的链接显示了如何设置与计算机的连接,但是我找不到任何实际连接到该计算机来浏览项目的方法。Visual Studio 中的远程开发如何进行?看起来我可以在 Windows 机器上本地复制代码,它会复制代码并在 Linux 上构建它?但是,是否没有像 VS Code 这样的选项,代码远程驻留在 Linux 机器上,而 VS 仅使用 ssh 来读取它?

remote-debugging visual-studio visual-studio-code

21
推荐指数
1
解决办法
1万
查看次数

为什么Visual Studio C++甚至需要在不需要它的文件中包含"StdAfx.h"?

我理解预编译的头文件正在使用"#include"StdAfx.h"并且是的,我知道我可以关闭它们.但这不是我的问题.

如果您使用预编译头文件,Visual C++要求每个 cpp文件#include"StdAfx.h",甚至是不使用StdAfx.h中任何头文件的文件.如果您忘记在一个文件中包含StdAfx.h,则会出错.但为什么?显而易见的方法就是"如果你包含StdAfx.h,那么该文件将使用它,但如果你忘记包含它,那么这些头文件就不会被包含在内." 我不明白为什么VC++会要求你在不需要的时候包含StdAfx.h.似乎它们更容易像普通的头文件一样对待它.

有什么理由需要这个吗?

c++ precompiled-headers stdafx.h visual-studio-2012 visual-studio-2015

8
推荐指数
2
解决办法
6613
查看次数

Why does Tensorflow 2 give a warning (but still work anyway) when the input is a pandas dataframe?

On Tensorflow 2.0, whenever I pass a Pandas DataFrame as the input, then Tensorflow works fine but prints out a warning WARNING:tensorflow:Falling back from v2 loop because of error: Failed to find data adapter that can handle input: <class 'pandas.core.frame.DataFrame'>, <class 'NoneType'>. I don't recall ever getting that error with TF 1.x so this must be new. But why is it a warning?

I understand what it's asking for, and yes, converting that DataFrame to a pure numpy array …

numpy dataframe pandas tensorflow tensorflow2.0

7
推荐指数
1
解决办法
1182
查看次数

pandas views vs copy:文档说"没人知道"?

关于链式索引以及特定操作是进行查看还是复制,StackOverflow上有很多问题.(例如,这里这里).我仍然没有完全理解它,但令人惊讶的部分是官方文档说"没人知道".(!?!??)这是文档中的一个例子; 你能告诉我他们是否真的这么说,或者他们只是在轻浮吗?

来自http://pandas-docs.github.io/pandas-docs-travis/indexing.html?highlight=view#why-does-assignment-fail-when-using-chained-indexing

def do_something(df):
   foo = df[['bar', 'baz']]  # Is foo a view? A copy? Nobody knows!
   # ... many lines here ...
   foo['quux'] = value       # We don't know whether this will modify df or not!
   return foo
Run Code Online (Sandbox Code Playgroud)

真的吗?对于那个具体的例子,"没人知道"并且这是非确定性的,这是真的吗?在两个不同的数据帧上,这真的会有不同的表现吗?规则真的很复杂吗?或者这个人是否意味着有一个明确的答案,但只是大多数人都没有意识到这一点?

python pandas

5
推荐指数
2
解决办法
422
查看次数

100%的高度离页面几个像素?

我正在尝试制作一个100%高度的页面框.但是在Chrome和IE浏览器中,以下内容从页面底部延伸了几个像素,因此我必须滚动.为什么?为什么这里有滚动条?

  <!doctype html>
  <html >
  <head>
    <style type="text/css">
        html, body 
        {
            margin: 0px;
            padding: 0px;
            height: 100%; 
        }
        div {
            border:5px solid black;
            height: 100%;
        }
    </style>
  </head>
  <body >
    <div >This flows a few pixels off the bottom of the page</div>
  </body>
</html>
Run Code Online (Sandbox Code Playgroud)

html css

4
推荐指数
1
解决办法
165
查看次数

如果 Keras 结果不可重复,那么比较模型和选择超参数的最佳做法是什么?

更新:这个问题是针对 Tensorflow 1.x 的。我升级到 2.0 并且(至少在下面的简单代码中)重现性问题似乎已在 2.0 上解决。这样就解决了我的问题;但我仍然很好奇 1.x 上针对此问题使用了哪些“最佳实践”。

在 keras/tensorflow 上训练完全相同的模型/参数/数据不会给出可重复的结果,并且每次训练模型时损失都显着不同。有很多关于此的 stackoverflow 问题(例如,如何在 keras 中获得可重现的结果),但推荐的解决方法似乎对我或 StackOverflow 上的许多其他人不起作用。好的,就是这样。

但是考虑到 keras 在张量流上的不可重复性的限制——比较模型和选择超参数的最佳实践是什么?我正在测试不同的架构和激活,但由于每次的损失估计都不同,我永远不确定一个模型是否比另一个更好。是否有处理此问题的最佳做法?

我认为这个问题与我的代码没有任何关系,但以防万一;这是一个示例程序:

import os
#stackoverflow says turning off the GPU helps reproducibility, but it doesn't help for me
os.environ["CUDA_DEVICE_ORDER"] = "PCI_BUS_ID"
os.environ["CUDA_VISIBLE_DEVICES"] = ""
os.environ['PYTHONHASHSEED']=str(1)

import tensorflow as tf
import tensorflow.keras as keras
import tensorflow.keras.layers 
import random
import pandas as pd
import numpy as np

#StackOverflow says this is needed for reproducibility but it doesn't help for …
Run Code Online (Sandbox Code Playgroud)

python reproducible-research keras tensorflow

3
推荐指数
2
解决办法
2231
查看次数