小编Ron*_*hah的帖子

Python Pandas错误标记数据

我正在尝试使用pandas来操作.csv文件,但是我收到此错误:

pandas.parser.CParserError:标记数据时出错.C错误:第3行预计有2个字段,见12

我曾尝试阅读熊猫文档,但一无所获.

我的代码很简单:

path = 'GOOG Key Ratios.csv'
#print(open(path).read())
data = pd.read_csv(path)
Run Code Online (Sandbox Code Playgroud)

我该如何解决这个问题?我应该使用该csv模块还是其他语言?

档案来自晨星

python csv pandas

284
推荐指数
20
解决办法
47万
查看次数

输入字段需要jQuery add

我一直在寻找方法让jQuery自动写入使用html5验证到我的所有输入字段,但我无法告诉它在哪里写它.

我想接受这个

 <input type="text" name="first_name" value="" id="freeform_first_name"
 maxlength="150">
Run Code Online (Sandbox Code Playgroud)

并在结束标记之前自动添加所需内容

 <input type="text" name="first_name" value="" id="freeform_first_name"
 maxlength="150" required>
Run Code Online (Sandbox Code Playgroud)

我以为我可以做一些事情

$("input").attr("required", "true");
Run Code Online (Sandbox Code Playgroud)

但它不起作用.任何帮助是极大的赞赏.

javascript validation jquery

143
推荐指数
6
解决办法
36万
查看次数

替换数据框中的所有特定值

有了数据框,我该如何替换所有行和列中的所有特定值.比方说,我想用NA's 替换所有空记录(不输入位置):

df <- data.frame(list(A=c("", "xyz", "jkl"), B=c(12, "", 100)))

    A   B
1      12
2  xyz    
3  jkl 100
Run Code Online (Sandbox Code Playgroud)

预期结果:

    A   B
1  NA   12
2  xyz  NA  
3  jkl  100
Run Code Online (Sandbox Code Playgroud)

replace r dataframe

77
推荐指数
4
解决办法
26万
查看次数

从列表中选择多个元素

我有一个R列表,大约10,000个元素.假设我只想选择元素5,7和9.我不确定如果没有for循环我会怎么做.

我想做一些类似mylist[[c(5,7,9]]但不起作用的事情.我也试过这个lapply功能,但也无法让它工作.

r list subset

71
推荐指数
1
解决办法
10万
查看次数

给出2个句子字符串计算余弦相似度

Python:tf-idf-cosine:为了找到文档相似性,可以使用tf-idf余弦计算文档相似度.没有导入外部库,是否有任何方法可以计算2个字符串之间的余弦相似度?

s1 = "This is a foo bar sentence ."
s2 = "This sentence is similar to a foo bar sentence ."
s3 = "What is this string ? Totally not related to the other two lines ."

cosine_sim(s1, s2) # Should give high cosine similarity
cosine_sim(s1, s3) # Shouldn't give high cosine similarity value
cosine_sim(s2, s3) # Shouldn't give high cosine similarity value
Run Code Online (Sandbox Code Playgroud)

python string nlp similarity cosine-similarity

69
推荐指数
3
解决办法
9万
查看次数

如何汇总数值列表元素

我想知道一种优雅的方式,允许对列表的数值求和(或计算平均值).例如

x <- list( a = matrix(c(1,2,3,4), nc=2), b = matrix(1, nc=2, nr=2))
Run Code Online (Sandbox Code Playgroud)

并希望得到

x[[1]]+x[[2]] 
Run Code Online (Sandbox Code Playgroud)

或者意思是:

(x[[1]]+x[[2]])/2
Run Code Online (Sandbox Code Playgroud)

r

44
推荐指数
2
解决办法
3万
查看次数

在Windows上通过命令行运行jupyter

我在Windows 10,python 3.x via上安装了Jupyter

$ pip install jupyter
Run Code Online (Sandbox Code Playgroud)

安装工作正常,即使我确实重新启动了终端.

但试图跑

$ jupyter notebook
Run Code Online (Sandbox Code Playgroud)

'jupyter'不被识别为内部或外部命令,可操作程序或批处理文件.

我如何以及在哪里找到Jupyter的可执行文件?

python jupyter jupyter-notebook

44
推荐指数
7
解决办法
12万
查看次数

*不支持的操作数类型:'float'和'Decimal'

我只是在玩学习类函数等,所以我决定创建一个简单的函数,应该给我什么税额.

到目前为止这是我的代码.

class VAT_calculator:
    """
     A set of methods for VAT calculations.
    """

    def __init__(self, amount=None):
        self.amount = amount
        self.VAT = decimal.Decimal('0.095')

    def initialize(self):
        self.amount = 0

    def total_with_VAT(self):
        """
        Returns amount with VAT added.
        """
        if not self.amount:
            msg = u"Cannot add VAT if no amount is passed!'"
            raise ValidationError(msg)

        return (self.amount * self.VAT).quantize(self.amount, rounding=decimal.ROUND_UP)
Run Code Online (Sandbox Code Playgroud)

我的问题是我收到以下错误:

不支持的操作数类型*:'float'和'Decimal'**

我不明白为什么这不起作用!

python django

40
推荐指数
2
解决办法
6万
查看次数

如何在R中的dplyr过滤器中指定"不包含"

我是R的新手

使用被调用的表SE_CSVLinelist_clean,我想提取名为where_case_travelled_1DOES 的变量不包含字符串"Outside Canada"OR的行"Outside province/territory of residence but within Canada".然后创建一个名为的新表SE_CSVLinelist_filtered.

SE_CSVLinelist_filtered <- filter(SE_CSVLinelist_clean, 
where_case_travelled_1 %in% -c('Outside Canada','Outside province/territory of residence but within Canada'))
Run Code Online (Sandbox Code Playgroud)

当我只使用"c"而不是"-c"时,上面的代码有效.
那么,当我真的想要排除包含国家或省外的行时,如何指定上述内容呢?

非常感谢

r filter dplyr

37
推荐指数
2
解决办法
6万
查看次数

pivot_wider 问题“`values_from` 中的值不是唯一标识的;输出将包含列表列”

我的数据如下所示:

# A tibble: 6 x 4
  name          val time          x1
  <chr>       <dbl> <date>     <dbl>
1 C Farolillo     7 2016-04-20  51.5
2 C Farolillo     3 2016-04-21  56.3
3 C Farolillo     7 2016-04-22  56.3
4 C Farolillo    13 2016-04-23  57.9
5 C Farolillo     7 2016-04-24  58.7
6 C Farolillo     9 2016-04-25  59.0
Run Code Online (Sandbox Code Playgroud)

我正在尝试使用该pivot_wider函数根据name列扩展数据。我使用以下代码:

yy <- d %>% 
  pivot_wider(., names_from = name, values_from = val)
Run Code Online (Sandbox Code Playgroud)

这给了我以下警告消息:

Warning message:
Values in `val` are not uniquely identified; output will contain …
Run Code Online (Sandbox Code Playgroud)

r tidyr

33
推荐指数
4
解决办法
2万
查看次数