小编Har*_*y M的帖子

在read_csv之后选择pandas数据帧中的列时出现键错误

我正在尝试将CS​​V文件读入pandas数据帧并选择一列,但不断收到密钥错误.

该文件成功读入,我可以在iPython笔记本中查看数据帧,但是当我想选择除第一个列以外的列时,它会抛出一个键错误.

我正在使用此代码:

import pandas as pd

transactions = pd.read_csv('transactions.csv',low_memory=False, delimiter=',', header=0, encoding='ascii')
transactions['quarter']
Run Code Online (Sandbox Code Playgroud)

这是我正在处理的文件:https: //www.dropbox.com/s/imd7hq2iq23hf8o/transactions.csv?dl = 0

谢谢!

python csv pandas

16
推荐指数
3
解决办法
5万
查看次数

如何使用PHP在三列中显示列表?

在过去的几个小时里,我一直试图弄清楚PHP代码在三列中显示一个列表,以便它有这个订单

A D G
B E H
C F I
Run Code Online (Sandbox Code Playgroud)

但我真的迷路了.谁能帮我这个?我目前只有按此顺序列出的代码

A B C
D E F
G H I
Run Code Online (Sandbox Code Playgroud)

这是我目前的代码:

echo '<table><tr>';
foreach ($categories as $k => $category) {
    if ($k % 3 == 0 && $k ! = 0) {
        echo '</tr><tr>';
    }
    echo '<td><a href="category.php?category='.$category["id"].'">'.$category["category"].'</a></td>';
}
echo '</table>';
Run Code Online (Sandbox Code Playgroud)

html php html-table

6
推荐指数
2
解决办法
9697
查看次数

knitr sql块没有将数据保存到变量中

当我以交互方式运行所有块时,带有 SQL 块的 RMarkdown 笔记本运行良好,但是当我尝试编织时,SQL 块没有将数据保存到指定的变量中。当应该使用 SQL 块生成的数据集在以后的 R 块中引用时,数据集变量只是空的。

这是一个例子

{r setup, include=FALSE, warning=FALSE, message=FALSE}
# load necessary libraries
library(bigrquery)
library(knitr)
library(tidyverse)

db <- dbConnect(dbi_driver(), dataset = 'sandbox', project = 'project_id', use_legacy_sql = FALSE)

df <- NULL
```


```{sql, connection=db, output.var=df}
select * from example_dataset
limit 10
```
returns dataset


```{r}
head(df)
```
NULL
Run Code Online (Sandbox Code Playgroud)

我在这里尝试了解决方案(R: Knitr 为 SQL-chunk 提供了错误),但它没有解决我的问题。

sql r rstudio knitr google-bigquery

4
推荐指数
1
解决办法
570
查看次数

在R中使用str_extract在带有正则表达式的子字符串之前提取数字

我想在stringr包中使用str_extract从表单的字符串中提取数字XX nights etcetc

我目前正在这样做:

library(stringr)

str_extract("17 nights$5 Days", "(\\d)+ nights")
Run Code Online (Sandbox Code Playgroud)

但这又回来了

"17 nights"

代替17

如何只提取数字?我以为用括号指定提取组会起作用,但是没有用。

regex r stringr tidyverse

4
推荐指数
2
解决办法
103
查看次数

在OS X上安装Google Cloud SDK时,install.sh存在python问题

我正在尝试从此处安装适用于OS X的Google Cloud SDK https://cloud.google.com/sdk/docs/quickstart-mac-os-x

我解压缩然后尝试运行install.sh脚本, sh install.sh 但不断收到此错误:

/Library/Frameworks/Python.framework/Versions/2.7/Resources/Python.app/Contents/MacOS/Python: can't open file '/Users/bill/bin/bootstrapping/install.py': [Errno 2] No such file or directory

我尝试安装和卸载Python,并且还改变了安装程序使用的Python版本 CLOUDSDK_PYTHON=path/to/pyton2.7,但它没有解决iusse问题.

python macos google-app-engine python-2.7 google-cloud-platform

3
推荐指数
1
解决办法
2512
查看次数

SQL:如果前一个日期超过 1 天前,则获取一系列日期的最小日期

我有一个每周发生的数据导入,当它开始时,会持续几天。因此,在日期列中,每个数据导入我都有多个日期。我想获得每次导入的最小日期。这在 SQL 中可能吗?具体来说,在 Google BigQuery 中。例子:

date    desired_output
4/25/17 4/25/17
4/26/17 4/25/17
4/27/17 4/25/17
5/2/17  5/2/17
5/3/17  5/2/17
5/10/17 5/10/17
5/16/17 5/16/17
5/17/17 5/16/17
5/23/17 5/23/17
5/24/17 5/23/17
5/30/17 5/30/17
5/31/17 5/30/17
6/5/17  6/5/17
6/6/17  6/6/17
Run Code Online (Sandbox Code Playgroud)

sql window-functions google-bigquery

3
推荐指数
1
解决办法
1315
查看次数

在 RStudio 中更改 R 笔记本中的绘图打印纵横比或大小,而不使绘图变为全宽

我想更改在 RStudio 的 R 笔记本中打印的绘图的纵横比或图形大小。

我可以使用fig.asp块参数调整纵横比。例如,在下面的最小示例中,绘图纵横比正确地变为 2。但是,与此同时,绘图也变得非常大,在笔记本中全宽(下面的屏幕截图)。如何更改纵横比而不使绘图在笔记本中变成全宽?指定fig.widthout.width参数没有什么区别。

环境:

R version: 3.6.1 (2019-07-05)
RStudio version: 1.2.1541
platform       x86_64-apple-darwin15.6.0   
arch           x86_64                      
os             darwin15.6.0                
system         x86_64, darwin15.6.0 
Run Code Online (Sandbox Code Playgroud)

最小的例子:

---
title: "R Notebook"
output: html_notebook
---

This is an [R Markdown](http://rmarkdown.rstudio.com) Notebook. When you 
execute code within the notebook, the results appear beneath the code. 

Try executing this chunk by clicking the *Run* button within the chunk or 
by placing your cursor inside it and pressing *Cmd+Shift+Enter*. 

```{r, …
Run Code Online (Sandbox Code Playgroud)

r rstudio knitr r-markdown

3
推荐指数
1
解决办法
3557
查看次数

如何使Twitter Bootstrap导航栏具有自动调整的宽度?

有没有一种方法可以使Twitter Bootstrap导航栏仅与显示在其上的菜单项一样宽?默认情况下,我的导航栏只有4个项目,而用户登录时只有5个,但是导航栏太宽了。我尝试过更改跨度,但是这样会弄乱对齐方式,并且导航栏不再正确集中。有人可以帮忙吗?谢谢!

或者,如果有人可以帮助我将导航栏设置为固定宽度,而又不使其偏移并保持集中状态,我也将不胜感激。

这是我的navbar代码:

            <div id="top" class="container">
        <div class="navbar">
            <div class="navbar-inner">
                <ul class="nav">
                    <li><a href="index.php">Home</a></li>
                    <li><a href="books.php">Used books exchange</a></li>
                    <li><a href="submit.php">Submit a listing</a></li>
                    <li><a href="account.php">My account</a></li>
                    <?php if (!empty($_SESSION["id"]))
            {
            print('<li><a href="logout.php">Log out</a></li>');
            } ?>
                </ul>
            </div>
        </div>
Run Code Online (Sandbox Code Playgroud)

css twitter-bootstrap

2
推荐指数
1
解决办法
7826
查看次数

写一个tidyeval函数来重命名dplyr中的因子级别

我正在尝试编写一个tidyeval函数,该函数接受一个数字列,用值替换某个值以上limit的值limit,将该列转换为一个因子,然后将因子级别替换为limit一个名为"limit +"的级别.

例如,我试图用sepal.width替换3以上的任何值,然后将该因子级别重命名为3+.

作为一个例子,这是我试图使它与虹膜数据集一起工作的方式.但是,fct_recode()函数没有正确地重命名因子级别.

plot_hist <- function(x, col, limit) {
  col_enq <- enquo(col)
  x %>% 
    mutate(var = factor(ifelse(!!col_enq > limit, limit,!!col_enq)),
           var = fct_recode(var, assign(paste(limit,"+", sep = ""), paste(limit))))
}

plot_hist(iris, Sepal.Width, 3)
Run Code Online (Sandbox Code Playgroud)

r ggplot2 dplyr tidyeval

2
推荐指数
1
解决办法
285
查看次数

使用preg_match检查电子邮件域

如何修改下面的preg_match函数以允许所有以harvard.edu电子邮件地址结尾的电子邮件地址,而不仅仅是@ college.harvard.edu的电子邮件地址?

if(!preg_match("/@college\.harvard\.edu$/", $_POST["username"]))
    {
        apologize("You must provide a Harvard email to register.");
    }  
Run Code Online (Sandbox Code Playgroud)

php

1
推荐指数
1
解决办法
1943
查看次数

生成所有可能的对并计算R中的频率

我有一个产品(苹果,梨,香蕉)的数据框架在不同类别(食品和食品)的不同地点(城市)销售.

我想要计算任何一对产品在任何类别中出现的次数.

这是我试图使其工作的示例数据集:

category <- c('food','food','food','food','food','food','edibles','edibles','edibles','edibles', 'edibles')
location <- c('houston, TX', 'houston, TX', 'las vegas, NV', 'las vegas, NV', 'philadelphia, PA', 'philadelphia, PA', 'austin, TX', 'austin, TX', 'charlotte, NC', 'charlotte, NC', 'charlotte, NC')
item <- c('apple', 'banana', 'apple', 'pear', 'apple', 'pear', 'pear', 'apple', 'apple', 'pear', 'banana')

food_data <- data.frame(cbind(category, location, item), stringsAsFactors = FALSE)
Run Code Online (Sandbox Code Playgroud)

例如,"apple&banana"对出现在"las vegas,NV"的"food"类别中,但也出现在"charlotte,NC"的"foods"类别中.因此,"苹果和香蕉"对的计数为2.

我想要的输出是这样的对数:

(无序)苹果和香蕉的数量

2

(无序)苹果和梨的数量

4

任何人都知道如何实现这一目标?相对较新的R并且已经混淆了一段时间.

我正在尝试使用它来计算不同项目之间的亲和力.

关于输出的补充说明:我的完整数据集包含数百个不同的项目.想获得一个数据框,其中第一列是该对,第二列是每对的计数.

r dplyr

1
推荐指数
1
解决办法
864
查看次数

使用 tidyeval 编写自定义 case_when 函数以在 dplyr mutate 中使用

我正在尝试编写一个自定义 case_when 函数以在 dplyr 内部使用。我一直在阅读其他问题中发布的 tidyeval 示例,但仍然不知道如何使其工作。这是一个代表:

\n\n
df1 <- data.frame(animal_1 = c("Horse", "Pig", "Chicken", "Cow", "Sheep"),\n           animal_2 = c(NA, NA, "Horse", "Sheep", "Chicken"))\n\n\ntranslate_title <- function(data, input_col, output_col) {\n  mutate(data, \n    !!output_col := case_when(\n    input_col == "Horse" ~ "Cheval",\n    input_col == "Pig" ~ "\xd0\xa0orc",\n    input_col == "Chicken" ~ "Poulet",\n    TRUE ~ NA)\n  )\n}\n\n\ndf1 %>% \n  translate_title("animal_1", "animaux_1") %>% \n  translate_title("animal_2", "animaux_2")\n
Run Code Online (Sandbox Code Playgroud)\n\n

当我尝试运行它时,我得到\nError in mutate_impl(.data, dots) : Evaluation error: must be type string, not logical.

\n\n

另外,我实际上想重写该函数,以便可以像这样使用它:

\n\n
df1 …
Run Code Online (Sandbox Code Playgroud)

r dplyr tidyverse tidyeval

0
推荐指数
1
解决办法
582
查看次数