小编Sar*_*ang的帖子

迭代Pandas系列时出错

当我得到这个系列的第一个和第二个元素时,它工作正常,但是从元素3开始,当我尝试获取时出错.

type(X_test_raw)
Out[51]: pandas.core.series.Series

len(X_test_raw)
Out[52]: 1393

X_test_raw[0]
Out[45]: 'Go until jurong point, crazy.. Available only in bugis n great world la e buffet... Cine there got amore wat...'

X_test_raw[1]
Out[46]: 'Ok lar... Joking wif u oni...'

X_test_raw[2]
Run Code Online (Sandbox Code Playgroud)

KeyError:2

python indexing for-loop pandas keyerror

9
推荐指数
2
解决办法
9749
查看次数

没有这样的文件或目录:'/ usr/local/bin/pip'

我早先在我的OSX上安装了pip,但它不能以某种方式工作.所以,我试图再次使用命令安装pip:

sudo easy_install pip
Run Code Online (Sandbox Code Playgroud)

但它给我的错误如下:

pip 9.0.1 is already the active version in easy-install.pth
Installing pip script to /usr/local/bin
error: [Errno 2] No such file or directory: '/usr/local/bin/pip'
Run Code Online (Sandbox Code Playgroud)

我既不能使用pip,也不能安装它.

python macos pip

7
推荐指数
3
解决办法
1万
查看次数

OperationalError:(sqlite3.OperationalError)SQL变量过多,而将SQL与数据帧一起使用

我有一个熊猫数据框如下。

       activity         User_Id  \
0  VIEWED MOVIE  158d292ec18a49   
1  VIEWED MOVIE  158d292ec18a49   
2  VIEWED MOVIE  158d292ec18a49   
3  VIEWED MOVIE  158d292ec18a49   
4  VIEWED MOVIE  158e00978d7a6c   

                                         Media_Title Media_Type User_Rating  
0  20th Asian Athletics Championship-2013 Held At...                     NA  
1                                 Tu Majha Saangaati                     NA  
2                                       Home Cooking                     NA  
3                                         Mix Dil Se                     NA  
4                  Value, Virtues, Ethics & Morality                     NA
Run Code Online (Sandbox Code Playgroud)

我正在尝试使用pandasql的sqldf软件包编写一个SQL查询,如下所示。

distinct_activity_user = pandasql.sqldf(" select User_Id from pmm_activity", locals())
Run Code Online (Sandbox Code Playgroud)

我得到的错误是:

OperationalError: (sqlite3.OperationalError) too many SQL variables [SQL: 'INSERT INTO pmm_activity (activity, "User_Id", "Media_Title", "Media_Type", …
Run Code Online (Sandbox Code Playgroud)

python dataframe pandas

6
推荐指数
1
解决办法
521
查看次数

使用pandas dataframe合并CSV

我使用以下代码.我的所有CSV文件都具有统一的结构.形成数据框时,它在我的CSV中包含两列日期.

在结果数据框中,对于少数行,日期值在第一个日期列中,而对于其余数据,它将转到第二个日期列.

不知道为什么要为源CSV文件中的一列生成两列(日期列).

all_data = pd.DataFrame()
for f in glob.glob("/Users/tcssig/Desktop/Files/*.csv"):
    df = pd.read_csv(f)
    all_data = all_data.append(df,ignore_index=True)

In [76]: all_data.columns
Out[76]: Index(['0', '0.1', 'Channel_ID', 'Date', 'Date ', 'Duration (HH:MM)','Episode #', 'Image', 'Language', 'Master House ID', 'Parental Rating','Program Category', 'Program Title', 'StartTime_ET', 'StartTime_ET2','Synopsis'],
 dtype='object')
Run Code Online (Sandbox Code Playgroud)

python csv pandas

1
推荐指数
1
解决办法
68
查看次数

inplace修改R中的向量

我在R中有一个矢量'参与者'

> participant
 [1]  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Run Code Online (Sandbox Code Playgroud)

我正在使用函数'modify'来更改此向量的内容.

modify <- function(x){
    for (i in participant){ 
    if (x[i] > 12) 
        (x[i]=x[i]-12)
        print (x[i])
}}
Run Code Online (Sandbox Code Playgroud)

当我将该函数作为modify(参与者)运行时,它运行正常,但向量参与者的元素保持不变.

有什么建议,我哪里出错了?

r vector

0
推荐指数
1
解决办法
64
查看次数

标签 统计

python ×4

pandas ×3

csv ×1

dataframe ×1

for-loop ×1

indexing ×1

keyerror ×1

macos ×1

pip ×1

r ×1

vector ×1