小编Jas*_*all的帖子

r - 检查 data.frame 列中的任何值是否为空

我想看看 data.frame 列是否有任何空值移动到下一个循环。我目前正在使用以下代码:

if (is.na(df[,relevant_column]) == TRUE ){next}
Run Code Online (Sandbox Code Playgroud)

发出警告:

在 if (is.na(df_cell_client[, numerator]) == TRUE) { ... : 条件长度 > 1 并且只使用第一个元素

如何检查任何值是否为空而不仅仅是第一行?

r dataframe

4
推荐指数
1
解决办法
3万
查看次数

将带有逗号的 Pandas 字符串列更改为 Float

我运行了代码:

df["VotesPerYear"] = df["Votes"]/df["Years"]
Run Code Online (Sandbox Code Playgroud)

并收到错误:

"TypeError: unsupported operand type(s) for /: 'unicode' and 'float'"
Run Code Online (Sandbox Code Playgroud)

df["Votes"] 是一串数字,以逗号作为千位分隔符。将其转换为浮点数以便我可以执行操作的最佳方法是什么?

typeerror dataframe python-2.7 pandas

3
推荐指数
1
解决办法
4940
查看次数

Pandas Excelwriter 内存错误

import pandas

#Ignores a value is trying to be set on a copy of a slice from a DataFrame(side note if I shouldn't be doing this please let me know too)
pandas.options.mode.chained_assignment = None

#opens file
f = pandas.read_excel('.../foo.xlsx', sheetname=0)

#sort by header_number and adjust index
f = f.sort(columns=['FY15'],ascending=[0])
f.index = range(0,len(f))

#create field column
f['AB_Test'] = ''

#A/B Iteration
for i, row in enumerate(f['AB_Test']):

    if i % 2 == 0:
        f['AB_Test'][i] = 'A'
    else:
        f['AB_Test'][i] = 'B'

print f …
Run Code Online (Sandbox Code Playgroud)

python pandas

2
推荐指数
1
解决办法
5937
查看次数

如何在熊猫中使用通配符(%)read_sql()

我正在尝试运行一个MySQL查询,其中包含文本通配符,如下所示:

import sqlalchemy
import pandas as pd

#connect to mysql database
engine = sqlalchemy.create_engine('mysql://user:@localhost/db?charset=utf8')
conn = engine.connect()

#read sql into pandas dataframe
mysql_statement = """SELECT * FROM table WHERE field LIKE '%part%'; """
df = pd.read_sql(mysql_statement, con=conn)
Run Code Online (Sandbox Code Playgroud)

运行时,出现如下所示与格式相关的错误。

TypeError:格式字符串的参数不足

在使用Pandas读取MySQL时如何使用通配符?

python mysql wildcard python-2.7

2
推荐指数
2
解决办法
4316
查看次数

R - 你能按字母顺序比较哪个值是第一个吗?

如果我有价值观:

x <- 'random'
y <- 'word'
Run Code Online (Sandbox Code Playgroud)

我可以在y之前或之后按字母顺序进行测试吗?在这个例子中类似于一个会产生的函数:

按字母顺序排列(x,y) - >真

按字母顺序排列(y,x) - >错误

r alphabetical

2
推荐指数
2
解决办法
1529
查看次数

从熊猫系列中删除少于4个字符的单词

我试图从Pandas系列中的每个标量值中删除少于4个字符的所有单词.最好的方法是什么?这是我失败的尝试:

df['text'] = df['text'].str.join(word for word in df['text'].str.split() if len(word)>3)
Run Code Online (Sandbox Code Playgroud)

我收到以下错误消息:

AttributeError:'generator'对象没有属性'join'

我基于字符串中的相同内容尝试关闭此帖子:使用Python删除小词

附注:如果在删除少于4个字符之前更好地标记我的单词,请告诉我.

编辑:每个标量值包含句子,因此我想删除值中小于4的任何单词.

python parsing nlp pandas

2
推荐指数
2
解决办法
3563
查看次数

标签 统计

pandas ×3

python ×3

dataframe ×2

python-2.7 ×2

r ×2

alphabetical ×1

mysql ×1

nlp ×1

parsing ×1

typeerror ×1

wildcard ×1