我正在尝试使用statsmodels和pandas数据帧运行多个OLS回归.对于不同的行,不同的列中缺少值,并且我不断收到错误消息:ValueError:数组不能包含infs或NaNs我看到了这个问题,这是类似但不完全回答我的问题:statsmodel.api. Logit:valueerror数组不能包含infs或nans
我想要做的是运行回归并忽略我在此回归中使用的变量缺少变量的所有行.现在我有:
import pandas as pd
import numpy as np
import statsmodels.formula.api as sm
df = pd.read_csv('cl_030314.csv')
results = sm.ols(formula = "da ~ cfo + rm_proxy + cpi + year", data=df).fit()
Run Code Online (Sandbox Code Playgroud)
我想要一些像缺失的东西="掉落".任何建议将不胜感激.非常感谢.
我对 Python 很陌生。我刚刚使用 Python 创建了一个 CSV 文件,现在我想将其保存到驱动器上的目录中,以便我可以使用 Excel、SAS 等访问它。我该如何操作?这是我的代码:
directory='C:\Users\Documents\pyth\tweet_sentiment.csv'
output=zip(tweets_list, positive_counts) #brings the two variables together for merging to csv
writer=csv.writer(open(directory, 'wb'))
writer.writerows(output) #sends list to the csv
Run Code Online (Sandbox Code Playgroud)
当我运行这个时,我收到一个错误:
IOError: [Errno 22] 无效模式 ('wb') 或文件名: 'C:\Users\Documents\pyth\tweet_sentiment.csv'
我应该怎么办?