尝试在python脚本中使用Selenium和Chrome.
我收到以下错误:
WebDriverException: Message: 'chromedriver' executable needs to be in PATH. Please see https://sites.google.com/a/chromium.org/chromedriver/home
Run Code Online (Sandbox Code Playgroud)
我知道chromedriver可执行文件的位置.如何将其添加到PATH?
谢谢
我试图在这里找到一个简单的例子:https://www.datacamp.com/community/blog/jupyter-notebook-r#gs.OczVCjA
import warnings
warnings.filterwarnings('ignore')
# Load in the r magic
import rpy2.ipython
%reload_ext rpy2.ipython
# We need ggplot2
%R require(ggplot2)
%R library("ggplot2")
# Load in the pandas library
import pandas as pd
# Make a pandas DataFrame
df = pd.DataFrame({'Alphabet': ['a', 'b', 'c', 'd','e', 'f', 'g', 'h','i'],
'A': [4, 3, 5, 2, 1, 7, 7, 5, 9],
'B': [0, 4, 3, 6, 7, 10,11, 9, 13],
'C': [1, 2, 3, 1, 2, 3, 1, 2, 3]})
# …Run Code Online (Sandbox Code Playgroud) 从 csv 文件加载数据后,我将索引设置为“日期”列,然后将索引转换为日期时间。
df1=pd.read_csv('Data.csv')
df1=df1.set_index('Date')
df1.index=pd.to_datetime(df1.index)
Run Code Online (Sandbox Code Playgroud)
但是转换后日期时间格式显示它被误解了:
原始日期是例如 01-10-2014 00:00:00
但 Pandas 将其转换为 2014-01-10 00:00:00
如何让 Pandas 尊重或识别原始日期格式?
谢谢
我想将“字节”数据转换为Pandas数据框。
数据如下所示(前几行):
(b'#Settlement Date,Settlement Period,CCGT,OIL,COAL,NUCLEAR,WIND,PS,NPSHYD,OCGT'
b',OTHER,INTFR,INTIRL,INTNED,INTEW,BIOMASS\n2017-01-01,1,7727,0,3815,7404,3'
b'923,0,944,0,2123,948,296,856,238,\n2017-01-01,2,8338,0,3815,7403,3658,16,'
b'909,0,2124,998,298,874,288,\n2017-01-01,3,7927,0,3801,7408,3925,0,864,0,2'
b'122,998,298,816,286,\n2017-01-01,4,6996,0,3803,7407,4393,0,863,0,2122,998'
Run Code Online (Sandbox Code Playgroud)
列标题显示在顶部。接下来的每一行都是一个时间戳和数字。
有没有简单的方法可以做到这一点?
非常感谢你
@Paula Livingstone:
这似乎可行:
s=str(bytes_data,'utf-8')
file = open("data.txt","w")
file.write(s)
df=pd.read_csv('data.txt')
Run Code Online (Sandbox Code Playgroud)
也许可以在不使用文件的情况下完成此操作。
我创建了一个数据透视表,该表根据其中一列和时间索引的月份进行分组。
这是数据透视表
AWRT AWFT AWDT
Time type
April All 38.190119 65.789103 27.598984
DHW 19.676627 60.889196 41.212569
SH 47.342757 61.335566 13.992809
February All 43.896487 57.982944 14.086457
SH 40.864670 50.567133 9.702463
March All 42.083836 69.139818 27.055982
DHW 18.908873 62.936898 44.028024
SH 52.249342 70.013904 17.764563
Run Code Online (Sandbox Code Playgroud)
现在我希望二月、三月和四月按时间顺序出现,而不是按字母顺序排列
尝试以这种方式重新索引:
new_index=[['February', 'March', 'April'], ['All', 'DHW', 'SH']]
df1=df1.reindex(new_index)
Run Code Online (Sandbox Code Playgroud)
我得到以下内容,它不再是数据透视表:
AWRT AWFT AWDT
Time type
February All 43.896487 57.982944 14.086457
March DHW 18.908873 62.936898 44.028024
April SH 47.342757 61.335566 13.992809
Run Code Online (Sandbox Code Playgroud)
我还尝试直接访问数据透视表索引的标签,但我被告知这些标签是不可变的。
在此先感谢您的帮助