我想展平从HTML表中提取的列表.下面介绍一个最小的工作示例.该示例取决于stringrR中的包.第一个示例表现出所需的行为.
years <- c("2005-", "2003-")
unlist(str_extract_all(years,"[[:digit:]]{4}"))
[1] "2005" "2003"
Run Code Online (Sandbox Code Playgroud)
当我尝试匹配一系列其他数字中的最后4位数时,下面的示例会产生不良结果.
years1 <- c("2005-", "2003-", "1984-1992, 1996-")
unlist(str_extract_all(years1,"[[:digit:]]{4}$"))
character(0)
Run Code Online (Sandbox Code Playgroud)
据我理解文档,我应该包含$在模式的末尾,以便在字符串的末尾请求匹配.我更愿意从第二个例子中匹配数字,"2005","2003"和"1996".
我正在尝试使用 Firefox/Selenium 实例作为图像的基本幻灯片。这个想法是我将从本地目录中打开一个webdriver和driver.get()文件。
当我运行以下命令时,我收到一个错误:
selenium.common.exceptions.WebDriverException: Message: Tried to run command without establishing a connection
我的假设是 selenium 正在尝试测试下一个driver.get()请求并且不允许本地的、非网络连接的连接有没有办法绕过这种行为?我的代码示例如下所示:
from selenium import webdriver
import time
from os import listdir
from selenium.common.exceptions import WebDriverException
driver = webdriver.Firefox()
image_source = '/home/pi/Desktop/slideshow/photo_frames/daniel/images/'
for file in listdir(image_source):
if file.endswith('jpg'):
file_name = image_source + file
driver.get(file_name)
time.sleep(5)
Run Code Online (Sandbox Code Playgroud)
与往常一样,任何帮助将不胜感激。
更新:我应该补充一点,相同的基本脚本结构适用于网站 - 我可以循环浏览多个网站而不会出现任何错误。
我得到了二进制数据的数据集,表明虚拟测试的正确/错误测试答案.我将这些数据导入到R中以对其进行分析.
我很难将数据集导入R而没有R将每行中的值更改为单个大数字.我最初的信念是缺乏划界字符会引起我的问题.
.txt文件的前几行显示如下:
11011111110001100000001110000010
11111100110000001010001000100000
00001011110000000000000010001000
11110101000101100111000100000110
10000000100000100101000000101000
11111110001000001001000010000000
当我将这些行读入R时,我收到:
1.101111e + 31
1.111110e + 31
1.011110e + 27
1.111010e + 31
1.000000e + 31
1.111111e + 31
而不是表示测试结果的1s和0s的行.
我有一个.csv文件格式如下:
A B C D E F
X1 X2 X3 X4 X5 X6
Y1 Y2 Y3 Y4 Y5 Y6
Z1 Z2 Z3 Z4 Z5 Z6
Run Code Online (Sandbox Code Playgroud)
我想要的是:
A X1
B X2
C X3
D X4
E X5
F X6
A Y1
B Y2
C Y3
D Y4
E Y5
F Y6
A Z1
B Z2
C Z3
D Z4
E Z5
F Z6
Run Code Online (Sandbox Code Playgroud)
我无法围绕内置的转置函数进行思考,以实现最终结果.任何帮助,将不胜感激.
我正在尝试累积地址,以便将它们绘制在R中的地图上.我手动获取地址并将它们输入到.csv中以导入到R.中.csv的格式如下:
streetnumber | 街道| 城市| 州
1150 | FM 1960 West Road | 休斯顿| TX
701 | 凯勒百汇| 凯勒| TX
每个标题(街道号,街道,城市和州)用于唯一列,下面的数据分为各自的列.
我让R读取.csv中的信息并将其转换为适合Google Maps API使用的格式.我有API生成一个.xml文件,其中包含与输入的地址相对应的信息.最小的工作示例如下:
streetnumber1<-paste(data$streetnumber,sep="")
street1<-gsub(" ","+",data$street)
street2<-paste(street1,sep="")
city1<-paste(data$city,sep="")
state1<-paste(data$state,sep="")
url<-paste("http://maps.googleapis.com/maps/api/geocode/xml?address="
,streetnumber1,"+",street2,",+",city1,",+",state1,"&sensor=false",sep="")
Run Code Online (Sandbox Code Playgroud)
通过调用url生成两个可以输入Web浏览器的Web地址,以导航到Google Maps API提供的.xml数据.
我想为.csv文件中的所有地址发生这种情况,而不是我声明应该生成url的次数.我觉得这是一个apply功能的工作,但我不确定如何去做.一旦我自动化R和API之间的交互,我想解析获得的.xml,以便我可以提取我正在寻找的信息.