小编Dan*_*iel的帖子

使用stringr从R中的系列中提取最后4位数字

我想展平从HTML表中提取的列表.下面介绍一个最小的工作示例.该示例取决于stringrR中的包.第一个示例表现出所需的行为.

years <- c("2005-", "2003-")
unlist(str_extract_all(years,"[[:digit:]]{4}"))

[1] "2005" "2003"
Run Code Online (Sandbox Code Playgroud)

当我尝试匹配一系列其他数字中的最后4位数时,下面的示例会产生不良结果.

years1 <- c("2005-", "2003-", "1984-1992, 1996-")
unlist(str_extract_all(years1,"[[:digit:]]{4}$"))

character(0)
Run Code Online (Sandbox Code Playgroud)

据我理解文档,我应该包含$在模式的末尾,以便在字符串的末尾请求匹配.我更愿意从第二个例子中匹配数字,"2005","2003"和"1996".

regex r stringr

7
推荐指数
2
解决办法
7429
查看次数

Selenium 打开本地文件

我正在尝试使用 Firefox/Selenium 实例作为图像的基本幻灯片。这个想法是我将从本地目录中打开一个webdriverdriver.get()文件。

当我运行以下命令时,我收到一个错误: selenium.common.exceptions.WebDriverException: Message: Tried to run command without establishing a connection

我的假设是 selenium 正在尝试测试下一个driver.get()请求并且不允许本地的、非网络连接的连接有没有办法绕过这种行为?我的代码示例如下所示:

from selenium import webdriver
import time
from os import listdir
from selenium.common.exceptions import WebDriverException

driver = webdriver.Firefox()

image_source = '/home/pi/Desktop/slideshow/photo_frames/daniel/images/'

for file in listdir(image_source):
    if file.endswith('jpg'):
        file_name = image_source + file
        driver.get(file_name)
        time.sleep(5)
Run Code Online (Sandbox Code Playgroud)

与往常一样,任何帮助将不胜感激。

更新:我应该补充一点,相同的基本脚本结构适用于网站 - 我可以循环浏览多个网站而不会出现任何错误。

python selenium

3
推荐指数
3
解决办法
2万
查看次数

将非分隔的.txt文件读入R中

我得到了二进制数据的数据集,表明虚拟测试的正确/错误测试答案.我将这些数据导入到R中以对其进行分析.

我很难将数据集导入R而没有R将每行中的值更改为单个大数字.我最初的信念是缺乏划界字符会引起我的问​​题.

.txt文件的前几行显示如下:

11011111110001100000001110000010

11111100110000001010001000100000

00001011110000000000000010001000

11110101000101100111000100000110

10000000100000100101000000101000

11111110001000001001000010000000

当我将这些行读入R时,我收到:

1.101111e + 31

1.111110e + 31

1.011110e + 27

1.111010e + 31

1.000000e + 31

1.111111e + 31

而不是表示测试结果的1s和0s的行.

import r

2
推荐指数
1
解决办法
1218
查看次数

使用Python重新排列csv中的数据

我有一个.csv文件格式如下:

A   B   C   D   E   F
X1  X2  X3  X4  X5  X6
Y1  Y2  Y3  Y4  Y5  Y6
Z1  Z2  Z3  Z4  Z5  Z6
Run Code Online (Sandbox Code Playgroud)

我想要的是:

A   X1
B   X2
C   X3
D   X4
E   X5
F   X6
A   Y1
B   Y2
C   Y3
D   Y4
E   Y5
F   Y6
A   Z1
B   Z2
C   Z3
D   Z4
E   Z5
F   Z6
Run Code Online (Sandbox Code Playgroud)

我无法围绕内置的转置函数进行思考,以实现最终结果.任何帮助,将不胜感激.

python csv

1
推荐指数
1
解决办法
133
查看次数

从R中的XML Geoplot多个地址

我正在尝试累积地址,以便将它们绘制在R中的地图上.我手动获取地址并将它们输入到.csv中以导入到R.中.csv的格式如下:

streetnumber | 街道| 城市| 州

1150 | FM 1960 West Road | 休斯顿| TX

701 | 凯勒百汇| 凯勒| TX

每个标题(街道号,街道,城市和州)用于唯一列,下面的数据分为各自的列.

我让R读取.csv中的信息并将其转换为适合Google Maps API使用的格式.我有API生成一个.xml文件,其中包含与输入的地址相对应的信息.最小的工作示例如下:

streetnumber1<-paste(data$streetnumber,sep="")
street1<-gsub(" ","+",data$street)
street2<-paste(street1,sep="")
city1<-paste(data$city,sep="")
state1<-paste(data$state,sep="")

url<-paste("http://maps.googleapis.com/maps/api/geocode/xml?address="
,streetnumber1,"+",street2,",+",city1,",+",state1,"&sensor=false",sep="")
Run Code Online (Sandbox Code Playgroud)

通过调用url生成两个可以输入Web浏览器的Web地址,以导航到Google Maps API提供的.xml数据.

我想为.csv文件中的所有地址发生这种情况,而不是我声明应该生成url的次数.我觉得这是一个apply功能的工作,但我不确定如何去做.一旦我自动化R和API之间的交互,我想解析获得的.xml,以便我可以提取我正在寻找的信息.

xml geocoding r

0
推荐指数
1
解决办法
615
查看次数

标签 统计

r ×3

python ×2

csv ×1

geocoding ×1

import ×1

regex ×1

selenium ×1

stringr ×1

xml ×1