我正在使用最新版本的Rstudio和iMac
版本1.0.44 - ©2009-2016 RStudio,Inc.Mozilla/5.0(Macintosh; Intel Mac OS X 10_12_1)AppleWebKit/602.2.14(KHTML,与Gecko一样)
我注意到rmarkdown文件的笔记本功能.生成绘图时,不再使用通常的"绘图窗口",并且在代码块下方生成绘图.
我有以下代码的错误:
plot(seq(1,10,1))
abline(a=0,b=1)
Run Code Online (Sandbox Code Playgroud)
错误显示在代码块下方:
Error in int_abline(a = a, b = b, h = h, v = v, untf = untf, ...) : plot.new has not been called yet
Run Code Online (Sandbox Code Playgroud)
但是,在编织整个rmarkdown文件时,没有错误.
所以我想知道如何避免错误:
我使用foreach的dopar来解决Render_site的问题.使用简单的代码完美地运行代码.虽然我在使用dopar时遇到问题,因为在YAML文件中使用dopar之后输出会重复.
请注意,如果我使用Render而不是Render_site,则dopar可以正常工作.
您可以在下面看到我的代码:
pacman::p_load(data.table)
pacman::p_load(data.table,rmarkdown)
pacman::p_load(rmarkdown,knitr,kableExtra,dplyr)
info.rmd=readLines("test.rmd",encoding = "UTF-8")
yml=readLines("site.yml",encoding = "UTF-8")
fun<-function(r){
out <- file( description=paste0(r,"test_.Rmd"), open="w", encoding="UTF-8")
write(info.rmd,file=out )
close(con=out)
render_site(paste0(r,"test_.Rmd"),encoding = "UTF-8",quiet = T)
file.remove(paste0(r,"test_.Rmd"))
}
Run Code Online (Sandbox Code Playgroud)
该功能正在为简单而工作
# Working with for
for (r in 1:10){
fun(r)
}
Run Code Online (Sandbox Code Playgroud)
我有使用dopar的问题(在这种情况下在YAML文件中重复输出)
# Not working for dopar
library(doParallel)
no_cores<-3
cl <- makeCluster(no_cores, type="SOCK")
registerDoParallel(cl)
res<-foreach (r=1:10,.combine = c,.inorder = T) %dopar% {
library(rmarkdown)
fun(r)
}
print(ret)
stopCluster(cl)
Run Code Online (Sandbox Code Playgroud)
回溯消息如下:
Error in { : task 10 failed - "Duplicate map key: 'output'"
4.stop(simpleError(msg, …Run Code Online (Sandbox Code Playgroud) 根据这篇文章,scikit learn 中的 SVC 和 LinearSVC 是非常不同的。但是在阅读官方的 scikit learn 文档时,就不是那么清楚了。
而这篇文章说 le 损失函数是不同的:
1/2||w||^2 + C SUM xi_i1/2||[w b]||^2 + C SUM xi_i似乎在 LinearSVC 的情况下,截距是正则化的,但官方文档另有说明。
有人有更多信息吗?谢谢
我使用R来解析html代码,我想知道稀疏以下代码的最有效方法:
<script type="text/javascript">
var utag_data = {
environnement : "prod",
device : getDevice(),
displaytype : getDisplay($(window).innerWidth()),
pagename : "adview",
pagetype : "annonce"}</script>
Run Code Online (Sandbox Code Playgroud)
我开始这样做:
infos = unlist(xpathApply(page,
'//script[@type="text/javascript"]',
xmlValue))
infos=gsub('\n| ','',infos)
infos=gsub("var utag_data = ","",infos)
fromJSON(infos)
Run Code Online (Sandbox Code Playgroud)
上面的代码返回了一些非常奇怪的东西:
$nvironnemen
[1] "prod"
$evic
NULL
$isplaytyp
NULL
$agenam
[1] "adview" etc.
Run Code Online (Sandbox Code Playgroud)
我想知道如何以非常有效的方式做到这一点:如何直接解析 javascript 中的数据列表?谢谢你。
如果我们有一个列表,每个项目可以有不同的长度.例如:
l <- list(c(1, 2), c(3, 4,5), c(5), c(6,7))
Run Code Online (Sandbox Code Playgroud)
(为了清楚起见,我们将在列表"items"中调用对象,并在列表"elements"的对象中调用对象.)
我们如何提取,例如每个项目的第一个元素?在这里,我想提取:
1, 3, 5, 6
Run Code Online (Sandbox Code Playgroud)
然后每个项目的第二个元素的相同问题:
2, 4, NA, 7
Run Code Online (Sandbox Code Playgroud) 在使用 rmarkdown 渲染 pdf 文档时,我们可以使用三个选项来打印 data.frame:default、kable 和 tibble(见这里)
使用默认选项,可以使用以下选项限制打印的行数: max.print
对于 tibble,我们可以使用: dplyr.print_max
我找不到限制kable. 是否可以?
为了再现性,必须选择种子.在R中,我们可以使用set.seed().我的问题是,当没有明确设置种子时,计算机如何选择种子?为什么没有默认种子?
我很惊讶没有人谈论这一点:使用 scikit learn 进行的多项式回归与使用 numpy 进行的 polyfit 的区别。
一、数据:
xdic={'X': {11: 300, 12: 170, 13: 288, 14: 360, 15: 319, 16: 330, 17: 520, 18: 345, 19: 399, 20: 479}}
ydic={'y': {11: 305000, 12: 270000, 13: 360000, 14: 370000, 15: 379000, 16: 405000, 17: 407500, 18: 450000, 19: 450000, 20: 485000}}
X=pd.DataFrame.from_dict(xdic)
y=pd.DataFrame.from_dict(ydic)
import numpy as np
X_seq = np.linspace(X.min(),X.max(),300).reshape(-1,1)
Run Code Online (Sandbox Code Playgroud)
然后我们用 scikit learn 创建模型
from sklearn.preprocessing import PolynomialFeatures
from sklearn.pipeline import make_pipeline
from sklearn.linear_model import LinearRegression
degree=9
polyreg=make_pipeline(PolynomialFeatures(degree),
LinearRegression())
polyreg.fit(X,y) …Run Code Online (Sandbox Code Playgroud) 我读了几个关于从谷歌地图抓取数据的相关问题,似乎不可能。但是我们可以找到替代解决方案,例如,在这篇文章中:Scrapy,在 Javascript 中抓取数据替代解决方案是找到如何将数据加载到地图中。
编辑:我并不是要让人们为我编码。我想知道如何探索代码以获取信息。
比如麦当劳SG的网站,我们如何发现有数据请求?
请问有没有什么关键词可以让我们每次翻页的时候都找找看?谢谢
在numpy,我们有以下功能:
import numpy
from numpy.fft import fft2, ifft2, fftshift, ifftshift
Run Code Online (Sandbox Code Playgroud)
我想重写这些功能在河fft中的R作品一样fft或fft2Python编写的.同样ifft2,我们必须这样做fft(,inverse=T)
现在我想知道如何在R中有效地重写fftshift和ifftshift函数(对于矩阵).
在此页面中有滚动周期函数的官方示例。
使用的功能是什么?(给定 N 滚动周期)
有谁知道这个功能,或者我怎样才能找到它?
这里的目的是读取一个csv表,该文件有一个直接的URL.我想使用fread(data.table包),因为read.csv更快,但我有一点问题.
options(scipen=999)
caracteristiques=read.csv(url("https://www.data.gouv.fr/s/resources/base-de-donnees-accidents-corporels-de-la-circulation/20160909-181230/caracteristiques_2015.csv"))
caracteristiques[1,1]
# 201500000001
Run Code Online (Sandbox Code Playgroud)
得到[1,1]元素我有问题.
现在我使用fread:
library(data.table)
caracteristiques=data.table(fread("https://www.data.gouv.fr/s/resources/base-de-donnees-accidents-corporels-de-la-circulation/20160909-181230/caracteristiques_2015.csv",
sep=","))
caracteristiques[1,1]
#
Run Code Online (Sandbox Code Playgroud)
然后我们可以看到一个奇怪的数字.我必须指定options(scipen=0)显示它9.955423e-313我想知道我是否必须在fread中指定一些选项,因为它们在第一列中是大数字.
r ×9
python ×3
r-markdown ×3
scikit-learn ×2
web-scraping ×2
csv ×1
data.table ×1
doparallel ×1
dygraphs ×1
fft ×1
fread ×1
google-maps ×1
ifft ×1
javascript ×1
kable ×1
knitr ×1
libsvm ×1
list ×1
numpy ×1
plot ×1
random ×1
random-seed ×1
read.csv ×1
regression ×1
rstudio ×1
sublist ×1
svm ×1
vector ×1
yaml ×1