我想开发一个(相当简单的)Android应用程序,通过Play商店分发.我想在python中完全这样做.然而,在线研究还没有让我明白:大多数评论要么过时(> 1岁,我觉得从那时起可能有更好的python集成)或者他们谈论在android中运行python(例如这里).
因此,我正在寻找有关这些问题的信息:
我对应用程序开发很陌生,并且非常感谢在python中执行此操作的任何线索,而不是在Jave等中,我还不知道.
非常感谢你提前帮助.
一个包含多列的python pandas数据帧,dict只需要两列.一个是dict的键,另一个是dict的值.我怎样才能做到这一点?
数据帧:
area count
co tp
DE Lake 10 7
Forest 20 5
FR Lake 30 2
Forest 40 3
Run Code Online (Sandbox Code Playgroud)
需要将区域定义为键,在dict中计为值.先感谢您.
我想过滤掉字符串长度不等于10的数据.
如果我试图过滤掉列A或B的字符串长度不等于10的任何行,我试过这个.
df=pd.read_csv('filex.csv')
df.A=df.A.apply(lambda x: x if len(x)== 10 else np.nan)
df.B=df.B.apply(lambda x: x if len(x)== 10 else np.nan)
df=df.dropna(subset=['A','B'], how='any')
Run Code Online (Sandbox Code Playgroud)
这工作缓慢,但工作正常.
但是,当A中的数据不是字符串而是数字(当read_csv读取输入文件时解释为数字)时,它有时会产生错误.
File "<stdin>", line 1, in <lambda>
TypeError: object of type 'float' has no len()
Run Code Online (Sandbox Code Playgroud)
我相信应该有更有效和优雅的代码而不是这个.
我有两个data.frame
s的多个公共列(这里date
,city
,ctry
,和(other_
)number
)。
我现在想将它们合并到以上各列中,但可以容忍某种程度的差异:
threshold.numbers <- 3
threshold.date <- 5 # in days
Run Code Online (Sandbox Code Playgroud)
如果date
条目之间的差异是> threshold.date
(天)或 > threshold.numbers
,我不希望合并这些行。同样,如果in city
中df
的条目是该city
列中另一个条目的子字符串,我希望将这些行合并。[如果任何人有一个更好的主意来测试实际的城市名称相似,我会很高兴听到这个消息。(并保持第一df
“的S记录date
,city
以及country
但是两者(other_
)number
列,并在所有其他列df
。
考虑以下示例:
df1 <- data.frame(date = c("2003-08-29", "1999-06-12", "2000-08-29", "1999-02-24", "2001-04-17",
"1999-06-30", "1999-03-16", "1999-07-16", "2001-08-29", "2002-07-30"),
city = c("Berlin", "Paris", "London", "Rome", "Bern",
"Copenhagen", "Warsaw", "Moscow", "Tunis", "Vienna"), …
Run Code Online (Sandbox Code Playgroud) 为了清理一些凌乱的数据,我想开始使用管道%>%,但是如果gsub()不在管道的开头,我就不能使R代码工作,应该发生得晚(注意:这个问题不关心适当导入,但数据清理)
简单的例子:
df <- cbind.data.frame(A= c("2.187,78 ", "5.491,28 ", "7.000,32 "), B = c("A","B","C"))
Run Code Online (Sandbox Code Playgroud)
A列包含字符(在本例中为数字,但也可以是字符串),需要清除.步骤是
df$D <- gsub("\\.","",df$A)
df$D <- str_trim(df$D)
df$D <- as.numeric(gsub(",", ".",df$D))
Run Code Online (Sandbox Code Playgroud)
一个人可以轻易地解决这个
df$D <- gsub("\\.","",df$A) %>%
str_trim() %>%
as.numeric(gsub(",", ".")) %>%
Run Code Online (Sandbox Code Playgroud)
问题是第二个gsub,因为它要求输入....实际上是前一行的结果.
请问,任何人都可以解释如何在管道中进一步使用像gsub()这样的函数吗?非常感谢!
系统:R 3.2.3,Windows
我最近开始在我的Windows PC上使用Python 3.5和Anaconda.我想绘制一张地图.但是,当我在我的Jupyter笔记本中并输入命令时
import mpl_toolkits.basemap
我得到一个错误信息说"不模块名称""mpl_toolkits.basemap"不过,我已经模块下载并在同一个C:\Users\Geena
文件作为我.matplotlib
,.ipython
,.jupyter
文件等.
有谁知道如何解决这个问题?
python matplotlib matplotlib-basemap anaconda jupyter-notebook
我想在绘图标题中包含乘法的数学符号(例如小写的 x)。
我尝试过latex2exp
但没有成功 - 有人可以帮助我吗?
代表代码是这样的:
library(ggplot2)
library(latex2exp)
ggplot(data = data.frame(number = round(rnorm(200, mean=55, sd=5))),
aes(x = number)) + geom_density() +
ggtitle(TeX("Title containing times sign here: $\\times$"))
Run Code Online (Sandbox Code Playgroud)
它产生这样的结果:
我希望正方形(表示无法识别的标志)显示为以下标志:。似乎其他标志可以使用这种方法(例如阿尔法),但我无法弄清楚为什么该
times
标志会造成问题。
我不打算使用 Latex2exp 作为解决方案,只要它适用于 Latex 字体(LM Roman 10)即可。
预先非常感谢。
我正在使用ggplot()
和geom_sf()
来绘制一个多面映射(见下面的代码)和沿着scale_fill_gradient()
变量(value
在下面的示例中)的颜色单位,然后再用另一个变量(group
)进行多面化。这有效;但现在我想根据切面更改渐变高端(不是中点或更低)的颜色。基于这个color_high
答案,我已将其保存在绘图数据框中的单独列 ( ) 中。但是,我无法将其转换为绘图比例。
有人能指出我正确的方向吗?下面是具有单个填充渐变的工作代码。预期输出具有高值,如color_high
(A 组中的红色,B 组中的绿色)中所定义。
library(sf)\nlibrary(tidyverse)\ntheme_set(theme_bw())\nlibrary(giscoR)\n\nger_fedstates <- gisco_get_nuts(nuts_level = 1, resolution = 10, country = "Germany", year = 2021)\n\ndat <- read.table(text = "state value group\n Sachsen 10 a\n Sachsen 1 b\n Bayern 3 a\n Bayern 30 b\n Rheinland-Pfalz 50 a\n Rheinland-Pfalz 50 b\n Saarland 70 a\n Saarland 70 b\n Schleswig-Holstein 9 a\n Schleswig-Holstein 90 b\n Niedersachsen 100 a\n Niedersachsen 100 b\n …
Run Code Online (Sandbox Code Playgroud) mylist = [[1,2],[4,5],[3,4],[4,3],[2,1],[1,2]]
Run Code Online (Sandbox Code Playgroud)
我想删除重复的项目,重复的项目可以反转.结果应该是:
mylist = [[1,2],[4,5],[3,4]]
Run Code Online (Sandbox Code Playgroud)
我如何在Python中实现这一目标?
我有一个(数据帧)列表的命名列表。
l_of_lists <- list(
fruits = list(
red = data.frame("apple", "cherry", "strawberry"),
yellow = data.frame("banana", "lemon"),
orange = data.frame("orange", "grapefruit", "blood orange")),
colors = list(
green = data.frame("light green", "green", "dark green"),
red = data.frame("red", "dark red"),
blue = data.frame("light blue", "blue", "dark blue")),
places = list(
inside = data.frame("living room", "bathrooom", "kitchen"),
outside = data.frame("garden", "yard"),
neighborhood = data.frame("playground", "shop", "school"))
)
Run Code Online (Sandbox Code Playgroud)
我遍历l_of_lists
的sublists
确定每个数据帧的列数,我想删除每一个sublist
不符合条件(在这个例子是,它有三列)。
使用以下代码:
for (ls in l_of_lists){
for (sublist in …
Run Code Online (Sandbox Code Playgroud) python ×5
r ×5
dataframe ×2
ggplot2 ×2
list ×2
pandas ×2
anaconda ×1
android ×1
csv ×1
dictionary ×1
duplicates ×1
facet-wrap ×1
filter ×1
gsub ×1
latex ×1
matplotlib ×1
pipeline ×1
r-sf ×1
string ×1