小编Pra*_*tra的帖子

理解set()函数

在python中,set()是一个没有重复元素的无序集合.但是,我无法理解它是如何生成输出的.

例如,请考虑以下事项:

>>> x = [1, 1, 2, 2, 2, 2, 2, 3, 3]
>>> set(x)
set([1, 2, 3])

>>> y = [1, 1, 6, 6, 6, 6, 6, 8, 8]
>>> set(y)
set([8, 1, 6])

>>> z = [1, 1, 6, 6, 6, 6, 6, 7, 7]
>>> set(z)
set([1, 6, 7])
Run Code Online (Sandbox Code Playgroud)

输出不应该set(y)是:set([1, 6, 8])?我在Python 2.6中尝试了上述两个.

python set

56
推荐指数
4
解决办法
14万
查看次数

在scipy python中使用UnivariateSpline拟合数据

我有一个实验数据,我试图在scipy中使用UnivariateSpline函数拟合曲线.数据看起来像:

 x         y
13    2.404070
12    1.588134
11    1.760112
10    1.771360
09    1.860087
08    1.955789
07    1.910408
06    1.655911
05    1.778952
04    2.624719
03    1.698099
02    3.022607
01    3.303135    
Run Code Online (Sandbox Code Playgroud)

这是我在做的事情:

import matplotlib.pyplot as plt
from scipy import interpolate
yinterp = interpolate.UnivariateSpline(x, y, s = 5e8)(x) 
plt.plot(x, y, 'bo', label = 'Original')
plt.plot(x, yinterp, 'r', label = 'Interpolated')
plt.show()
Run Code Online (Sandbox Code Playgroud)

这就是它的样子:

曲线拟合

我想知道是否有人想过scipy可能有的其他曲线拟合选项?我比较狡猾.

谢谢!

python numpy curve-fitting scipy

13
推荐指数
1
解决办法
3万
查看次数

在 Python 中使用 Scipy 进行约束样条拟合

我想知道UnivariateSpline 是否可以让您进行约束样条拟合?例如,考虑以下数据:

 x         y
13    2.404070
12    1.588134
11    1.760112
10    1.771360
09    1.860087
08    1.955789
07    1.910408
06    1.655911
05    1.778952
04    2.624719
03    1.698099
02    3.022607
01    3.303135    
Run Code Online (Sandbox Code Playgroud)

关于平滑函数的选择和作用的讨论可以在较早的帖子中找到。但是,如果我们施加一个约束,即样条需要单调递减,那么我们应该如何拟合样条?

谢谢你的帮助!。

编辑:样条不需要完全适合所有点。然而,它应该满足约束(单调递减)。

python numpy curve-fitting scipy pandas

5
推荐指数
1
解决办法
3997
查看次数

如何根据R中的周数计算日期

我想知道是否有办法根据R中的周数来获得周日期的开始?例如,如果我输入周数= 10,它应该给我2014年3月9日.

我知道如何获得反向(也就是说...给出一个日期,通过使用as.POSIX函数获取周数).

谢谢!Prakhar

r

5
推荐指数
2
解决办法
2511
查看次数

使用基于MySQL数据库的Flask更新网页.

我有一个网页(使用HTML和jQuery构建),它显示MySQL数据库中的数据.我正在使用Flask将HTML与我的数据库连接起来.但是,我的数据库每15分钟更新一次(使用单独的Python脚本).目前,我停止烧瓶服务器,更新数据库并重新启动Flask以更新网页.我的问题如下:

有没有办法在后台更新MySQL数据库而不必停止烧录服务器?我读到了关于AJAX和CRON的概念,但是我无法理解如何异步使用它们.

注意:我是Web应用程序的新手,这是我的第一个项目,涉及连接客户端和服务器端.任何帮助将不胜感激.

谢谢

python mysql webpage client-server flask

3
推荐指数
1
解决办法
3262
查看次数

使用 Python Pandas 对 csv 文件中的行进行排序

我有一个关于使用 Pandas 对 csv 文件中的行进行排序的快速问题。我拥有的 csv 文件的数据如下:

quarter week    Value
  5       1      200   
  3       2      100
  2       1       50
  2       2      125
  4       2      175 
  2       3      195 
  3       1      10
  5       2      190
Run Code Online (Sandbox Code Playgroud)

我需要按以下方式排序:对季度和相应的周进行排序。所以输出应该如下所示:

quarter week    Value
  2       1      50  
  2       2      125
  2       3      195
  3       1      10
  3       2      100    
  4       2      175
  5       1      200
  5       2      190
Run Code Online (Sandbox Code Playgroud)

我的尝试:

df = df.sort('quarter', 'week') 
Run Code Online (Sandbox Code Playgroud)

但这不会产生正确的结果。任何帮助/建议?

谢谢!

python csv pandas

3
推荐指数
2
解决办法
2万
查看次数

Python 中列表的最小值和最大值(不使用 min/max 函数)

我想知道是否有一种方法可以在不使用 Python 中的 min/max 函数的情况下找到列表的最小值和最大值。所以我使用递归编写了一个小代码。我的逻辑非常天真:我制作了两个堆栈(min_stack 和 max_stack),它们在每次递归调用期间跟踪最小值和最大值。我有两个问题:

  1. 有人可以帮我估计我的代码的复杂性吗?
  2. 有一个更好的方法吗?使用合并排序/快速排序对列表进行排序并选取第一个和最后一个元素会带来更好的性能吗?

谢谢

这是我在 Python 中的尝试:

minimum = []
maximum = []

# Defining Stack Class
class Stack:
    def __init__(self) :
        self.items = []

    def push(self, item) :
        self.items.append(item)

    def pop(self) :
        return self.items.pop()

    def access(self, index):
        return self.items[index]

    def isEmpty(self) :
        return (self.items == [])

    def length(self):
        return len(self.items)

def minmax(input_list):
    # make two stacks, one for min and one for max
    min_stack = Stack()
    max_stack = Stack()
    # comparing the first …
Run Code Online (Sandbox Code Playgroud)

python algorithm minmax

2
推荐指数
1
解决办法
5万
查看次数

使用 dplyr 平均排除异常值

我想知道是否有办法使用 R 中的 dplyr 包计算排除异常值的平均值?我试图做这样的事情,但没有奏效:

library(dplyr)
w = rep("months", 4)
value = c(1, 10, 12, 9)
df = data.frame(w, value)
output = df %>% group_by(w) %>% summarise(m = mean(value, na.rm = T, outlier = T))
Run Code Online (Sandbox Code Playgroud)

所以在上面的例子中,输出应该是 10.333(10、12、9 的平均值)而不是 8(1、10、12、9 的平均值)

谢谢!

statistics r

2
推荐指数
1
解决办法
3005
查看次数

在 ggplot 中添加点到堆栈线图

我有一个关于数据可视化的简单问题。我需要创建一个geom_point在数据点上包含点 ( ) 的堆积折线图。我可以借助下面的代码创建堆积图,但很难弄清楚如何向数据添加点。

这是 test.csv 的内容:

Date    Category    Value
3/6/15      A       6.00
3/13/15     A       16.00
3/20/15     A       10.00
3/27/15     A       15.00
4/3/15      A       18.00
4/10/15     A       30.00
3/6/15      B       2
3/13/15     B       5.00
3/20/15     B       12.00
3/27/15     B       17.00
4/3/15      B       19.00
4/10/15     B       29.00
3/6/15      C       10
3/13/15     C       10
3/20/15     C       10
3/27/15     C       10
4/3/15      C       10
4/10/15     C       10
Run Code Online (Sandbox Code Playgroud)

这是我的代码:

df = read.csv("test.csv", header = T)
df$Date = as.Date(df$Date, format = "%m/%d/%y")
ggplot(df, …
Run Code Online (Sandbox Code Playgroud)

r ggplot2

1
推荐指数
1
解决办法
653
查看次数

从列表中的元组中删除重复项

我有一个元组列表:

lst = [('a','b'), ('c', 'b'), ('a', 'd'), ('e','f'), ('a', 'b')]
Run Code Online (Sandbox Code Playgroud)

我想要以下输出列表:

output = [('a','b'), ('e','f')]
Run Code Online (Sandbox Code Playgroud)

即我想比较第一元组的元素与剩余的元组,并删除包含一个或多个重复元素的元组.

我的尝试:

我正在考虑使用for循环,但是一旦我拥有非常大的列表,那就不可行了.我通过以下帖子浏览但无法获得正确的解决方案:

从元组列表中删除重复成员 如何在保留顺序的同时从列表中删除重复项?

如果有人可以指导我正确的方向,那将非常有帮助.谢谢!

python tuples list duplicates

0
推荐指数
1
解决办法
5028
查看次数

R中向量中的最大连续重复次数

我有一个包含0和1的向量。我想返回1连续出现的次数的最大值。例如,如果x是输入向量

 x <-c(0, 0, 1, 1, 1, 0, 0, 0, 0, 1, 1)
Run Code Online (Sandbox Code Playgroud)

预期产量:3

我的尝试:我正在使用rle函数来完成这项工作。这是我的示例代码:

x<-c(0, 0, 1, 1, 1, 0, 0, 0, 0, 1, 1)
y<-rle(x)
max_repeat <-max(y$lengths)
Run Code Online (Sandbox Code Playgroud)

在这种情况下,我的输出为4(对应于0而不是1)。我试图使用tapply访问rle的完整输出,但是我无法提取出对应于值1的最大重复。

out <-tapply(y$lengths, y$values, max)
Run Code Online (Sandbox Code Playgroud)

这就是我得到的:

0 1
4 3
Run Code Online (Sandbox Code Playgroud)

当我查看out的结构时,它是“ int [1:2(1d)] 4 3”。我没有足够的经验来处理此类变量。我需要提取对应于1即3的值。任何帮助将不胜感激!

谢谢

r

0
推荐指数
1
解决办法
307
查看次数