小编Rad*_*Rad的帖子

键错误和MultiIndex lexsort深度

我有一组制表符分隔文件,我必须阅读它们,将它们用作pandas数据帧,对它们执行一大堆操作然后将它们合并回一个excel文件,代码太长所以我要去经历有问题的一部分

我正在解析的选项卡文件包含所有相同数量的行2177

当我读取这些文件时,我按前两列的类型(string,int)进行索引

df = df.set_index(['id', 'coord'])
data = OrderedDict()
#data will contain all the information I am writing to excel
data[filename_id] = df
Run Code Online (Sandbox Code Playgroud)

我正在做的其中一个程序需要访问每行数据[sample_id],其中包含用列'id'和'coord'索引的混合类型的数据帧,就像这样

sample_row = data[sample].ix[index]
Run Code Online (Sandbox Code Playgroud)

我的索引是('id','coord')

如果我正在处理文件的一个子集,一切都很好,但如果我用2177行读取整个文件,我最终会收到此错误消息

KeyError: 'Key length (2) was greater than MultiIndex lexsort depth (0)'
Run Code Online (Sandbox Code Playgroud)

我搜遍了SO和所有地方似乎这是一个排序索引的问题,但我不明白为什么使用未排序的子集不会导致问题

关于如何解决这个问题的任何想法?

谢谢

python pandas

7
推荐指数
1
解决办法
7456
查看次数

如何在matplotlib中选择直方图条的独特颜色?

我试图在同一个绘图上绘制几个直方图,但我发现有些颜色分配给不同的系列,这让我感到很烦恼.有没有办法强制彩条独特?

这适用于小型数据集,但是当我使用大量数据时,我发现这个问题又回来了

这是一个例子,蓝色被分配两次到两个不同的数据样本

在此输入图像描述

在matplotlib中将颜色归类为直方图的所有示例和解决方案(至少是我发现的那些)都建议将x轴归一化到0和1之间,就像这个例子一样,但这不是我想要的,因为它非常重要在我的情况下真正的价值观.

还有其他解决方案吗?

谢谢

编辑

我带来的一个解决方案是将cmap调色板转换为numpy数组,并通过调用此调色板来使用pyplot hist颜色

N = len(list_of_samples)
sample_colors = cm.get_cmap('RdYlBu', N)
palette = sample_colors(np.arange(N))
Run Code Online (Sandbox Code Playgroud)

但这只适用于绘图函数的hist我得到了这个错误信息

ValueError: to_rgba: Invalid rgba arg "[[ 0.64705884  0.          0.14901961  1.        ]
 [ 0.89187675  0.2907563   0.20000001  1.        ]
 [ 0.98711484  0.64593837  0.36358543  1.        ]
 [ 0.99719888  0.91316527  0.61736696  1.        ]
 [ 0.91316529  0.96638656  0.90868344  1.        ]
 [ 0.63977591  0.82633053  0.90028011  1.        ]
 [ 0.34957983  0.55294117  0.75462185  1.        ]
 [ 0.19215687  0.21176471  0.58431375  1.        ]]"
only length-1 arrays can be …
Run Code Online (Sandbox Code Playgroud)

python matplotlib histogram

6
推荐指数
1
解决办法
3261
查看次数

对数据帧进行随机选择,以获得唯一的行

我有一个包含10k行的数据框,对于给定的列XI有重复的值,我们怎样才能在该列中随机选择只包含该值的一行?

r

5
推荐指数
2
解决办法
1200
查看次数

通过选择菜单动态更改Codemirror模式

我正在尝试使用下面的方法动态更改代码镜像模式,但遗憾的是它无法正常工作,欢迎您的帮助

我有一个选择菜单:

<select name="idLanguage" id="select" onChange="selectMode()">
<option value="1">Python</option>
<option value="10">JavaScript</option>
<option value="33">Asterisk dialplan</option>
<option value="34">Clojure</option>
<option value="35">Common Lisp</option>
<option value="36">D</option>
<option value="37">ECL</option>
<option value="38">Go</option>
<option value="39">Haskell</option>
<option value="40">HTML</option>
<option value="41">Jinja2</option>
<option value="42">LiveScript</option>
<option value="43">mIRC</option>
</select>
Run Code Online (Sandbox Code Playgroud)

然后我使用这个javascript方法:

var modeInput = document.getElementById("select");
function selectMode() {
  var myindex  = modeInput.selectedIndex;
  var modefly = modeInput.options[myindex].text.toLowerCase();
  alert(modefly); // This is giving me the exact mode on the screen
  editor.setOption("mode", modefly);// no change in the mode
  CodeMirror.autoLoadMode(editor, modefly);//no change in the mode
  //editor.refresh();
   }
Run Code Online (Sandbox Code Playgroud)

虽然alert() …

javascript codemirror

5
推荐指数
1
解决办法
4514
查看次数

ggplot2在boxplots上添加文本

我有一个数据,我正在绘制的ggplot2箱形图看起来像

> head(varf)
             sID variable       value
1 SP_SA036,SA040   CM0001 0.492537313
2 SP_SA036,SA040   CM0001 0.479564033
3 SP_SA036,SA040   CM0001 0.559139785
4 SP_SA036,SA040   CM0001 0.526806527
5 SP_SA036,SA040   CM0001 0.009049774
6 SP_SA036,SA040   CM0001 0.451612903
Run Code Online (Sandbox Code Playgroud)

变量列包含16个不同的ID(从CM0001到CM0016)

我有一个带注释的数据框

category   annotation
CM001      HG4450
CM002      HG3288
..
CM016      MM8998
Run Code Online (Sandbox Code Playgroud)

我想将这些注释映射到我的箱图上,但是找不到办法,将geom_text与boxplot一起使用的正确语法是什么?

谢谢

label r ggplot2 boxplot

5
推荐指数
1
解决办法
1万
查看次数

比较两个不同CodeMirror文本区域中的更改

我正在尝试使用两个不同的textareas显示相同的代码,但是使用一个母版和另一个副本。在副本中textarea,我想强调一些更改,类似于我们进行某些更改时GitHub提供的内容。

我想知道这是否可能,或者有人以前做过类似的事情。欢迎任何建议。

diff textarea codemirror

4
推荐指数
1
解决办法
4403
查看次数

根据R中的三列聚合数据帧

我有一个数据框,其结构如下:

    V1    V2   V3       V4     
1   1.35  A  10241297 10459084
2  16.00  A  10241297 10459084
3   1.47  A  10241297 10459084
Run Code Online (Sandbox Code Playgroud)

我想基于V2,V3和V4对V1进行平均

我看到的所有聚合示例都是基于单个值处理聚合.

任何帮助表示赞赏

谢谢

aggregate r

3
推荐指数
1
解决办法
9629
查看次数

按awk中的列值为每行分配ID

我有一个表格文件,其中列是一个重复的示例

toto tata AFG
fff ddd AFG
ff hhh AWM
qqq ttt AWM
Run Code Online (Sandbox Code Playgroud)

我想有一个输出像

toto tata AFG 1
fff ddd AFG 1
ff hhh AWM 2
qqq ttt AWM 2
Run Code Online (Sandbox Code Playgroud)

通过使用第4列将每条线与下一条线进行比较

是不是可以用awk快速完成?

请求帮助

awk

1
推荐指数
1
解决办法
598
查看次数

按频率和长度排序重复

我正在考虑在字符串中获取所有唯一重复的最佳方法,并按长度和重复频率(数字)对它们进行排序

我开始使用此代码

 public static void main(String[] args)
{
  String s = "AAAABBBBAAAANNNNAAAABBBBNNNBBBBAAAA";
  Matcher m = Pattern.compile("(\\S{2,})(?=.*?\\1)").matcher(s);
  while (m.find())
  {
    for (int i = 1; i <= m.groupCount(); i++)
    {
      System.out.println(m.group(i));
    }
  }
}
Run Code Online (Sandbox Code Playgroud)

并希望得到一些有这样的输出的建议:

AAAA 4 1,9,17,33等

其中4 =重复次数,1,9,17,33个位置

我感谢您的帮助

java regex pattern-matching

1
推荐指数
1
解决办法
74
查看次数

位置固定但相对于容器

我必须显示两个 div(输入和输出),以便它们一个在左侧,另一个在右侧。

使用此 css 代码,它们非常适合全屏显示,但我希望能够将它们放入父 div 中,这将是容器

#in{
      position: fixed;
      top: 0;
      left: 0;
      bottom: 0;
      width: 50%;
      overflow: auto;
      font-size: 12px;
      box-shadow: 0 2px 10px rgba(0,0,0,0.2);
    }

#out{
      position: fixed;
      top: 0;
      right: 0;
      left: 50%;
      bottom: 0;
      overflow: auto;
      padding: 10px;
      padding-left: 20px;
      color: #444;
      font-family:Georgia, Palatino, 'Palatino Linotype', Times, 'Times New Roman', serif;
      font-size: 16px;
      line-height: 1.5em
    }
Run Code Online (Sandbox Code Playgroud)

任何人都可以帮我修改此代码吗?

谢谢

css

1
推荐指数
1
解决办法
2万
查看次数