我有一组制表符分隔文件,我必须阅读它们,将它们用作pandas数据帧,对它们执行一大堆操作然后将它们合并回一个excel文件,代码太长所以我要去经历有问题的一部分
我正在解析的选项卡文件包含所有相同数量的行2177
当我读取这些文件时,我按前两列的类型(string,int)进行索引
df = df.set_index(['id', 'coord'])
data = OrderedDict()
#data will contain all the information I am writing to excel
data[filename_id] = df
Run Code Online (Sandbox Code Playgroud)
我正在做的其中一个程序需要访问每行数据[sample_id],其中包含用列'id'和'coord'索引的混合类型的数据帧,就像这样
sample_row = data[sample].ix[index]
Run Code Online (Sandbox Code Playgroud)
我的索引是('id','coord')
如果我正在处理文件的一个子集,一切都很好,但如果我用2177行读取整个文件,我最终会收到此错误消息
KeyError: 'Key length (2) was greater than MultiIndex lexsort depth (0)'
Run Code Online (Sandbox Code Playgroud)
我搜遍了SO和所有地方似乎这是一个排序索引的问题,但我不明白为什么使用未排序的子集不会导致问题
关于如何解决这个问题的任何想法?
谢谢
我试图在同一个绘图上绘制几个直方图,但我发现有些颜色分配给不同的系列,这让我感到很烦恼.有没有办法强制彩条独特?
这适用于小型数据集,但是当我使用大量数据时,我发现这个问题又回来了
这是一个例子,蓝色被分配两次到两个不同的数据样本

在matplotlib中将颜色归类为直方图的所有示例和解决方案(至少是我发现的那些)都建议将x轴归一化到0和1之间,就像这个例子一样,但这不是我想要的,因为它非常重要在我的情况下真正的价值观.
还有其他解决方案吗?
谢谢
编辑
我带来的一个解决方案是将cmap调色板转换为numpy数组,并通过调用此调色板来使用pyplot hist颜色
N = len(list_of_samples)
sample_colors = cm.get_cmap('RdYlBu', N)
palette = sample_colors(np.arange(N))
Run Code Online (Sandbox Code Playgroud)
但这只适用于绘图函数的hist我得到了这个错误信息
ValueError: to_rgba: Invalid rgba arg "[[ 0.64705884 0. 0.14901961 1. ]
[ 0.89187675 0.2907563 0.20000001 1. ]
[ 0.98711484 0.64593837 0.36358543 1. ]
[ 0.99719888 0.91316527 0.61736696 1. ]
[ 0.91316529 0.96638656 0.90868344 1. ]
[ 0.63977591 0.82633053 0.90028011 1. ]
[ 0.34957983 0.55294117 0.75462185 1. ]
[ 0.19215687 0.21176471 0.58431375 1. ]]"
only length-1 arrays can be …Run Code Online (Sandbox Code Playgroud) 我正在尝试使用下面的方法动态更改代码镜像模式,但遗憾的是它无法正常工作,欢迎您的帮助
我有一个选择菜单:
<select name="idLanguage" id="select" onChange="selectMode()">
<option value="1">Python</option>
<option value="10">JavaScript</option>
<option value="33">Asterisk dialplan</option>
<option value="34">Clojure</option>
<option value="35">Common Lisp</option>
<option value="36">D</option>
<option value="37">ECL</option>
<option value="38">Go</option>
<option value="39">Haskell</option>
<option value="40">HTML</option>
<option value="41">Jinja2</option>
<option value="42">LiveScript</option>
<option value="43">mIRC</option>
</select>
Run Code Online (Sandbox Code Playgroud)
然后我使用这个javascript方法:
var modeInput = document.getElementById("select");
function selectMode() {
var myindex = modeInput.selectedIndex;
var modefly = modeInput.options[myindex].text.toLowerCase();
alert(modefly); // This is giving me the exact mode on the screen
editor.setOption("mode", modefly);// no change in the mode
CodeMirror.autoLoadMode(editor, modefly);//no change in the mode
//editor.refresh();
}
Run Code Online (Sandbox Code Playgroud)
虽然alert() …
我有一个数据,我正在绘制的ggplot2箱形图看起来像
> head(varf)
sID variable value
1 SP_SA036,SA040 CM0001 0.492537313
2 SP_SA036,SA040 CM0001 0.479564033
3 SP_SA036,SA040 CM0001 0.559139785
4 SP_SA036,SA040 CM0001 0.526806527
5 SP_SA036,SA040 CM0001 0.009049774
6 SP_SA036,SA040 CM0001 0.451612903
Run Code Online (Sandbox Code Playgroud)
变量列包含16个不同的ID(从CM0001到CM0016)
我有一个带注释的数据框
category annotation
CM001 HG4450
CM002 HG3288
..
CM016 MM8998
Run Code Online (Sandbox Code Playgroud)
我想将这些注释映射到我的箱图上,但是找不到办法,将geom_text与boxplot一起使用的正确语法是什么?
谢谢
我正在尝试使用两个不同的textareas显示相同的代码,但是使用一个母版和另一个副本。在副本中textarea,我想强调一些更改,类似于我们进行某些更改时GitHub提供的内容。
我想知道这是否可能,或者有人以前做过类似的事情。欢迎任何建议。
我有一个数据框,其结构如下:
V1 V2 V3 V4
1 1.35 A 10241297 10459084
2 16.00 A 10241297 10459084
3 1.47 A 10241297 10459084
Run Code Online (Sandbox Code Playgroud)
我想基于V2,V3和V4对V1进行平均
我看到的所有聚合示例都是基于单个值处理聚合.
任何帮助表示赞赏
谢谢
我有一个表格文件,其中列是一个重复的示例
toto tata AFG
fff ddd AFG
ff hhh AWM
qqq ttt AWM
Run Code Online (Sandbox Code Playgroud)
我想有一个输出像
toto tata AFG 1
fff ddd AFG 1
ff hhh AWM 2
qqq ttt AWM 2
Run Code Online (Sandbox Code Playgroud)
通过使用第4列将每条线与下一条线进行比较
是不是可以用awk快速完成?
请求帮助
我正在考虑在字符串中获取所有唯一重复的最佳方法,并按长度和重复频率(数字)对它们进行排序
我开始使用此代码
public static void main(String[] args)
{
String s = "AAAABBBBAAAANNNNAAAABBBBNNNBBBBAAAA";
Matcher m = Pattern.compile("(\\S{2,})(?=.*?\\1)").matcher(s);
while (m.find())
{
for (int i = 1; i <= m.groupCount(); i++)
{
System.out.println(m.group(i));
}
}
}
Run Code Online (Sandbox Code Playgroud)
并希望得到一些有这样的输出的建议:
AAAA 4 1,9,17,33等
其中4 =重复次数,1,9,17,33个位置
我感谢您的帮助
我必须显示两个 div(输入和输出),以便它们一个在左侧,另一个在右侧。
使用此 css 代码,它们非常适合全屏显示,但我希望能够将它们放入父 div 中,这将是容器
#in{
position: fixed;
top: 0;
left: 0;
bottom: 0;
width: 50%;
overflow: auto;
font-size: 12px;
box-shadow: 0 2px 10px rgba(0,0,0,0.2);
}
#out{
position: fixed;
top: 0;
right: 0;
left: 50%;
bottom: 0;
overflow: auto;
padding: 10px;
padding-left: 20px;
color: #444;
font-family:Georgia, Palatino, 'Palatino Linotype', Times, 'Times New Roman', serif;
font-size: 16px;
line-height: 1.5em
}
Run Code Online (Sandbox Code Playgroud)
任何人都可以帮我修改此代码吗?
谢谢