我正在使用熊猫直方图.
我想设置图的y轴范围.
以下是上下文:
import matplotlib.pyplot as plt
%matplotlib inline
interesting_columns = ['Level', 'Group']
for column in interesting_columns:
data['ranking'].hist(by=data[column], normed=True)
Run Code Online (Sandbox Code Playgroud)
有一个范围参数可以过滤x值,但我不知道y等价:
hist(by=[column], normed=True, range=[0, 1]) #working argument
hist(by=[column], normed=True, y_range=[0, 1]) #hypothetical argument
Run Code Online (Sandbox Code Playgroud)
我已经阅读了许多使用plt属性更改绘图范围的方法.它们似乎不在循环和子图中工作.
我正在努力抓住解决这个问题的正确方法.
给定两个字符串,我想从最长到最短识别所有常见的子字符串。
我想删除任何“子”子字符串。例如,“1234”的任何子字符串都不会包含在“12345”和“51234”之间的匹配中。
string1 = '51234'
string2 = '12345'
result = ['1234', '5']
Run Code Online (Sandbox Code Playgroud)
我想找到最长的公共子串,然后递归地找到左边/右边的最长子串。但是,我不想在找到后删除公共子字符串。例如,下面的结果在中间共享一个 6:
string1 = '12345623456'
string2 = '623456'
result = ['623456', '23456']
Run Code Online (Sandbox Code Playgroud)
最后,我需要根据数千个字符串的固定列表检查一个字符串。我不确定是否可以采取一个聪明的步骤来散列这些字符串中的所有子字符串。
以前的答案:
在这个线程中,找到了一个需要 O(nm) 时间的动态规划解决方案,其中 n 和 m 是字符串的长度。我对使用后缀树的更有效方法感兴趣。
背景:
我正在从旋律片段中创作歌曲旋律。有时,组合会设法生成与现有音符的一行中太多音符匹配的旋律。
我可以使用字符串相似性度量,例如编辑距离,但相信与旋律差异很小的曲调是独特而有趣的。不幸的是,这些曲调与连续复制旋律的许多音符的歌曲具有相似的相似度。
histogram ×1
matching ×1
matplotlib ×1
pandas ×1
python ×1
string ×1
substring ×1
suffix-tree ×1