我正在绘制F1/F2元音图(这里有一个例子).每个元音都有几个点/值,我想在点周围绘制一个椭圆,这样:
我可能会让事情复杂化,但三角学和数学对我来说是希腊语.以下是我尝试过的.
Ellipsoidhull()
Ellipsoidhull()在包"cluster"中.如果我将具有F1和F2的矩阵传递给函数,它似乎计算椭圆的中心,但方向值很大.例如:
> olm
ol.f1 ol.f2 # f1/f2 data
[1,] 501.3 850.5
[2,] 488.5 906.5
[3,] 456.3 857.0
[4,] 505.8 895.3
[5,] 499.5 898.0
[6,] 431.8 891.5
[7,] 416.3 870.5
[8,] 506.0 887.8
[9,] 500.3 985.8
[10,] 513.5 955.3
[11,] 531.5 958.0
[12,] 483.0 847.3
[13,] 533.3 982.8
[14,] 480.8 881.8
[15,] 484.3 884.5
Run Code Online (Sandbox Code Playgroud)
如果传递给ellipsoidhull:
> ellipsoidhull(olm)
'ellipsoid' in 2 dimensions:
center = ( 480.69 904.33 ); squared ave.radius d^2 = …Run Code Online (Sandbox Code Playgroud) 我想自己编写Metaphone 3算法代码.有描述吗?我知道源代码可以出售,但这不是我想要的.
从很小的时候起我就有严重的耳聋,但幸运的是,我可以像普通人一样说话.语言交流对我来说一直很困难,因为我的语音识别能力受损,即使是唇读也是如此.我只是通过阅读电路板,幻灯片,书籍和互联网来经历学校和大学.我目前的软件工程工作做得非常好,但是最近我觉得我必须付出一些努力来改善我的情况.
字幕是我在这个国家的救星,用于了解电视上的电影/节目,我在过去的7年里一直很享受这一点(我现在31岁).
每当我和某些人,甚至是陌生人交谈时,我都强烈地感到需要能够在现实生活中看到字幕.我想开发一个未经训练的语音到文本转换器,作为一个开始,它甚至不必为我拼出精确的单词,只有音节/语音的提示也会没问题.
我已经用谷歌搜索了一段时间,但大多数结果是文本到语音或语音识别的半成品尝试,以给计算机语音命令.我真的想得到一些关于如何开始这个项目的指示.具体来说,我需要一些步骤,比如如何处理音频文件以及我必须采取哪种处理来尽可能快地获得近似语音.
我正在尝试编写一个程序,将字母表中的任何字母(大写或小写)切换为Phontic字母表.例如,如果我输入"A"或"a",我的程序将给我(更改为)"Alpha".我已经对这个和切换语句做了很多研究,但我一直陷入困境.我意识到我不能在扫描仪中使用'char'.但是,当我将'char'更改为'String'时,我的switch语句会混乱(特别是我的代码中的toUpperCase被加下划线.我看不出我的错误.这是我到目前为止所做的:
import java.util.Scanner;
public class PhoneticTranslate {
public static void main(String[] args) {
char letter;
String phonetic;
Scanner kb = new Scanner(System.in);
System.out.print("Please enter a letter: ");
letter = kb.next();
switch(Character.toUpperCase(letter))
{
case 'A':
phonetic = "Alpha";
break;
case 'B':
phonetic = "Bravo";
break;
case 'C':
phonetic = "Charlie";
break;
case 'D':
phonetic = "Delta";
break;
case 'E':
phonetic = "Echo";
break;
case 'F':
phonetic = "Foxtrot";
break;
case 'G':
phonetic = "Golf";
break;
case 'H':
phonetic = …Run Code Online (Sandbox Code Playgroud) 假设您要采用CMU的语音数据集输入,如下所示:
ABERRATION AE2 B ER0 EY1 SH AH0 N
ABERRATIONAL AE2 B ER0 EY1 SH AH0 N AH0 L
ABERRATIONS AE2 B ER0 EY1 SH AH0 N Z
ABERT AE1 B ER0 T
ABET AH0 B EH1 T
ABETTED AH0 B EH1 T IH0 D
ABETTING AH0 B EH1 T IH0 NG
ABEX EY1 B EH0 K S
ABEYANCE AH0 B EY1 AH0 N S
Run Code Online (Sandbox Code Playgroud)
(单词在左边,右边是一系列音素,在此处输入键)
您想将其用作机器学习系统的训练数据,该系统将使用新单词并猜测它们将如何用英语发音。
至少对我来说不是那么明显,因为没有固定大小的字母可以映射到音素。我觉得与马尔可夫链有关的事情可能是正确的方法。
你会怎么做?
我目前正在开展一个项目,我认为能够用各种语言提出单词的语音表示非常有用.我知道Aspell做得很好,但是我认为没有一种非常简单的方式可以获得他们的语音表示,所以我问:是否还有其他一些好的方法可以获得单词和语言的单词的语音表示/方言/口音/它来自何处?
这不需要使用任何特定的语言,但如果它是Perl,那将是最好的.
我已经尝试过Soundex,Metaphone,DoubleMetaphone以及Text :: Phonetic中的所有其他内容,而且这些东西都不是很好 - 绝对不如Aspell的那么好.
我正在尝试构建一个 iOS 应用程序。在其中一个屏幕中,用户可以在搜索栏中键入一些内容,而我必须对同一个单词的不同拼写采取相同的操作。
例如:用户可以输入"elephant"或"alephant"或"elefant"。我必须对这三个词采取同样的行动。
是否有任何图书馆将这些词识别为相似词?我不能使用拼写检查器,因为我在英语以外的语言中也需要它......我做了一些研究,我发现有一些语音算法,如 Text::soundex 可以在服务器端实现这一点。想知道是否有适用于 iOS 的库?
提前致谢 !!
我知道搜索具有类似声音的单词的算法,例如Fuzzy库支持的算法。
但是如何反向搜索呢?也就是说,给定一个符号 like /?/,搜索所有可能的单词匹配的文档,比如earth, thigh, throw, bath。
我在 Elasticsearch 中使用了Metaphone和soundex编码器以及“Phonetic Token Filter”。
变音位对于英语单词很有用。
Soundex适用于英语、印地语以及许多其他语言。
我想知道哪些编码器最适合印地语以及其他印度语言(如果可能的话)?
由于Elasticsearch 网站上没有列出我们应该选择哪种语言的编码器。
还请告诉我您已经使用过哪些编码器以及用于哪种语言。
我想用python得到短信的发音。例如,消息“text”应转换为“tekst”,消息“\xd0\xbf\xd1\x80\xd0\xb8\xd0\xb2\xd0\xb5\xd1\x82\”(俄语) 应转换为“privet”。
\n\n我尝试使用googletrans,但实际上没有发音(发音是“无”,我的问题)。
\n\n有人知道这个任务的一些包吗?我用谷歌搜索过但没有结果。我发现了超过 5 个用于将文本转换为语音或文本翻译为语音的软件包,但我不需要音频文件,我只需要发音文本。Phonemizer是非常好的解决方案,但我无法在 Windows 上运行它的后端。
\n\n\npython text-to-speech phonetics google-text-to-speech google-translation-api