Tag: 音素

在.Net中对音素的演讲

问题是我想用C#语言获取音频语音的音素。 假设你有一个像“x.wav”这样的音频文件,上面写着“你好亲爱的Shamim”。 我想提取演讲的所有音素和他们的相对时间。 如下图所示: 我使用System.Speech库( recognition和synthesis命名空间)但我找不到我想要的东西。 现在别搞错了! 我不希望句子的音素“你好亲爱的Shamim”,我想从未知的音频输入中提取音素和英语句子。 我尝试过System.Speech.Recognition但它尝试从音频文件中提取出来的单词,而不是手机! 正如你可能猜到的那样,这些词是错误的! ;)