Tag: nlp

Stanford CoreNLP创建edu.stanford.nlp.time.TimeExpressionExtractorImpl时出错: 我正在尝试学习斯坦福CoreNLP库。我正在使用带有发布示例的C＃（ https://sergeytihon.wordpress.com/2013/10/26/stanford-corenlp-is-available-on-nuget-for-fc-devs/ ）。我通过nuget加载了包“Stanford.NLP.CoreNLP”（它添加了IKVM.NET）并下载了代码。解压缩.jar模型。我的目录是正确的。我收到以下错误： > edu.stanford.nlp.util.ReflectionLoading.ReflectionLoadingException was > unhandled HResult=-2146233088 Message=Error creating > edu.stanford.nlp.time.TimeExpressionExtractorImpl > Source=stanford-corenlp-3.5.0 StackTrace: at > edu.stanford.nlp.util.ReflectionLoading.loadByReflection(String > className, Object[] arguments) at > edu.stanford.nlp.time.TimeExpressionExtractorFactory.create(String > className, String name, Properties props) at > edu.stanford.nlp.time.TimeExpressionExtractorFactory.createExtractor(String > name, Properties props) at > edu.stanford.nlp.ie.regexp.NumberSequenceClassifier..ctor(Properties > props, Boolean useSUTime, Properties sutimeProps) at > […]

Stanford.NLP for .NET没有加载模型: 我正在尝试运行此处为Stanford.NLP for .NET提供的示例代码。我通过Nuget安装了软件包，下载了CoreNLP zip存档，并提取了stanford-corenlp-3.7.0-models.jar。解压后，我找到了stanford-corenlp-full-2016-10-31 \ edu \ stanford \ nlp \ models中的“models”目录。这是我试图运行的代码： public static void Test1() { // Path to the folder with models extracted from `stanford-corenlp-3.6.0-models.jar` var jarRoot = @”..\..\..\stanford-corenlp-full-2016-10-31\edu\stanford\nlp\models\”; // Text for processing var text = “Kosgi Santosh sent an email to Stanford University. He didn’t get a reply.”; // […]

在句子边界处拆分文本文件: 我必须处理一个文本文件（电子书）。我想处理它，以便每行有一个句子（“换行符分隔文件”，是吗？）。如何使用sed UNIX实用程序执行此任务？它是否具有“句子边界”的符号，如“单词边界”的符号（我认为GNU版本具有该符号）。请注意，句子可以以句点，省略号，问题或感叹号结尾，最后两个组合（例如，？，！，！？，!!!!!都是有效的“句子终结符”）。输入文件的格式使得某些句子包含必须删除的换行符。我想过像s/…|. |[!?]+ |/\n/g这样s/…|. |[!?]+ |/\n/g剧本s/…|. |[!?]+ |/\n/g s/…|. |[!?]+ |/\n/g （未转义为更好的阅读）。但它并没有从句子中删除换行符。在C＃怎么样？如果我使用sed中的正则表达式会更快吗？（我想不是）。还有其他更快的方法吗？无论哪种方式（sed或C＃）都没问题。谢谢。

命名实体识别是否有任何c＃库？: 我正在寻找c＃或任何其他.net语言中的命名实体识别的任何免费库。

是否有一个C＃实用程序用于匹配（语法分析）树中的模式？: 我正在开发一个自然语言处理（NLP）项目，我在其中使用语法分析器从给定的句子中创建一个语法分析树。示例输入：我遇到乔和吉尔，然后我们去购物示例输出： [TOP [S [S [NP [PRP I]] [VP [VBD运行] [PP [IN进入] [NP [NNP Joe] [CC和] [NNP Jill]]]]] [CC和] [S [ADVP [RB then]] [NP [PRP we]] [VP [VBD去] [NP [NN shopping]]]]]] 我正在寻找一个允许我执行复杂查询的C＃实用程序：获得与’Joe’相关的第一个VBD 让NP最接近’购物’ 这是一个Java实用程序，我正在寻找一个C＃等价物。任何帮助将非常感激。

如何知道两个单词是否具有相同的基数？: 我想用几种语言知道，如果两个词是：要么是同一个词，或同一个词的语法变体。例如： had并且has相同的基础：在这两种情况下，它都是动词， city和cities有相同的基础。 went又gone就有了同样的基础。有没有办法使用Microsoft Word API不仅拼写检查文本，还可以将单词规范化为基数，或者至少确定两个单词是否具有相同的基数？如果没有，那么允许我这样做的（免费或付费）库（不是网络服务）是什么（再次，用几种语言）？

我应该使用哪种数据类型和方法？: 我正在尝试编写一种简单的搜索引擎。我有确定数量的与特定关键字相关的主要主题。目的是从输入的部分关键字识别主要主题。我正在考虑使用： Dictionary<string, List> 。我将不得不在这个字典中搜索并找到例如以3个字符的string开头的所有关键字以及它们相关联的主要主题。我的解决方案是最好的吗？如何有效地查看这些数据，而无需手动检查每个List ，逐string 。如果我不清楚，请告诉我。

用于确定语句/文本的正面或负面的算法: 我需要实施情绪分析。有人能指出我的示例/参考实现吗？

Interesting Posts

Tag: nlp

Stanford CoreNLP创建edu.stanford.nlp.time.TimeExpressionExtractorImpl时出错

Stanford.NLP for .NET没有加载模型

在句子边界处拆分文本文件

命名实体识别是否有任何c＃库？

是否有一个C＃实用程序用于匹配（语法分析）树中的模式？

如何知道两个单词是否具有相同的基数？

我应该使用哪种数据类型和方法？

用于确定语句/文本的正面或负面的算法

使用带有条件延续的任务

Windows Phone 8使用格式绑定到字符串资源

MediaCapture StartPreviewAsync失败

async / await会影响tcp服务器的性能吗？

覆盖Json反序列化一个前导零作为小数而不是八进制值的数字

频域图像卷积

.NET中的可变新鲜度保证（易失性与易失性读取）

我需要一个快速的运行时表达式解析器

将值参数传递给c＃中的Task

我应该为每个Web请求使用静态缓存的ResourceManager还是新实例？有关系吗？

在ORDER BY子句中阻止SQL注入

无需安装的C ++数据库访问

正则表达式用尖括号替换方括号

TextTransform.exe似乎只接受旧版本的C＃

Serilog – 多个日志文件

Tag: nlp

Stanford CoreNLP创建edu.stanford.nlp.time.TimeExpressionExtractorImpl时出错

Stanford.NLP for .NET没有加载模型

在句子边界处拆分文本文件

命名实体识别是否有任何c＃库？

是否有一个C＃实用程序用于匹配（语法分析）树中的模式？

如何知道两个单词是否具有相同的基数？

我应该使用哪种数据类型和方法？

用于确定语句/文本的正面或负面的算法

使用带有条件延续的任务

Windows Phone 8使用格式绑定到字符串资源

MediaCapture StartPreviewAsync失败

async / await会影响tcp服务器的性能吗？

覆盖Json反序列化一个前导零作为小数而不是八进制值的数字

频域图像卷积

.NET中的可变新鲜度保证（易失性与易失性读取）

我需要一个快速的运行时表达式解析器

将值参数传递给c＃中的Task

我应该为每个Web请求使用静态缓存的ResourceManager还是新实例？ 有关系吗？

在ORDER BY子句中阻止SQL注入

无需安装的C ++数据库访问

正则表达式用尖括号替换方括号

TextTransform.exe似乎只接受旧版本的C＃

Serilog – 多个日志文件

我应该为每个Web请求使用静态缓存的ResourceManager还是新实例？有关系吗？