Tag: nlp

Stanford CoreNLP创建edu.stanford.nlp.time.TimeExpressionExtractorImpl时出错

我正在尝试学习斯坦福CoreNLP库。 我正在使用带有发布示例的C#( https://sergeytihon.wordpress.com/2013/10/26/stanford-corenlp-is-available-on-nuget-for-fc-devs/ )。 我通过nuget加载了包“Stanford.NLP.CoreNLP”(它添加了IKVM.NET)并下载了代码。 解压缩.jar模型。 我的目录是正确的。 我收到以下错误: > edu.stanford.nlp.util.ReflectionLoading.ReflectionLoadingException was > unhandled HResult=-2146233088 Message=Error creating > edu.stanford.nlp.time.TimeExpressionExtractorImpl > Source=stanford-corenlp-3.5.0 StackTrace: at > edu.stanford.nlp.util.ReflectionLoading.loadByReflection(String > className, Object[] arguments) at > edu.stanford.nlp.time.TimeExpressionExtractorFactory.create(String > className, String name, Properties props) at > edu.stanford.nlp.time.TimeExpressionExtractorFactory.createExtractor(String > name, Properties props) at > edu.stanford.nlp.ie.regexp.NumberSequenceClassifier..ctor(Properties > props, Boolean useSUTime, Properties sutimeProps) at > […]

Stanford.NLP for .NET没有加载模型

我正在尝试运行此处为Stanford.NLP for .NET提供的示例代码。 我通过Nuget安装了软件包,下载了CoreNLP zip存档,并提取了stanford-corenlp-3.7.0-models.jar。 解压后,我找到了stanford-corenlp-full-2016-10-31 \ edu \ stanford \ nlp \ models中的“models”目录。 这是我试图运行的代码: public static void Test1() { // Path to the folder with models extracted from `stanford-corenlp-3.6.0-models.jar` var jarRoot = @”..\..\..\stanford-corenlp-full-2016-10-31\edu\stanford\nlp\models\”; // Text for processing var text = “Kosgi Santosh sent an email to Stanford University. He didn’t get a reply.”; // […]

在句子边界处拆分文本文件

我必须处理一个文本文件(电子书)。 我想处理它,以便每行有一个句子(“换行符分隔文件”,是吗?)。 如何使用sed UNIX实用程序执行此任务? 它是否具有“句子边界”的符号,如“单词边界”的符号(我认为GNU版本具有该符号)。 请注意,句子可以以句点,省略号,问题或感叹号结尾,最后两个组合(例如,?,!,!?,!!!!!都是有效的“句子终结符”)。 输入文件的格式使得某些句子包含必须删除的换行符。 我想过像s/…|. |[!?]+ |/\n/g这样s/…|. |[!?]+ |/\n/g剧本s/…|. |[!?]+ |/\n/g s/…|. |[!?]+ |/\n/g (未转义为更好的阅读)。 但它并没有从句子中删除换行符。 在C#怎么样? 如果我使用sed中的正则表达式会更快吗? (我想不是)。 还有其他更快的方法吗? 无论哪种方式(sed或C#)都没问题。 谢谢。

命名实体识别是否有任何c#库?

我正在寻找c#或任何其他.net语言中的命名实体识别的任何免费库。

是否有一个C#实用程序用于匹配(语法分析)树中的模式?

我正在开发一个自然语言处理(NLP)项目,我在其中使用语法分析器从给定的句子中创建一个语法分析树。 示例输入:我遇到乔和吉尔,然后我们去购物 示例输出: [TOP [S [S [NP [PRP I]] [VP [VBD运行] [PP [IN进入] [NP [NNP Joe] [CC和] [NNP Jill]]]]] [CC和] [S [ADVP [RB then]] [NP [PRP we]] [VP [VBD去] [NP [NN shopping]]]]]] 我正在寻找一个允许我执行复杂查询的C#实用程序: 获得与’Joe’相关的第一个VBD 让NP最接近’购物’ 这是一个Java实用程序 ,我正在寻找一个C#等价物。 任何帮助将非常感激。

如何知道两个单词是否具有相同的基数?

我想用几种语言知道,如果两个词是: 要么是同一个词, 或同一个词的语法变体。 例如: had并且has相同的基础:在这两种情况下,它都是动词, city和cities有相同的基础。 went又gone就有了同样的基础。 有没有办法使用Microsoft Word API不仅拼写检查文本,还可以将单词规范化为基数,或者至少确定两个单词是否具有相同的基数? 如果没有,那么允许我这样做的(免费或付费)库(不是网络服务)是什么(再次,用几种语言)?

我应该使用哪种数据类型和方法?

我正在尝试编写一种简单的搜索引擎。 我有确定数量的与特定关键字相关的主要主题。 目的是从输入的部分关键字识别主要主题。 我正在考虑使用: Dictionary<string, List> 。 我将不得不在这个字典中搜索并找到例如以3个字符的string开头的所有关键字以及它们相关联的主要主题。 我的解决方案是最好的吗? 如何有效地查看这些数据,而无需手动检查每个List ,逐string 。 如果我不清楚,请告诉我。

用于确定语句/文本的正面或负面的算法

我需要实施情绪分析。 有人能指出我的示例/参考实现吗?