Tag: regex

如何识别拼写不同的相似单词

我想从数据库中筛选出重复的客户名称。 单个客户可能有多个具有相同名称的系统条目,但拼写上的差异很小。 所以这是一个例子:一个名为Brook的客户可能有三个条目进入系统: 布鲁克伯塔 布鲁克伯塔 Biruk Berta 我们假设我们将此名称放在一个数据库列中。 我想知道识别此类重复的不同机制,例如100,000条记录。 我们可以在C#中使用正则表达式来迭代所有记录或其他一些模式匹配技术,或者我们可以将这些记录导出到最适合此类查询的内容(具有正则表达式function的SQL))。 这就是我认为的解决方案 编写C#代码来遍历每条记录 只按顺序获取辅音字母(在上述情况下:BrKBrt) 从其他记录中搜索相同的辅音模式,考虑类似的声音字母,如(C,K)(C,S),(F,PH) 所以请转发任何想法。

正则表达式在C#中获取图像的SRC

我正在寻找一个正则表达式来隔离img的src值。 (我知道这不是最好的方法,但这是我在这种情况下必须做的) 我有一个字符串,其中包含简单的HTML代码,一些文本和图像。 我需要从该字符串中获取src属性的值。 到目前为止,我只设法将整个标签隔离开来。 string matchString = Regex.Match(original_text, @”(]+)>)”).Value;

如何从格式化的字符串中删除空行?

如何在C#中删除字符串中的空行? 我在C#(winforms)中生成一些文本文件,由于某种原因,有一些空行。 如何在生成字符串后删除它们(使用StringBuilder和TextWrite )。 示例文本文件: THIS IS A LINE THIS IS ANOTHER LINE AFTER SOME EMPTY LINES! 谢谢。

用于validation多个电子邮件地址的正则表达式

我有一个正则表达式validation我的邮件地址是这样的: ([a-zA-Z0-9_\-\.]+)@((\[[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.)|(([a-zA-Z0-9\-]+\.)+))([a-zA-Z]{2,4}|[0-9]{1,3})(\]?) 这完全正常,但只允许输入一封电子邮件。 现在我想扩展它并允许添加多个邮件地址(例如,就像MS Outlook一样),并使用分号作为邮件分割器。 mail1@tld.com;mail2@tld.com;mail3@tld.com 现在我搜索并找到了这个: ([A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,4}(;|$)) 这在一点上有效,但遗憾的是在邮件末尾需要一个分号: mail1@tld.com; 当用户只输入一封电子邮件时,这不是我想要的。 如何扩展我的正则表达式(第一个)以允许添加多个邮件地址,同时让它们通过分号分割?

禁用文本中的空格

如何在文本框条目中阻止空格? 我试过这个,但它不起作用: [RegularExpression(@”/^\s/”, ErrorMessage = “white space is not allowed in username”)] public string UserName { get; set; } ‘^’否定不应该允许文本中的空格,但它不允许我在字段中输入任何文本。 有帮助吗?

检查字符串中的特殊字符(/ * – + _ @和$#%)?

如何检查字符串以确保它只包含数字,字母或空格?

正则表达式的IP地址

我尝试使用此代码validationIP地址,但它不起作用…… public static bool IP(string ipStr) { string pattern = @”^([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])(\.([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])){3}$”; Regex check = new Regex (pattern); bool valid = false; if (ipStr == “”) { valid = false; } else { valid = check.IsMatch (ipStr, 0); } return valid; } 知道什么是错的吗?

强密码正则表达式

我需要强大的密码validation正则表达式 Special Characters – Not Allowed Spaces – Not Allowed Numeric Character – At least one character At least one Capital Letter Minimum and Maximum Length of field – 6 to 12 Characters Repetitive Characters – Allowed only two repetitive characters 我的正则表达式是^(?=.*\d)(?=.*[az])(?=.*[AZ])(?!.*\s)(?=(?:(\w)(?!\1{2}))+).{6,12}$但忽略了特殊字符(在哪里添加?) 请帮忙!

如何保留Regex.Split的分隔符?

我想使用Regex类中的Split函数拆分字符串。 问题是它删除了分隔符,我想保留它们。 优选地作为分裂中的单独元件。 根据我发现的其他讨论 ,只有不方便的方法来实现这一点。 有什么建议?

正则表达式匹配缺一场比赛?

我有正则表达式1(0*)1和测试字符串1000010001 我希望有2场比赛,但我发现只有1场比赛: var regex = new Regex(“1(0*)1”); var values = regex.Matches(intBinaryString); // values only has 1 match regexonline似乎同意: https ://regex101.com/r/3J9Qxj/1 我究竟做错了什么?