在不知道k的情况下,哪种聚类算法适用于一维列表?
我有一个像这样的一维列表
public class Zeit_und_Eigenschaft { [Feature] public double Sekunden { get; set; } } //... List lzue = new List(); //fill lzue
lzue可以
lzue.Sekunden 1 2 3 4 8 9 10 22 55 ...
目标是在该列表中找到群集,即在此示例中可以形成像fi这样的群组的元素
lzue.Sekunden 1 2 3 4 8 9 10 22 55
哪种聚类算法是合适的(我不知道聚类数k)? GMM? PCA? K均值? 其他?
不要寻找聚类算法。
聚类是多变量数据的一个很好的术语,但您的数据是一维的,因此您应该查看更多旧的统计数据 。 例如自然rest优化。
或者只是核密度估计。 事实上,你已经在stackoverflow上找到了几十个相同的问题……
1D数组数组
最优地聚类一维数据?
将float数组划分为类似的段(聚类)
有效地将相似数字组合在一起
通过它们在python中的接近度来聚类值(机器学习?)
几个月前,MSDN杂志就这一主题发表了一篇很好的文章。 他们使用k-means算法。 链接:
http://msdn.microsoft.com/en-us/magazine/jj891054.aspx
另外,作为Andrew Ng在线机器学习课程的一部分,有一些关于k-means聚类的video。 链接:
https://class.coursera.org/ml-003/lecture/preview
当你不知道k时,有一些算法可以搜索一个好的值。 在网上搜索k-means + elbow。