降维算法
㈠ 请问当今比较流行的数据降维算法有哪些
这个要看你的需求和数据的data distribution,找到最合适的算法解决你的问题。
如果数据分布比较简单,线性映射降维就够了,比如PCA、ICA。
如果数据分布比较复杂,可能需要用到manifold learning,具体算法比如SOM、MDS、ISOMAP、LLE,另外deep learning也可以用来做降维。
㈡ 数据降维是什么意思
数据降维是将数据进行降维处理的意思。
降维,通过单幅图像数据的高维化,将单幅图像转化为高维空间中的数据集合,对其进行非线性降维。寻求其高维数据流形本征结构的一维表示向量,将其作为图像数据的特征表达向量。降维处理是将高维数据化为低维度数据的操作。一般来说,化学过程大都是一个多变量的变化过程,一般的化学数据也都是多变量数据。
(2)降维算法扩展阅读:
数据降维运用:
通过单幅图像数据的高维化,将单幅图像转化为高维空间中的数据集合,对其进行非线性降维,寻求其高维数据流形本征结构的一维表示向量,将其作为图像数据的特征表达向量。从而将高维图像识别问题转化为特征表达向量的识别问题,大大降低了计算的复杂程度,减少了冗余信息所造成的识别误差,提高了识别的精度。
通过指纹图像的实例说明,将非线性降维方法(如Laplacian Eigenmap方法)应用于图像数据识别问题,在实际中是可行的,在计算上是简单的,可大大改善常用方法(如K-近邻方法)的效能,获得更好的识别效果。此外,该方法对于图像数据是否配准是不敏感的,可对不同大小的图像进行识别,这大大简化了识别的过程。
㈢ matlab中的降维函数是什么
drttoolbox : Matlab Toolbox for Dimensionality Rection是Laurens van der Maaten数据降维的工具箱。
里面囊括了几乎所有的数据降维算法:
- Principal Component Analysis ('PCA')
- Linear Discriminant Analysis ('LDA')
- Independent Component Analysis ('ICA')
- Multidimensional scaling ('MDS')
- Isomap ('Isomap')
- Landmark Isomap ('LandmarkIsomap')
- Locally Linear Embedding ('LLE')
- Locally Linear Coordination ('LLC')
- Laplacian Eigenmaps ('Laplacian')
- Hessian LLE ('HessianLLE')
- Local Tangent Space Alignment ('LTSA')
- Diffusion maps ('DiffusionMaps')
- Kernel PCA ('KernelPCA')
- Generalized Discriminant Analysis ('KernelLDA')
- Stochastic Neighbor Embedding ('SNE')
- Neighborhood Preserving Embedding ('NPE')
- Linearity Preserving Projection ('LPP')
- Stochastic Proximity Embedding ('SPE')
- Linear Local Tangent Space Alignment ('LLTSA')
- Simple PCA ('SPCA')
㈣ 统计方法中,有哪些降维方法
七种降维方法:
1、缺失值比率 (Missing Values Ratio)
2、 低方差滤波 (Low Variance Filter)
3、 高相关滤波 (High Correlation Filter)
4、 随机森林/组合树 (Random Forests)
5、 主成分分析 (PCA)
6、 反向特征消除 (Backward Feature Eliminati
7、 前向特征构造 (Forward Feature Construction)
㈤ 求大神简述一下LLE算法(或降维算法)在模式识别和数据挖掘中是怎样被应用的呢,谢谢
关于LLE算法具体的理论部分你可参考http://www.pami.sjtu.e.cn/people/xzj/introcelle.htm
Locally linear embedding (LLE),使用这种算法可以进行非线性降维,关键是其能够使降维后的数据保持原有拓扑结构
先给出一张下面算法得到的图 ,图中第一幅
LLE算法可以归结为三步:
(1)寻找每个样本点的k个近邻点;
(2)由每个样本点的近邻点计算出该样本点的局部重建权值矩阵;
(3)由该样本点的局部重建权值矩阵和其近邻点计算出该样本点的输出值。
为原始数据,第三个为降维后的数据,可以看出处理后的低维数据保持了原有的拓扑结构。
另,本人对LLE算法不是很熟悉,在此介绍一下其他降维算法的使用,以SVD算法为例。
电影推荐。
(1)假设现在有一个用户和电影评分的二维矩阵,矩阵内容是用户对电影的评分,现有得知某个用户对部分电影的评分,由此为该用户推荐他可能喜欢的电影。
(2)假设用户有100W,电影有100W部,那么对于任意一种推荐算法来说,这个数据量都很大,该问题无法在单机上进行运算解决;
(3)这100W维特征中必然存在一些几乎不重要的特征,这时,我们就需要用降维算法进行降维,降维的目的就是去掉大量的不重要的特征,以简化运算;
(4)在此例中,可以使用SVD(或SVD++)算法对矩阵进行降维
图片相似度
(1)通常,进行图片相似度判断首先会将图片通过傅里叶变换转换成数值代表的矩阵,矩阵代表着该图片,一般来说矩阵维数越高越精确
(2)同样,维数过高的情况下,相似度计算成本很高,因此同样需要降维,在图片相似度识别中常用的降维算法是PCA算法;
总之,降维的目的就是减少特征的维数,减少运算的成本。
以上皆为我的拙见,如有疑义请指正。
㈥ 降维算法里面的“维”是指一维数组还是矩阵,到底是什么意思求朋友指导
都可以啊亲,,,看你的数据咯~你的原始数据是向量,降维自然就是低维向量,你的数据是矩阵,降维就可以降成低阶矩阵,,,流形之类的结构降维本质上等价于其上的切空间降维,降维手段不仅可以通过邻域展开,也可以通过切空间内的数学量降维,对于向量空间来说,可用的实在太多了,加油~~
㈦ 降维方法不同会影响聚类结果吗
好像一般情况下会有一点点影响,但是影响不大,额觉得还是固定一下吧。
㈧ 流形学习的降维方法与其他方法有什么优点
有监督的降维学习方法,和PCA类似.
motivation: 从类内距离最小,类间距离最大的这个角度来构造目标函数。
MDS
一种j降维的方法,是和PCA对偶的。
motivation:保证降维之后点对之间的欧式距离不变。
㈨ 谁能给我详细讲一下拉普拉斯降维的算法步骤啊
在数学以及物理中, 拉普拉斯算子或是拉普拉斯算符(英语:Laplace operator, Laplacian)是一个微分算子,通常写成 Δ 或 ∇²;这是为了纪念皮埃尔-西蒙·拉普拉斯而命名的。拉普拉斯算子有许多用途,此外也是椭圆型算子中的一个重要例子。在物理中,常用于波方程的数学模型、热传导方程以及亥姆霍兹方程。在静电学中,拉普拉斯方程和泊松方程的应用随处可见。在量子力学中,其代表薛定谔方程式中的动能项。在数学中,经拉普拉斯算子运算为零的函数称为调和函数;拉普拉斯算子是霍奇理论的核心,并且是德拉姆上同调的结果。