WindTom 技术、生活

个性化推荐和排序算法


推荐算法

公式 \(x_{1}+x_{2}\)

排序算法

LearningToRank

LDA(Latent Dirichlet Allocation)话题模型

关联分析中的置信度、支持度和提升度[1]

权重系数的确定方法([1]

综合评价中,根据样本数据的有无,可将计算方法分为定量和定性两大类。

定量的方法有:1)熵值法;2)灰色关联度法;3)主成分分析法;4)人工神经网络定权法;5)因子分析法;6)回归分析法 等。

定性的方法有:1)德尔菲法;2)层次分析法;3)模糊聚类法;4)比重法 等。

主成分分析法

基本原理

通过用一些较小的新的数量指标(因子)代替原来较多的指标,这些新指标是原来指标的线性组合,并且能充分载有原来指标的信息,起到降维的作用,而且指标间不相关。可用新指标对原来信息的反映程度作为权。该方法客观性强,避免了人为赋权所造成的偏差。缺点是新指标不可能完全反映原来指标的信息,有一定的偏差,适用于有数据的样本。

计算方法

  1. 原始指标数据的标准化采集p维随机向量 。n个样本

构造样本阵,对样本阵元进行标准化变换:

因子分析法

因子分析法指从研究指标相关矩阵内部的依赖关系出发,把一些信息重叠、具有错综复杂关系的变量归结为少数几个不相关的综合因子的一种多元统计分析方法。

基本思想

根据相关性大小把变量分组,使得同组内的变量之间相关性较高,不同组的变量不相关或相关性较低。每组变量代表一个基本结构,即公共因子。

步骤

  1. 对数据样本进行标准化处理
  2. 计算样本的相关矩阵R
  3. 求相关矩阵R的特征值和特征向量
  4. 根据系统要求的累积贡献率确定主因子的个数。
  5. 计算因子载荷矩阵A
  6. 确定因子模型
  7. 根据上述计算结果,对系统进行分析。

Comments