机器学习/数据挖掘面试问题——第10章降维与度量学习

kNN：给定测试样本，基于某种距离度量找出训练集中与其最靠近的k个样本，然后基于这k个邻居的信息来进行预测，通常在分类任务中可以采用投票法，在回归任务中可以采用平均法，还可以根据距离远近进行加权平均或加权投票。

LiangManqi0320

353人浏览 · 2024-05-18 21:20:21

LiangManqi0320 · 2024-05-18 21:20:21 发布

学习路线参考《机器学习》周志华

其他参考书：《机器学习实战》《数据挖掘》《百面机器学习》

还在更新ing...

1.什么是k近邻学习？

2.维数灾难是指什么？

在高维情形下，出现的数据样本稀疏、距离计算困难等问题。

3.降维

直接降维：特征选择，线性降维：PCA、MDS，非线性降维：流形学习（Isomap、LLE）

3.1 PCA

主成分分析(PCA，Principal Component Analysis) 用随机向量少量的线性变换代表原随机向量，并尽可多地保留有效信息。

永洪数据分析社区

永洪科技，致力于打造全球领先的数据技术厂商，具备从数据应用方案咨询、BI、AIGC智能分析、数字孪生、数据资产、数据治理、数据实施的端到端大数据价值服务能力。

更多推荐

java计算机毕业设计教师工作量统计系统基于SpringBoot的高校教师绩效测算与可视化平台教师教学任务与工作量智能汇总系统

永洪数据分析社区

BI是报表？BI是可视化？BI到底是什么？

永洪数据分析社区

BackstopJS 与 Prettier 集成：配置文件格式化与团队规范统一

在当今的前端开发环境中，**BackstopJS** 作为一款强大的视觉回归测试工具，已经成为保障UI一致性的重要武器。然而，随着团队规模的扩大和项目的复杂度提升，如何确保所有开发人员遵循统一的配置规范成为了一个挑战。本文将为您详细介绍如何通过 Prettier 工具实现 BackstopJS 配置文件的自动格式化，从而提升团队协作效率和代码质量。💪## 为什么需要 BackstopJS 配