Alex_McAvoy

想要成为渔夫的猎手

【线性变换】

设 $V_1,V_2$ 是数域 $F$ 上的两个线性空间,将 $V_1$ 到 $V_2$ 的映射称为变换,线性变换是其中最简单、最基本的一种变换,其与矩阵、线性空间等都有密切的联系

定义变换 $T:V_1\rightarrow V_2$,若满足 $\forall \alpha_1,\alpha_2\in V_1,\lambda\in F$,有

阅读全文 »

【线性空间】

数域

线性空间是近代数学最重要的基本概念之一,在引入线性空间的概念前,首先给出数域的概念

阅读全文 »

不蒜子是一款轻量级网页计数器,可将网站访问计数直接显示在网页上

NexT 中内置了不蒜子所提供的网页计数功能,只需要在 NexT 主题的配置文件 next/_config 中启用即可

1
2
3
4
5
6
7
8
9
10
# Show Views / Visitors of the website / page with busuanzi.
# Get more information on http://ibruce.info/2015/04/04/busuanzi
busuanzi_count:
enable: true # 启用不蒜子
total_visitors: true # 网站总访客数
total_visitors_icon: fa fa-user
total_views: true # 网站总浏览数
total_views_icon: fa fa-eye
post_views: true # 文章浏览数
post_views_icon: fa fa-eye
阅读全文 »

【概述】

给定一个数据集,可以将其映射为一个图,数据集中的每个样本对应于图中的一个结点,若两个样本间具有较高的相似度,则对应结点间存在一条边,边的强度正比于样本间的相似度

若将有标记的样本所对应的结点视为染色,未标记的样本所对应的结点视为尚未染色,则半监督学习就对应于颜色在图上扩散或传播的过程,由于一个图对应了一个矩阵,这就使得能够基于矩阵运算来进行半监督学习算法的推导和分析

阅读全文 »

【概述】

半监督支持向量机(Semi-Supervised Support Vector Machine,S3VM)支持向量机在半监督学习上的推广,在不考虑未标记样本时,支持向量机试图找到最大间隔划分超平面,而在考虑未标记样本后,S3VM 试图找到能将两类有标记样本分开,且穿过数据低密度区域的划分超平面

如图下图所示,这里的基本假设是低密度分隔(Low-density Separation),显然,这是聚类假设在考虑线性超平面划分后的推广

阅读全文 »

【概述】

生成式半监督方法(Generative semi-supervised methods)是直接基于生成式模型的方法,该类方法假设所有数据都是由同一个潜在的模型生成的

这个假设能够通过潜在模型的参数将未标记数据与学习目标联系起来,而未标记数据的标记则可看作模型的缺失参数,通常可基于 EM 算法进行极大似然估计求解

阅读全文 »

【未标记样本】

假设训练集 $D_l=\{ (\mathbf{x}_1,y_1),(\mathbf{x}_2,y_2), \cdots, (\mathbf{x}_l,y_l)\}$ 的 $l$ 个样本的标签已知,称为有标记样本(Labeled sample)

还有 $D_u=\{ \mathbf{x}_{l+1},\mathbf{x}_{l+2},\cdots,\mathbf{x}_{l+u} \},l\leq u$ 个样本的标签未知,称为无标记样本(Unlabeled Sample)

阅读全文 »

【概述】

PageRank 算法于 1996 年由 Page 和 Brin 提出,最初用于谷歌搜索引擎的网页排序,其是定义在网页集合上的一个函数,其对每个网页给出一个正实数,表示网页的重要程度,整体构成一个向量,PageRank 值越高,网页越重要,在互联网搜索的排序中可能就被排在前面

PageRank 假设互联网是一个有向图,每个网页是图中的一个结点,浏览者在每个网页依照连接出去的超链接以等概率跳转到下一个网页,并持续不断进行这样的随机跳转,整个沿着有向图随机访问各网页结点的过程,被定义成一个随机游走模型,即一阶马尔可夫链

阅读全文 »

【概述】

流形学习(Manifold Learning)是一类借鉴拓扑流形概念的降维方法

流形是指在局部与欧氏空间同胚的空间,即其在局部具有欧氏空间的性质,能用欧氏距离来进行距离计算

阅读全文 »

【概述】

线性降维方法假设从高维空间到低维空间的函数映射是线性的,但在实际应用中,可能需要非线性映射才能找到合适的低维嵌入

如下图所示,样本点从二维空间中的矩形区域采样后,以 S 形曲面嵌入到三维空间,若直接使用线性降维方法对三维空间观察到的样本点进行降维,则将丢失原本的低维结构

阅读全文 »