【概述】
在自然语言处理(Natural Language Processing,NLP)中,一个核心问题是对文本的语义内容进行表示,并进行文本间的语义相似度计算
最简单的一种方法是利用单词向量空间模型(Word Vector Space Model,WVSM),对于给定的文本集合,将其中的每一个文本的语义信息用一个向量来表示,向量的每一维对应一个单词,其数值为该单词在该文本中出现的频数或权值,这样一来,文本集合中的每个文本都表示为一个向量,存在于一个向量空间中,向量空间的度量就表示为文本间的语义相似度