推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

词语向量化:低维稠密向量的语义映射方法

更新时间:2026-03-14 11:52:33 大小:14K 上传用户:江岚查看TA发布的资源 标签:词语向量化 下载积分:2分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

一、核心概念与目标

词语向量化是自然语言处理(NLP)的基础任务,旨在将离散的词语符号转化为连续的低维稠密向量,同时保留词语间的语义关系。其核心目标包括:

· 降维映射:将高维稀疏的词袋模型(如One-Hot编码)压缩到低维空间(通常50-300维)

· 语义保留:使向量空间距离与语义相似度正相关,如"国王-男人+女人≈女王"

· 泛化能力:未见过的词汇组合能通过向量运算获得合理语义

二、主流技术方法

(一)基于共现矩阵的方法

通过统计词语在上下文窗口中的共现频率构建矩阵,经降维处理得到向量:

· 潜在语义分析(LSA:使用SVD分解共现矩阵,保留Top-K奇异值

· 优缺点:可解释性强但计算复杂度高,无法捕捉复杂语义关系


部分文件列表

文件名 大小
词语向量化:低维稠密向量的语义映射方法.docx 14K

【关注B站账户领20积分】

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载