推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

基于词频统计的文本关键词提取方法

更新时间:2020-01-08 12:19:35 大小:2M 上传用户:songhuahua查看TA发布的资源 标签:词频统计 下载积分:1分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

针对传统TF-IDF算法关键词提取效率低下及准确率欠佳的问题,提出一种基于词频统计的文本关键词提取方法。首先,通过齐普夫定律推导出文本中同频词数的计算公式;其次,根据同频词数计算公式确定文本中各频次词语所占比重,发现文本中绝大多数是低频词;最后,将词频统计规律应用于关键词提取,提出基于词频统计的TFIDF算法。采用中、英文文本实验数据集进行仿真实验,其中推导出的同频词数计算公式平均相对误差未超过0.05;确立的各频次词语所占比重的最大误差绝对值为0.04;提出的基于词频统计的TF-IDF算法与传统TF-IDF算法相比,平均查准率、平均查全率和平均F1度量均有提高,而平均运行时间则均有降低。实验结果表明,在文本关键词提取中,基于词频统计的TF-IDF算法在查准率、查全率及F1指标上均优于传统TF-IDF算法,并能够有效减少关键词提取运行时间。


部分文件列表

文件名 大小
基于词频统计的文本关键词提取方法.pdf 2M

【关注B站账户领20积分】

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单
  • zhengdai 打赏1000.00元   3天前

    资料:STM32IAP使用说明

  • gsy幸运 打赏955.00元   3天前

    资料:STM32IAP使用说明

  • 小猫做电路 打赏855.00元   3天前

    资料:STM32IAP使用说明

  • 21ic小能手 打赏310.00元   3天前

    用户:zhengdai

  • 21ic小能手 打赏320.00元   3天前

    用户:liqiang9090

  • 21ic小能手 打赏310.00元   3天前

    用户:gsy幸运

  • 21ic小能手 打赏270.00元   3天前

    用户:jh03551

  • 21ic小能手 打赏240.00元   3天前

    用户:小猫做电路

  • 21ic小能手 打赏210.00元   3天前

    用户:w178191520

  • 21ic小能手 打赏90.00元   3天前

    用户:kkfjenui

  • 21ic小能手 打赏60.00元   3天前

    用户:liao6

  • 21ic小能手 打赏60.00元   3天前

    用户:w1966891335

  • 21ic小能手 打赏90.00元   3天前

    用户:jh0355

  • 21ic小能手 打赏30.00元   3天前

    用户:xuzhen1

  • 21ic小能手 打赏30.00元   3天前

    用户:sun2152

  • 21ic小能手 打赏50.00元   3天前

    用户:xzxbybd

  • 21ic小能手 打赏50.00元   3天前

    用户:mulanhk

  • 21ic小能手 打赏20.00元   3天前

    用户:x15580286248

  • 21ic小能手 打赏15.00元   3天前

    用户:w993263495

  • 21ic小能手 打赏30.00元   3天前

    用户:玉落彼岸

  • 21ic小能手 打赏20.00元   3天前

    用户:铁蛋锅

推荐下载