集搜客的正面得分和负面得分是怎么算的?
举报 使用道具
| 回复

共 15 个关于本帖的回复 最后回复于 2022-5-14 17:05

Fuller 管理员 发表于 2022-5-13 16:28:19 | 显示全部楼层
重要:本贴下面的帖子,凡是发布时间比本贴早的,说的算法都失效了。为了提高情感分析的准确度,集搜客的情感分析算法进行了全面的升级,计算方法变了,请看《集搜客分词软件情感分析算法升级通知

举报 使用道具
Fuller 管理员 发表于 2021-5-5 16:45:32 | 显示全部楼层
根据正面词、负面词、程度词、否定词出现的数量打分
举报 使用道具
cathy202003 初级会员 发表于 2021-9-3 23:45:32 | 显示全部楼层
Fuller 发表于 2021-5-5 16:45
根据正面词、负面词、程度词、否定词出现的数量打分

请问,我正面词有7个,程度词有1一个,正面句子有3个,为啥正面得分是14?
image.png
举报 使用道具
Fuller 管理员 发表于 2021-9-4 09:19:08 | 显示全部楼层
cathy202003 发表于 2021-9-3 23:45
请问,我正面词有7个,程度词有1一个,正面句子有3个,为啥正面得分是14?

...

情感分析以后可以导出两张表:1,句子表;2,文章表

一篇文章的总得分是句子得分的和,我看你这个表像是文章表,那么为什么总分是14,要看每个句子表得分是多少
举报 使用道具
pitiwai 新手上路 发表于 2021-12-29 22:48:27 | 显示全部楼层
Fuller 发表于 2021-9-4 09:19
情感分析以后可以导出两张表:1,句子表;2,文章表

一篇文章的总得分是句子得分的和,我看你这个表像是 ...

您好,情感分析中正面得分和负面得分的具体计算公式是什么呀
举报 使用道具
Fuller 管理员 发表于 2021-12-29 23:28:55 | 显示全部楼层
pitiwai 发表于 2021-12-29 22:48
您好,情感分析中正面得分和负面得分的具体计算公式是什么呀

在词典中,正面词的分数是正值,负面词的分数是负值,程度词的分数相当于对得分乘以一个倍数,否定词能把一个句子的得分值取反。
每个句子的评分 = (正面词得分 + 负面词得分) * 程度词的分数,如果含有否定词,那么就把得分取反。


整个正文的得分就是每个句子得分的和
举报 使用道具
qianqing0930 新手上路 发表于 2022-5-11 23:32:14 | 显示全部楼层
Fuller 发表于 2021-12-29 23:28
在词典中,正面词的分数是正值,负面词的分数是负值,程度词的分数相当于对得分乘以一个倍数,否定词能把 ...

请问一个句子中如果出现了多个程度词,且程度词的赋值不同,那按照这个公式,程度词的分值是多个数值之和还是取最高的那个分值?
举报 使用道具
Fuller 管理员 发表于 2022-5-11 23:34:41 | 显示全部楼层
qianqing0930 发表于 2022-5-11 23:32
请问一个句子中如果出现了多个程度词,且程度词的赋值不同,那按照这个公式,程度词的分值是多个数值之和 ...

如果出现多个程度词,就会计算多次。程度词用来把结果放大一些倍数的,多个程度词就会一个接一个进行放大
举报 使用道具
qianqing0930 新手上路 发表于 2022-5-11 23:49:19 | 显示全部楼层
Fuller 发表于 2022-5-11 23:34
如果出现多个程度词,就会计算多次。程度词用来把结果放大一些倍数的,多个程度词就会一个接一个进行放大 ...

image.png

我这里还有两个问题要咨询您一下:

请您看一下“跳伞没有蹦极可怕”这句话,就一句话,我的正负面词赋值是+-1,“极”赋值4,“可”赋值3,否定词赋值-1,

①但是得分却是-3,等于两个程度词只检索到了一个,而且只是情感词前后的一个,请问这是算法就这么设置的吗?还是常规失误?(因为我发现有很多赋值都是这种情况)
②另外,我有一个负面情感词,一个程度词,按所说的规则一个程度词难道不应该情感取反,也就是-(-1)就是1吗,为什么结果是负数?

麻烦您了~
举报 使用道具
Fuller 管理员 发表于 2022-5-12 09:04:40 | 显示全部楼层
qianqing0930 发表于 2022-5-11 23:49
我这里还有两个问题要咨询您一下:

请您看一下“跳伞没有蹦极可怕”这句话,就一句话,我的正负面词赋 ...

我单独测试 跳伞没有蹦极可怕 这一个句子,我得到的结果竟然跟你的不一样,你加了自己的情感词吗?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 07:03