万益资讯网

世界上神马研究都有 有研究网评用的暗语的项目了github.com/Crowd-

世界上神马研究都有 有研究网评用的暗语的项目了github.com/Crowd-AI-Lab/CodedLang

作者收集并整理了一个名为 CODEDLANG 的数据集,包含 7,744 条中文 Google Maps 评论,其中 900 条含有暗语。他们还总结出七类常见暗语方式,例如谐音、表情替代、字形替代、跨语言发音等。

即使是比较强的语言模型,也经常不能准确识别这些暗语,更难理解它们真正表达的态度。论文还发现,含暗语的评论更常出现在较低评分中,也就是说,暗语常被用来委婉或隐蔽地表达不满。

AI创造营