随着社会的发展,社会的戾气越来越重。所谓戾气,就是一种暴戾之气,戾气重的人,比较偏激,凡事喜欢走极端。而戾气很重者,大部分都喜欢在网络上发泄自己的情绪,这就导致不少人戾气重的人,随意在网上发布辱骂性话语,更有甚者还对他人进行攻击。对于这种情况,内容平台应该加强对这些辱骂文本的识别,并及时处理,要不很容易造成很严重的后果。比如很多暴力事件的发生,都有戾气以及网上辱骂的一些影子,针对这种情况,很多互联网产品都采取了辱骂文本识别?那么如今的辱骂文本识别是靠人工还是靠机器呢?下面匠数科技就为大家简单讲述一下。
前期的很多互联网企业针对其产品中的内容互动区以及内容区,一般采用的是人工审核方式。后来随着发展,内容量的不断加大,这时采取人工审核的方式,成本越来越高,这时很多互联网企业开始采用机器审核的方式,但是机器审核方式,虽然速度快,但准确率不高。在这种情况下,很多互联网企业开始采用人机模式进行审核。因此,目前主流的辱骂文本识别为人机识别方式。
在辱骂文本人机识别方式中,首先用户发布内容后,机器对其内容进行审核,并过滤出大部分正常内容和非正常内容,剩下的则交给人工进行复审,这样的方式不仅可以大大提高识别效率,还能极大地降低人工成本。在辱骂文本识别中,机器主要识别主要是通过规则和算法来进行识别,其中在机器系统中,我们设置好所有过滤文本的关键词,当用户发布含有系统中的关键词,系统直接对其拦截,从而保证互联网企业的产品可以健康有序地发展。
写在最后,辱骂文本的识别系统也迎来了挑战。现在网民开始通过字体拆分、特殊符号混淆等方式,绕过系统识别,从而发布自己的辱骂信息,这时就要求辱骂文本系统进行不断学习以及完善,从而可以更好地识别辱骂文本,从而服务与互联网企业的产品。