没有找到合适的产品?
联系客服协助选型:023-68661681
提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
转帖|行业资讯|编辑:龚雪|2017-02-16 10:21:00.000|阅读 194 次
概述:每天在网上看见无脑喷和低级黑是否极大影响了你的心情?维基百科与谷歌正联手开发新的黑科技,还你一个干净的网络环境。
# 界面/图表报表/文档/IDE等千款热门软控件火热销售中 >>
最近,来自维基百科和谷歌的 IT 专家,公布了把 AI 用于“节制”维基百科用户评论的成果——找出哪些用户在搞人身攻击,还有他们为什么要在网上骂街。针对该问题,研究人员开发机器学习算法,分析维基百科在 2015 年收到的的海量评论。这一年,维基百科讨论页面共收到 6300 万条评论。这些评论存在的本意,是讨论如何改进维基百科收录的各条文章。
这些算法使用 10 万条包含侮辱性言辞的评论以进行训练,当然,这样的样本规模只能算是偏小的。起初,十名人类员工对这些评论进行分类,以明确用户评论中都出现了哪些人身攻击语言方式。举个例子,该机器学习算法能区别直接人身攻击(比如“你是个XX”),第三方人身攻击(张三是个XX),以及间接人身攻击(“张三说李四是XX”)
研究成果以论文形式发表出来,题目为'Ex Machina: Personal Attacks Seen at Scale'(Ex Machina:大规模人身攻击)。该论文将在四月份澳大利亚珀斯举行的的世界互联网大会上展出。
34 名用户“贡献”了 9% 的网上谩骂
横坐标轴:总发帖数;竖轴:侮辱性言论比值;黑色:匿名用户;蓝色:注册用户
如上图,匿名用户发布人身攻击言论的概率,比注册用户高六倍。但发表最多侮辱性言论的,却是一小撮活跃注册用户。
该分析表明,维基百科 43% 的发表言论来自匿名用户。这些人中的绝大部分并不经常发帖,有的就只发过一次。但平均发表脏话概率比注册用户高六倍。但据雷锋网了解,维基百科注册用户比匿名评论用户多 20 倍,意味着超过半数的人身攻击言论仍是注册用户发表的。
研究人员发现,大多数情况下用户言论是得体的。80% 的人身攻击来自于 9000 多名用户,而这一群体发侮辱性帖子的平均次数少于五次。意味着大多数人只在被激怒后,才开始在网上骂街。
但是,有一个包含 34 名活跃用户的小群体。研究人员对该群体的打分是“危害指数超过 20”。这 34 个人竟然贡献了维基百科全部侮辱性言论的近十分之一,准确来说,是 9%。
很明显,这些人就是网络世界里所谓的“骂街党”——那些喜欢上网和人骂战,把人身攻击作为日常宣泄、娱乐活动的人。现在的好消息是,新的机器学习算法使得维基百科在用户群中找出这些人变得更加容易,然后只需要把这几个人的账户封掉,就能一下子减少论坛上 9% 的恶意言论。太划算了,是不是?这意味着偶尔发表人身攻击言论的普通用户不必被封号——大多数只在和人吵起来之后才开骂。这还意味着,维基百科不需要像拉网一样把全部评论筛一遍,用机器学习检测侮辱性言辞,而只需把精力放在管理这些极少数的骂街党上。
论坛维护:人+AI
网上骂战,有时像野火一样被瞬时点着。正因如此,相比能自动决定该屏蔽哪个论坛用户的计算机程序,有时候人类管理员更有用。
论文作者们在结论中说道:
“这些结果说明,围绕着人身攻击行为的一系列问题并不好解决。但我们的研究证实,目前只有不到五分之一的人身攻击行为,会触发维基百科违规程序。”
未来,AI 大概会在网站评论管理中起到越来越大的作用。研究人员指出,能自动筛选评论的系统可发挥极大的辅助作用——人类管理员能更清晰地把握用户谈话的健康状况,并可以更快得发现“有毒”评论内容,在引发更多用户反感之前采取措施。(稿源:雷锋网)
更多行业资讯,更新鲜的技术动态,尽在慧都学院。
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@evget.com
在 Python 中读取 PDF 文档是实现文档自动化、内容分析和数据提取的基础操作之一。本文将介绍如何使用 Spire.PDF for Python 实现用 Python 读取 PDF 文档。该库提供简单易用、功能强大的API,无需依赖第三方工具。
持续测试平台Parasoft CTP通过一键克隆、自动配置和独立沙箱等功能,快速构建稳定一致的测试环境,自动适配虚拟资产,安全隔离高风险测试,高效解决传统测试环境搭建难题。
在Aspose.Words for .NET 25.6版本中,引入了一项新功能,允许您将多页文档导出为单个光栅图像。当您需要将文档作为单个可视文件共享或显示时,此功能非常有用。
Parasoft Insure++将代码覆盖率转化为可操作的洞察见解,让开发者能够有针对性地填补测试空白并优化执行效率,从而确保代码的每一个关键环节都经过严格验证。借助Insure++,团队能够从根本上提升软件的质量与可靠性,真正实现“代码测试无死角”。
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@evget.com
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢
慧都科技 版权所有 Copyright 2003-
2025 渝ICP备12000582号-13 渝公网安备
50010702500608号