天才一秒记住【倩玉小说网】地址:https://m.qianyuwj.com
首发:~第111章 系统改造
接着想到议论自己的可都是素质极高的大学生,个人素质过硬,这要是能凭自己现在的校内名气给请来帮自己分担一些hao123的人工审核工作,自己可能就不用天天担心对hao123的精力投入不足,有一天会被竞争对手干掉了。
而想到这种多人分担工作任务的情景,陆道升立马回想起前世出现的一种人工标注平台的业务模式(比如appen)。
在大数据时代,为了使一些机器学习算法取得良好的效果,就需要大量的样本数据供算法进行模型训练。但有时候搜集不到那么多的有效样本数据,就需要人工进行诸如文章分类、图片标注等工作,来人力产生足够多的样本数据。
也有一些靠机器学习算法解决不了的问题,比如色情图片,恶意评论等等,也需要人力审核来进行捕获。
以上这些事情,大大小小的互联网公司都有需求,但是绝大多数公司都不会亲自雇人来做这个事情,而是会转交给专门从事标注工作的第三方公司来完成。
标注工作在参与人员上也有讲究,那就是不能人员数量太少且固定。如果就是雇佣几十上百个人,然后去标注百千万的数据,那么很可能会出现认知偏见。最好是能有更多的不相关的人来参与标注,这样累积出来的数据才不会出现明显的偏向性,才能让机器学习算法训练出适用性最强的预估模型。
为此,这些标注公司演化出了一种分派式的业务模式。
即先从需要对数据进行标注的公司那里获取待标注的数据合集,然后将数据合集分割成一个个数量很少适用于单人的问卷,再将这些问卷通过自己构建的平台分发给平台上的答题人。
一份问卷会多次分配给不同的答题人,以降低回答结果因为个人偏见而离实际太远的概率。
这些答题人可能是在校学生、可能是家庭主妇、可能是待业青年、可能是公司白领等等等等,总之只要在平台上注册了答题人账户,且通过了一些很基本的测试,就可以获取分派的标注问卷,通过回答问卷来获取一定的金钱报酬。
虽说这种在大数据时代兴起的标注平台需要互联网普及带来的上网便利,加上电子支付的发展带来的支付便利,此时不能直接照搬,但是这种思想还是可以借鉴的。
hao123的日常维护工作并没什么特别的技术含量,主要就是耗时耗力,完全可以采取类似的方案进行工作切分和派发。
不仅能解放自己,更重要的是可以集众人之偏好综合评断,就算出现李兴平这样对用户需求具备深刻洞察的竞争者,在陆道升这种直接聆听大众用户反馈的方法面前,也占不到太多便宜了。
系统开发暂告一段落,陆道升给芮青打了通电话告知行程后,收拾好行装就坐上火车开始一路向北。
火车上,陆道升皱着眉头回想着和芮青的通话。
电话是拨给芮青在北京的住处,也就是自己帮芮青找的地方。
只是在互道再见准备放下电话时,陆道升似乎还听到了另一个女人的声音。
……
史提芬T提示您:看后求收藏(倩玉小说网https://m.qianyuwj.com),接着再看更方便。