2020-11-13 16:35:30 阅读(178)
1、在纸媒时代,消费者在获取信息和内容方面处于非常被动和稀缺的状态。虽然报纸和杂志是“千人一面”,但很多人还是放不下,看了又看。随着互联网时代(尤其是移动互联网)的到来,信息呈现出“信息爆炸”的状态,就像“三体”中的“技术爆炸”概念一样。互联网的每一个角落都诞生了以EB为单位的每日信息量,预计2025年全球每日产生的数据量将达到491EB(1EB=1024PB=1048576TB)。在这种情况下,消费者对获取信息变得更加积极和丰富——但丰富并不意味着有效。纸媒时代也有专业的编辑筛选内容,排版后“分发”给消费者。但对于互联网产品来说,即使内容丰富,用户也不感兴趣。要知道“效率”是商业社会的本质之一。低效意味着随时可能落后或被淘汰。为了解决这个问题,淘宝首先在2013年提出了“千人千面”的概念。依托淘宝十年发展积累的庞大数据库,从细分类别中抓取与买家兴趣相匹配的商品,优先展示。每个在淘宝网上购买或浏览商品的消费者都会被平台贴上标签,如年龄、地区、客户单价、收藏偏好等。不同的标签,用户在千人千面模式下看到的产品会有所不同。更有效的内容分发方式,从野蛮成长到精细操作的时代。在以“算法驱动”为核心的张一鸣手中,今日头条、抖音等产品是在“算法驱动”理念下饲养的洪水猛兽。如今,算法分发几乎是所有搜索引擎、浏览器、信息软件、内容社区、社交软件等产品的标准配置。例如,在阿里巴巴内容运营专家的社会招聘岗位上,需要联动内容制作和算法上下游进行相应的战略实施:运营专家的水平基本上从P7开始,年薪为50W:因此,作为一名运营商,即使你不需要写编程算法,了解相关算法知识和相关推荐机制背后的原则是成长和进步道路上必须点亮的技能点之一。2、算法推荐系统的两个核心:内容标签和用户标签算法的原理本质上可以用一句白话来解释:让喜欢看女孩的用户看到包含女孩的内容。但在现实环境中,纵观互联网,很少有公司能把这句话做好。为什么抖音如此上瘾?很多人可能会有这样的经历:在不同的场景下(在家、地铁、公司)、即使是同类型的内容(如电影),在不同的时间点(早上、中午、晚上)实际上收到的内容也略有不同。比如白天大部分都会收到幽默的内容,晚上会收到略带悬念的影视剪辑片段等。;无论何时打开抖音,用户都可以沉浸其中,似乎感觉不到时间的流逝,往往一两个小时就能突然过去。你会发现抖音似乎很了解你,因为你喜欢看所有的内容。除了抖音的产品设计、身临其境的消费体验、短而快的内容节奏外,它还涉及算法推荐机制和操作策略。2.标记内容真的那么简单吗?很难定义标签,也很难标记内容。在给内容贴上标签之前,首先要做的就是定义标签。也就是说,说清楚苹果是什么,而不是叫苹果梨。一个内容通常包括几个层次:一级分类、二级分类、三级分类和标签。如动漫>日漫>火影忍者>鸣人更容易定义这些具有普遍认知的分类和标签。但对于搞笑、美女这样的标签,通常因人而异,因为每个人的笑点不同,审美观也不同。到底什么内容才算好笑,多美才算美女?萝卜和蔬菜各有所爱。在标记开始之前,它们首先被卡在定义上。事实上,它们涉及两个概念——物理标签和语义标签:1)物理标签广州是广州,上海是上海;马云是马云,淘宝是淘宝。它们都是确定的实体,通常不会对不同的人产生太大的歧义。2)沙雕、美女、奇葩等语义标签没有明确的指定对象,不同的人会有不同的认知。因此,语义标签的定义通常会出现标记困难。语义标签的推荐效果是测试公司NLP(自然语言处理)技术水平的试金石。根据不同公司的业务能力或业务需求,对标签粒度的要求也有所不同。例如,一些公司不拆除火影忍者,直接将这个词作为最小粒度的标签;所有涉及动画的内容都可以贴上“火影忍者”的标签,但不可避免地会有一种一刀切的感觉,这也会对后续的操作产生影响。例如,一些用户想看或搜索“火影忍者”。结果,所有的“火影忍者”都被推送和搜索;一些公司继续拆除:火影忍者>鸣人、佐助、樱花等实体标签。所以可以看出,标签粒度越细,推荐内容越准确,需要投入的资源越多。OK,即使整个公司的招标团队被拉进会议室,通过统一的培训和解释,一个月后,我们终于对什么是沙雕和什么是美有了统一的认识,审美也逐渐相同。那么打标能顺利进行吗?NO!让我们慢慢喝口水,然后继续说话。(3)用户标签:可能是最难的部分。1.用户的口味就像一个比内容标签更难哄的女朋友,因为火影忍者就是火影忍者,一旦贴上这个内容标签,就不会成为海盗王。内容标签可以手工标记 进行机器训练。不同的用户,也许这个月他喜欢看火影忍者,算法推荐机制也为他匹配了相关内容。但下个月,由于朋友和同事的推荐,他可能会开始阅读《海盗王》。如果算法没有反应,他将继续向他推送火影忍者的相关内容。此时,这些内容对他来说是无效的,从而影响了内容的分发效率。例如,胡萝卜一直是胡萝卜,但用户的口味一直在变化。今天想喝汤,明天想吃肉。事实上,如果你不小心点击了几篇文章,算法默认你喜欢这类内容,然后你一直在推送相关信息,不能根据用户的口味变化灵活更改。虽然在这个时代,无论使用哪种内容产品,“信息茧”现象都是不可避免的,但成熟的NLP技术和初级技术之间的实际产品体验效果仍然非常不同。2.掌握用户的基本信息。在制作用户标签之前,您需要掌握与用户相关的信息,通常包括性别、年龄、地点、兴趣偏好等:性别有助于分发明显的性别属性:如向男孩推动运动,向女孩推动美容和皮肤护理;同样的年龄:向年轻人推动动画、游戏和其他内容,向老年人推送健康和保健信息;该地点用于推送与区域热点相关的信息:例如,向上海用户推送上海紧急新闻和北京限制似乎对广州用户影响不大。以上三种信息通常可以通过用户自动填写和授权访问位置信息获得,不会有太大变化。以上三种信息通常可以通过用户自动填写和授权访问位置信息获得,不会有太大变化。对于用户的兴趣偏好,如上所述,这是制作用户标签的困难。获取用户兴趣偏好的方式是根据用户消费的内容匹配相应的标签,通常采用以下方式定位:过滤噪声:如果用户被标题派对内容吸引,但停留时间过长,用户对内容绑定的标签不感兴趣,过滤标题派对;热点减少:对于一些社会热点,紧急新闻(如明星欺骗),虽然用户在短时间内浏览相关信息,然而,这并不意味着用户必须对“娱乐”内容特别感兴趣,需要减少用户的“娱乐”兴趣偏好;时间衰减:如上所述,用户的兴趣会发生偏差,因此推送策略需要更倾向于新的用户行为;惩罚显示:如果不点击推荐给用户的文章,则内容的相关特征(如内容分类和标签)权重将降低。比如新注册用户(女,28岁,上海)在刷抖音的时候会用A-A、A-测试B的方法。比如新注册用户(女,28岁,上海)在刷抖音的时候会用A-A、A-测试B的方法。首先,连续推送两个影视剪辑内容(A-A),用户观看完整,有点赞、评论等操作;其次,推送影视剪辑后,推送母婴内容;(A-B),用户只看电影和电视剪辑内容,却划掉了母婴内容。这说明用户对“影视剪辑”内容的兴趣偏好较高,对“母婴”标签内容的兴趣偏好较低。3.我们都知道,对于综合平台,通常有不止一种内容。今天的头条新闻包括几种不同形式的内容,如长图形、小视频、短视频、问答和微标题。即使是同一个标签,比如“美女”,不同内容类型的推荐权重是否相同?还是给经常看小视频的用户推送相关内容?这也是算法推荐机制需要考虑的问题。不同的产品形式对内容类型有不同的推荐权重。例如,B站主页上短视频的推荐权重通常高于小视频。三、如何衡量推荐系统内容推荐的准确性,通常可以直接从数据上进行分析。CTR(点击率)、“可量化指标”,如Y消费时间、喜欢、评论、转发等。=F(X1、X2、X3)由于产品差异,评论数的影响权重通常大于赞扬权重,不同平台对参数的权重设置也不同。不同的用户即使赞同一个内容,也会因为账号的“可信度”而对内容产生不同的影响:比如知乎大V赞和普通账号赞明显不一样。但有时数据也有缺陷,如粗俗、标题派对、黄色内容,如果时间吸引了大量用户点击浏览,那么算法能判断它是好内容,增加推送量吗?——答案显然是否定的。通常需要压制降权的内容主要有以下几种:广告、低质量处理内容压制;黄色、粗俗、恶心的内容压制;标题党、低质量账户内容降权等。因此,基于社会责任感、政策法规等因素,有必要抑制和减少这部分内容的权利,并插入关键时事新闻。例如,当你打开新闻应用程序时,你会看到习大的相关文章。这些都是算法无法独立完成的,需要操作配合。很多信息平台都会有专门的主页运营团队人工干预内容。很多APP日常通知栏PUSH的内容也采用算法 人工推送。四、总结回到开头说:让喜欢看姐姐的用户看到包含姐姐的内容。这句话如此简单,要实现它,我们需要做到:1。内容标签的准确定义和标记,因为不同的人会对同一语义标签有不同的理解。2.准确匹配用户标签,清楚用户对哪种“女孩”更感兴趣:长发女孩?还是短发女孩?是双眼皮?还是单眼皮?南方人或北方人等粒度较细的拆分。用户标签是基于内容标签足够准确的前提条件,一步一步错误。若内容标签无法准确判断,则基于内容标签的用户标签也是不可信的。3.算法训练要想训练机器自动打标,通常需要几周的时间来训练一个“标签”。内容标签通常是通过抓取标题关键词来标记的,但有时标题与文章或视频中表达的所有内容都有很大的不同。因此,标签可能不准确,需要手动审查以确定其准确性。4.即使内容标签和用户标签都准确,算法训练也足够牛X,内容是否足够?这是另一种灵魂折磨。比如很多用户喜欢看“长发、双眼皮、南方女生”的相关内容,但是“内容库”里这种类型的内容并不多,推了几个就开始反复推,用户看腻了。此时,操作策略需要配合算法进行相应的调整和内容介绍和扩展。光看上面这些就已经让人头大了,但还没有结束:谁是上游相应的内容制作人?满足供应需要生产多少内容?新内容对其他类别的现有内容有什么影响?不同层次的内容创作者应该如何分享利润?以及如何优化生产、仓储、审核、标记、分发各个环节的内容损坏?这些都是运营商在实际工作中需要不断探索和探索的问题。
以上就是关于是否了解算法推荐系统的两个核心,决定运营人的月薪的相关介绍,更多是否了解算法推荐系统的两个核心,决定运营人的月薪相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对是否了解算法推荐系统的两个核心,决定运营人的月薪有更深的了解和认识。
推荐阅读
最新文章
猜你喜欢以下内容:
一 客户顾问-张三 一