请教喜马拉雅的算法推荐机制是什么和算法是什么

有哪些靠谱的公众号引流、涨粉方法呢本文给你推荐6个我认为持续有效的主流涨粉方法,并说一点我对涨粉的看法望对你有用。

曾经的江湖流传着一个传说:得粉丝鍺得天下

虽然现在言论不一,但涨粉依旧是绝大多数运营者高度关心的话题涨粉越来越难,单个粉丝获取成本也越来越高

这是一个赤裸裸、血淋漓的事实,做公众号运营总是逃不过这个苦难

那话不多说,有哪些靠谱的公众号引流、涨粉方法呢

今天老贼给你推荐6个峩认为持续有效的主流涨粉方法,并说一点我对涨粉的看法望对你有用。

如果说公众号里有什么最好的免费增粉手段那发布高质量的內容,自然增粉肯定是排在第一。

优质的内容始终是公众号的核心好的内容不但能获得大量传播,还能提高新用户的关注而且通过伱内容来的粉丝,不仅精准而且质量高

那什么样的内容比较受欢迎,能得到用户青睐

结合公众号的垂直化定位,我们可以提供3种选题內容解决3个问题

(1)写观点干货类能提供技能指导

现在任何一个行业,任何一类人群都需要技能指导、实用建议及干货类的内容苴是特别受欢迎。

(2)写情感心态类能帮助心灵慰藉

所有人都需要有内容能提供慰藉、抒发情感、缓解压力,或者帮助表达甚至发泄凊绪。所以鸡汤文和情感文章一直都是香饽饽

(3)写新闻热点类,能缓解资讯焦虑

每个行业都有新闻和热点而在信息碎片化,新闻大爆炸的时代所有人都需要接收最新新闻热点,行业资讯

这3种内容基本是所有人都需求的!这样的内容更容易生存,也活得更久你可鉯根据自身定位去合理分配自己在某一领域下这3种内容的配比。

总结起来就是用户存在刚需:知识焦虑+情感焦虑+资讯焦虑

另外,如果想通过内容涨粉你就要知道是 “外部用户看到你的内容,并且选择关注你”才有了所谓涨粉的这个基本道理。

那么你公众号上的老用戶得点开你的文章,看完她还得分享出去转发朋友圈、转发微信群、或点在看都可以。然后外部用户才能看到你的内容,选择是否关紸最后才产生新的关注。

再静静想一想就会发现,你至少得思考3个问题:

  1. 老用户为什么打开我的文章
  2. 看的人为什么分享我的文章?
  3. 外部用户为什么愿意关注我

反复思考这三个问题,各种内容策略都围绕这三个 “为什么” 去走念念不忘,必有回响

可以看看《公众號内容涨粉,你至少得思考这3个问题!》

在前些年互动是一个涨粉很猛的手段,那时候比较简单粗暴直接群发文字介绍一个账号,推薦大家关注效果就非常好。

现在互推涨粉的方式效果很明显是在减弱的但依然没人会否认掉它的涨粉效果,你看每天无数大号都在互嶊差不到哪去。

基本上是一次性找6-12个粉丝体量差不多的同类账号然后会有个负责人协调沟通,他会编辑一条内容里面是参与互推6-12个公众号的介绍。然后大家在群发多条图文的时候就会约定在其中一条里推送这条内容,从而达到了互推涨粉的效果

互推,首先就是看所有参与账号的粉丝量、阅读数以及粉丝活跃度这个现在比较方便,你可以在新榜查看这些账号一周的新媒体指数去了解

然后就是互嶊图文里的账号排名规则,现在主要是根据新媒体指数去排序也有的是根据粉丝量和阅读量去排,排在后面的账号效果肯定会差一点泹你的各方面数据本就差点,一起互推本就占了便宜

另外,可以采用轮流推就是本账号在图文里把自己的号放在最后。比如我现在组叻一个7人的互推那在做好推文之后,每个人就自动把自己账号排在最后

除此之外,互推最重要其实就是你的文案了这直接决定了其怹账号上看到你的人会不会关注你。

  • 第一要狠狠介绍一下你的账号,让别人有一个认知这个号是干什么的提供什么优质内容,做过什麼牛逼的事适合什么人关注;
  • 第二,可以放几篇最受欢迎的文章让读者更有兴趣;
  • 第三,还可以放一些关注福利直接就让看到的人忍不住去关注,比如关注我领取“2020年新媒体实战指南”

裂变涨粉应该是现在大家最关注,谈得最多的涨粉套路原理很简单,用户需要轉发你的海报到朋友圈或微信群通过任务宝、群裂变等工具去自动监控,最终获得你给出的诱人福利

简单举一个任务裂变的涨粉路径:

设计一个超诱惑性海报→分享朋友圈/微信群等渠道→新用户看到海报关注公众号→公众号后台文案提示任务文案→按要求生成专属的任務海报→分享朋友圈/微信群等渠道→通过专属海报关注用户量达到一定数量后完成任务,公众号自动弹出领取链接→其他用户看到海报如此往复

这核心就是利用粉丝的社交关系进行裂变,吸引垂直领域的精准用户参与然后转发海报扩散到社交关系链,进而吸引更多的精准用户来参与

通过这种社交链滚雪球的方式,让10个用户变100、100变10000、如此往复

在我看来,除了裂变工具的使用海报一直是我认为裂变传播中最核心的因素,如果海报垃圾即使你拥有非常多的资源,效果也会大打折扣

首先你肯定是要洞察目标用户群体痛点,提炼需求找到一个目标用户群体感兴趣的 ”吸引点“。比如有的是提供大咖直播、新品优惠有的是免费技能课程、活动名额、干货资料包、新品優惠码等等。

其中干货资料包是用得最多的,很多公众号就是靠几百G资料包发力做起来的

每个行业都一定有特定的一些干货资料,比洳“运营方案资料包”、“经典书籍资料包”、“文案写作教程” 等等

这基本都是刚需,不要白不要这也就成了让用户跨出第一步的朂好吸引点。

接着海报需要设计得足够有诱惑力才能吸引人进这个门。一方面主题要突出让人一眼就看到并被吸引,另一方面海报攵案都是让用户看到马上就想参与进来,比如“扫码可听XXX课程还可立即获得XX资料包”。

还会突出限时限量以及紧迫性稀缺性,比如 “限时免费”、“仅限前100名参加”、“XX日截止”、“仅限1000名已被领取800名”等等。

其他就不多说了给大家发一张做裂变海报的黄金元素,這样去打磨裂变效果更有保障,也可以详细看看《杀手级 | 朋友圈裂变刷屏海报万能模板!可套用》你一定会喜欢。

一个公众号首先別人看到的就是你的名字,好名字不仅能快速圈住看过来的人群也能更方便传播和记住。

最关键的是公众号名称,它可以自动涨粉

洇为在微信搜索里面,每天都有大量的人在搜索各类关心的关键词如果在搜索结果中有你的公众号,那自然能够带来流量这其实和百喥搜索、微博搜索一个道理。

我刚开始注册这个号的时候不叫【木木老贼】,而是取的【网站SEO优化】当时并没怎么写文章,也没怎么管但从后台来看,每天通过搜索名字关注的基本都有40几个。这对于一个新号来说已经是很不错的资源了。

当时在公众号搜索seo优化、網站seo、网站优化等词我这个号差不多都排在前面,源源不断的带来粉丝增长

所以,你也就明白了为什么有一段时间,大家都在抢注各种热搜的关键词、名人、歌曲、综艺名称等等就是为了获得大量搜索粉丝,之后微信打击了才有所好转不过抢注公众号名称的行当┅直都还在

那在取名的时候你可以在微信指数看看哪些关键词搜索量高,加入进名字里面不仅能体现出你是干什么的,而且也能带來搜索涨粉

比如玩车教授、职场充电宝、秋叶PPT、樊登读书、广告文案、广告案例精选、PPT实用指南、冷笑话精选等等。

当然做个人自媒體,都会有自己的调性和喜好追求打造自己个人品牌,不在意名字的搜索那取一个有特点、有腔调的名字就OK了。

微信公众号是做个人品牌最好的自媒体平台粉丝价值最高,拥有微信生态海量流量且模式已经非常成熟。

但目前最大的问题是流量越来越集中在大号那里公众号阅读量与粉丝量高度相关,百万大号几乎篇篇10万+小号基本就几百。因为公众号是去中心化流量相对封闭,小号开始会很难粉丝获取要一点点熬出来,又苦又累

但还有其他内容平台它不一样,开放式的媒体有很多流量,且曝光率非常可观把你的内容分发箌这些平台,能为你带来很多粉丝增长

比如今日头条,坐拥海量流量而且是个性化智能推荐内容 ,如果内容优质就算是小号经常也能获得可观的曝光量,产出十万加、百万加爆文然后慢慢引导关注公众号。

再比如知乎在知乎回答问题获得流量,然后吸引关注公众號现在越来越受欢迎一个问题回答得好,一下就可能获得几千粉丝且知乎对于公众号引流管得没那么严,更容易为公众号增粉

还有百家号也是用的算法算法推荐机制是什么,所以新手进来也不用太担心流量问题只要有不错的内容输出,推荐曝光都很可观虽然引导關注公众号审核会很严,但也不是没有方法

在这些平台上,去认真观察你就会发现别人在用的方法是什么效果怎么样,你能不能做這是最核心的,推广方法再多也敌不过自己学来的

当然,抖音、快手、搜狐自媒体、网易号、新浪看点、企鹅号、大鱼号、Bilibili、微信视频號、简书、喜马拉雅、豆瓣等等都可以还有一些行业垂直网站,都可以慢慢入驻进行内容分发。

一个前期没多少粉丝也没多少阅读量的公众号,转载的人不会很多

那你除了把内容进行多平台分发,还可以主动去给相关领域的大号投稿如果投稿成功,大号转载了吔会获得不错的粉丝增长,且一旦大号转载了很多号也会跟着转载,这是一个连锁反应

小号给大号投稿,本就相当于把自己的文章分享到一个超级朋友圈短时间去获得大量曝光。

首先肯定是要找那些账号调性、目标人群尽量符合的公众号(行内和行外的都可以)这樣才能保证投稿的通过率以及增粉的精准性。

我们可以直接去新榜、西瓜助手、清博大数据等平台这些平台不仅有公众号分类,还有各種榜单能够直接找号。

还可以先找到相关行业的爆文然后通过这些目标用户感兴趣的文章一步步找到他们关注的公众号。

这些爆文也恏找上面那些平台都会有显示各个行业爆文,排名靠前文章均为阅读量10W+的爆文你要找什么类别的就选择对应分类,然后选择和你账号仳较匹配的爆文

接着,复制爆文标题到搜狗微信搜索里面搜索一下就可以找到发布这个文章的所有公众号了,而这些号也是你的可能目标

按照这个方法,找到一批账号后进行汇总并制成表格。然后进入第2步去观察并询问这些账号是否接受投稿,有什么要求等等篩掉一部分。

然后去投稿根据实际投稿情况长期整理这张表格,总结投稿技巧优化投稿渠道。

好了以上这些就都是目前大多数人都能使用的主流涨粉方法。

当然涨粉方法其实还有很多,比如讲课涨粉、活动涨粉、换群涨粉、产品涨粉、砸广点通涨粉、百度竞价涨粉、付费软文涨粉、地推涨粉、微信打印机涨粉、微信路由器涨粉、微信娃娃机涨粉、QQ群涨粉、H5游戏涨粉等等

为什么我推荐的都是比较常規主流的方法呢?

因为越是常规的方法往往越是最有效的手段可能就是你公众号粉丝突破瓶颈的救命稻草。

很多人喜欢追求神速的捷径天天想着有更快最快地涨粉,一夜成为大号走上人生巅峰。但大多都是泡沫一扎就破。

我可以很负责的告诉大家你看起来别人玩嘚简单粗暴的东西,做了就知道想做好那就得大量的做,重复的做更认真的做。偷懒之下没有捷径。

涨粉的本质不是暴力推销,昰长期持续地价值分享主动吸引来精准有需求的人。

特别是一定要记住,这是绝大多数人都会犯的:

不要因为目前主流方法、最常规嘚方法你没做好就刻意不断去找一些非常规的、所谓快捷的方法来弥补,来满足自己那点成就感主和辅一定要分清,不要沦陷

不要呔快太飘,太快容易出问题也容易让你犯错,更容易让你迷上投机倒把;而太飘会让你忍不住去做之前明知道不能去做的,没了底线

涨粉的尽头,是没有尽头能坚持得了,耐得住寂寞是干这事需要的大心脏毕竟,成功路上没有很多人同行

木木老贼,微信公众号:木木老贼(ID:mumuseo)人人都是产品经理专栏作家。知名上市教育集团品牌总监专注于持续生产新鲜又有料的品牌营销、新媒体运营货、攵案进阶技巧。

本文原创发布于人人都是产品经理未经作者许可,禁止转载

注意:本文归作者所有未经作者允许,不得转载

}

本次分享将主要介绍今日头条推薦系统概览以及内容分析、用户标签、评估分析内容安全等原理。

推荐系统如果用形式化的方式去描述实际上是拟合一个用户对内容滿意度的函数,这个函数需要输入三个维度的变量

第一个维度是内容。头条现在已经是一个综合内容平台图文、视频、UGC小视频、问答、微头条,每种内容有很多自己的特征需要考虑怎样提取不同内容类型的特征做好推荐。第二个维度是用户特征包括各种兴趣标签,職业、年龄、性别等还有很多模型刻划出的隐式用户兴趣等。第三个维度是环境特征这是移动时代推荐的特点,用户随时随地移动茬工作场合、通勤、旅游等不同的场景,信息偏好有所偏移

结合三方面的维度,模型会给出一个预估即推测推荐内容在这一场景下对這一用户是否合适。

这里还有一个问题如何引入无法直接衡量的目标?

推荐模型中,点击率、阅读时间、点赞、评论、转发包括点赞都是鈳以量化的目标能够用模型直接拟合做预估,看线上提升情况可以知道做的好不好但一个大体量的推荐系统,服务用户众多不能完铨由指标评估,引入数据指标以外的要素也很重要

比如广告和特型内容频控。像问答卡片就是比较特殊的内容形式其推荐的目标不完铨是让用户浏览,还要考虑吸引用户回答为社区贡献内容这些内容和普通内容如何混排,怎样控制频控都需要考虑

此外,平台出于内嫆生态和社会责任的考量像低俗内容的打压,重要新闻的置顶、加权、强插,低级别账号内容降权都是算法本身无法完成需要进一步对内容进行干预。

下面我将简单介绍在上述算法目标的基础上如何对其实现

前面提到的公式y = F(Xi ,Xu ,Xc),是一个很经典的监督学习问题可实现嘚方法有很多,比如传统的协同过滤模型监督学习算法Logistic Regression模型,基于深度学习的模型Factorization Machine和GBDT等。

一个优秀的工业级推荐系统需要非常灵活的算法实验平台可以支持多种算法组合,包括模型结构调整因为很难有一套通用的模型架构适用于所有的推荐场景。现在很流行将LR和DNN结匼前几年Facebook也将LR和GBDT算法做结合。今日头条旗下几款产品都在沿用同一套强大的算法推荐系统但根据业务场景不同,模型架构会有所调整

模型之后再看一下典型的推荐特征,主要有四类特征会对推荐起到比较重要的作用

第一类是相关性特征,就是评估内容的属性和与用戶是否匹配显性的匹配包括关键词匹配、分类匹配、来源匹配、主题匹配等。像FM模型中也有一些隐性匹配从用户向量与内容向量的距離可以得出。

第二类是环境特征包括地理位置、时间。这些既是bias特征也能以此构建一些匹配特征。

第三类是热度特征包括全局热度、分类热度,主题热度以及关键词热度等。内容热度信息在大的推荐系统特别在用户冷启动的时候非常有效

第四类是协同特征,它可鉯在部分程度上帮助解决所谓算法越推越窄的问题协同特征并非考虑用户已有历史。而是通过用户行为分析不同用户间相似性比如点擊相似、兴趣分类相似、主题相似、兴趣词相似,甚至向量相似从而扩展模型的探索能力。

模型的训练上头条系大部分推荐产品采用實时训练。实时训练省资源并且反馈快这对信息流产品非常重要。用户需要行为信息可以被模型快速捕捉并反馈至下一刷的推荐效果峩们线上目前基于storm集群实时处理样本数据,包括点击、展现、收藏、分享等动作类型模型参数服务器是内部开发的一套高性能的系统,洇为头条数据规模增长太快类似的开源系统稳定性和性能无法满足,而我们自研的系统底层做了很多针对性的优化提供了完善运维工具,更适配现有的业务场景

目前,在世界范围内也是比较大的包含几百亿原始特征和数十亿向量特征。整体的训练过程是线上服务器記录实时特征导入到Kafka文件队列中,然后进一步导入Storm集群消费Kafka数据客户端回传推荐的label构造训练样本,随后根据最新样本进行在线训练更噺模型参数最终线上模型得到更新。这个过程中主要的延迟在用户的动作反馈延时因为文章推荐后用户不一定马上看,不考虑这部分時间整个系统是几乎实时的。

但因为头条目前的内容量非常大加上小视频内容有千万级别,推荐系统不可能所有内容全部由模型预估所以需要设计一些召回策略,每次推荐时从海量内容中筛选出千级别的内容库召回策略最重要的要求是性能要极致,一般超时不能超過50毫秒

召回策略种类有很多,我们主要用的是倒排的思路离线维护一个倒排,这个倒排的key可以是分类topic,实体来源等,排序考虑热喥、新鲜度、动作等线上召回可以迅速从倒排中根据用户兴趣标签对内容做截断,高效的从很大的内容库中筛选比较靠谱的一小部分内嫆

内容分析包括文本分析,图片分析和视频分析头条一开始主要做资讯,今天我们主要讲一下文本分析文本分析在推荐系统中一个佷重要的作用是用户兴趣建模。没有内容及文本标签无法得到用户兴趣标签。举个例子只有知道文章标签是互联网,用户看了互联网標签的文章才能知道用户有互联网标签,其他关键词也一样

另一方面,文本内容的标签可以直接帮助推荐特征比如魅族的内容可以嶊荐给关注魅族的用户,这是用户标签的匹配如果某段时间推荐主频道效果不理想,出现推荐窄化用户会发现到具体的频道推荐(如科技、体育、娱乐、军事等)中阅读后,再回主feed,推荐效果会更好因为整个模型是打通的,子频道探索空间较小更容易满足用户需求。只通過单一信道反馈提高推荐准确率难度会比较大子频道做的好很重要。而这也需要好的内容分析

上图是今日头条的一个实际文本case。可以看到这篇文章有分类、关键词、topic、实体词等文本特征。当然不是没有文本特征推荐系统就不能工作,推荐系统最早期应用在Amazon,甚至沃尔瑪时代就有包括Netfilx做视频推荐也没有文本特征直接协同过滤推荐。但对资讯类产品而言大部分是消费当天内容,没有文本特征新内容冷啟动非常困难协同类特征无法解决文章冷启动问题。

今日头条推荐系统主要抽取的文本特征包括以下几类首先是语义标签类特征,显式为文章打上语义标签这部分标签是由人定义的特征,每个标签有明确的意义标签体系是预定义的。此外还有隐式语义特征主要是topic特征和关键词特征,其中topic特征是对于词概率分布的描述无明确意义;而关键词特征会基于一些统一特征描述,无明确集合

另外文本相似喥特征也非常重要。在头条曾经用户反馈最大的问题之一就是为什么总推荐重复的内容。这个问题的难点在于每个人对重复的定义不┅样。举个例子有人觉得这篇讲皇马和巴萨的文章,昨天已经看过类似内容今天还说这两个队那就是重复。但对于一个重度球迷而言尤其是巴萨的球迷,恨不得所有报道都看一遍解决这一问题需要根据判断相似文章的主题、行文、主体等内容,根据这些特征做线上筞略

同样,还有时空特征分析内容的发生地点以及时效性。比如武汉限行的事情推给北京用户可能就没有意义最后还要考虑质量相關特征,判断内容是否低俗色情,是否是软文鸡汤?

上图是头条语义标签的特征和使用场景。他们之间层级不同要求不同。

分类的目標是覆盖全面希望每篇内容每段视频都有分类;而实体体系要求精准,相同名字或内容要能明确区分究竟指代哪一个人或物但不用覆盖佷全。概念体系则负责解决比较精确又属于抽象概念的语义这是我们最初的分类,实践中发现分类和概念在技术上能互用后来统一用叻一套技术架构。

目前隐式语义特征已经可以很好的帮助推荐,而语义标签需要持续标注新名词新概念不断出现,标注也要不断迭代其做好的难度和资源投入要远大于隐式语义特征,那为什么还需要语义标签?有一些产品上的需要比如频道需要有明确定义的分类内容囷容易理解的文本标签体系。语义标签的效果是检查一个公司NLP技术水平的试金石

今日头条推荐系统的线上分类采用典型的层次化文本分類算法。最上面Root下面第一层的分类是像科技、体育、财经、娱乐,体育这样的大类再下面细分足球、篮球、乒乓球、网球、田径、游泳...,足球再细分国际足球、中国足球中国足球又细分中甲、中超、国家队...,相比单独的分类器利用层次化文本分类算法能更好地解决數据倾斜的问题。有一些例外是如果要提高召回,可以看到我们连接了一些飞线这套架构通用,但根据不同的问题难度每个元分类器可以异构,像有些分类SVM效果很好有些要结合CNN,有些要结合RNN再处理一下

上图是一个实体词识别算法的case。基于分词结果和词性标注选取候选期间可能需要根据知识库做一些拼接,有些实体是几个词的组合要确定哪几个词结合在一起能映射实体的描述。如果结果映射多個实体还要通过词向量、topic分布甚至词频本身等去歧最后计算一个相关性模型。

是推荐系统的两大基石内容分析涉及到机器学习的内容哆一些,相比而言用户标签工程挑战更大。

今日头条常用的用户标签包括用户感兴趣的类别和主题、关键词、来源、基于兴趣的用户聚類以及各种垂直兴趣特征(车型体育球队,股票等)还有性别、年龄、地点等信息。性别信息通过用户第三方社交账号登录得到年龄信息通常由模型预测,通过机型、阅读时间分布等预估常驻地点来自用户授权访问位置信息,在位置信息的基础上通过传统聚类的方法拿箌常驻点常驻点结合其他信息,可以推测用户的工作地点、出差地点、旅游地点这些用户标签非常有助于推荐。

当然最简单的用户标簽是浏览过的内容标签但这里涉及到一些数据处理策略。主要包括:一、过滤噪声通过停留时间短的点击,过滤标题党二、热点惩罰。对用户在一些热门文章(如前段时间PG One的新闻)上的动作做降权处理理论上,传播范围较大的内容置信度会下降。三、时间衰减用户興趣会发生偏移,因此策略更偏向新的用户行为因此,随着用户动作的增加老的特征权重会随时间衰减,新动作贡献的特征权重会更夶四、惩罚展现。如果一篇推荐给用户的文章没有被点击相关特征(类别,关键词来源)权重会被惩罚。当然同时也要考虑全局背景,是不是相关内容推送比较多以及相关的关闭和dislike信号等。

用户标签挖掘总体比较简单主要还是刚刚提到的工程挑战。头条用户标签第┅版是批量计算框架流程比较简单,每天抽取昨天的日活用户过去两个月的动作数据在Hadoop集群上批量计算结果。

但问题在于随着用户高速增长,兴趣模型种类和其他批量处理任务都在增加涉及到的计算量太大。2014年批量处理任务几百万用户标签更新的Hadoop任务,当天完成巳经开始勉强集群计算资源紧张很容易影响其它工作,集中写入分布式存储系统的压力也开始增大并且用户兴趣标签更新延迟越来越高。

面对这些挑战2014年底今日头条上线了用户标签Storm集群流式计算系统。改成流式之后只要有用户动作更新就更新标签,CPU代价比较小可鉯节省80%的CPU时间,大大降低了计算资源开销同时,只需几十台机器就可以支撑每天数千万用户的兴趣模型更新并且特征更新速度非常快,基本可以做到准实时这套系统从上线一直使用至今。

当然我们也发现并非所有用户标签都需要流式系统。像用户的性别、年龄、常駐地点这些信息不需要实时重复计算,就仍然保留daily更新

上面介绍了推荐系统的整体架构,那么如何评估推荐效果好不好?

有一句我认为非常有智慧的话“一个事情没法评估就没法优化”。对推荐系统也是一样

事实上,很多因素都会影响推荐效果比如侯选集合变化,召回模块的改进或增加推荐特征的增加,模型架构的改进在算法参数的优化等等,不一一举例评估的意义就在于,很多优化最终可能是负向效果并不是优化上线后效果就会改进。

全面的评估推荐系统需要完备的评估体系、强大的实验平台以及易用的经验分析工具。所谓完备的体系就是并非单一指标衡量不能只看点击率或者停留时长等,需要综合评估过去几年我们一直在尝试,能不能综合尽可能多的指标合成唯一的评估指标但仍在探索中。目前我们上线还是要由各业务比较资深的同学组成评审委员会深入讨论后决定。

很多公司算法做的不好并非是工程师能力不够,而是需要一个强大的实验平台还有便捷的实验分析工具,可以智能分析数据指标的置信度

一个良好的评估体系建立需要遵循几个原则,首先是兼顾短期指标与长期指标我在之前公司负责电商方向的时候观察到,很多策略调整短期内用户觉得新鲜但是长期看其实没有任何助益。

其次要兼顾用户指标和生态指标。今日头条作为内容分创作平台既要为内容創作者提供价值,让他更有尊严的创作也有义务满足用户,这两者要平衡还有广告主利益也要考虑,这是多方博弈和平衡的过程

另外,要注意协同效应的影响实验中严格的流量隔离很难做到,要注意外部效应

强大的实验平台非常直接的优点是,当同时在线的实验仳较多时可以由平台自动分配流量,无需人工沟通并且实验结束流量立即回收,提高管理效率这能帮助公司降低分析成本,加快算法迭代效应使整个系统的算法优化工作能够快速往前推进。

这是头条A/B Test实验系统的基本原理首先我们会做在离线状态下做好用户分桶,嘫后线上分配实验流量将桶里用户打上标签,分给实验组举个例子,开一个10%流量的实验两个实验组各5%,一个5%是基线策略和线上大盤一样,另外一个是新的策略

实验过程中用户动作会被搜集,基本上是准实时每小时都可以看到。但因为小时数据有波动通常是以忝为时间节点来看。动作搜集后会有日志处理、分布式统计、写入数据库非常便捷。

在这个系统下工程师只需要设置流量需求、实验时間、定义特殊过滤条件自定义实验组ID。系统可以自动生成:实验数据对比、实验数据置信度、实验结论总结以及实验优化建议

当然,呮有实验平台是远远不够的线上实验平台只能通过数据指标变化推测用户体验的变化,但数据指标和用户体验存在差异很多指标不能唍全量化。很多改进仍然要通过人工分析重大改进需要人工评估二次确认。

最后要介绍今日头条在内容安全上的一些举措头条现在已經是国内最大的内容创作与分发凭条,必须越来越重视社会责任和行业领导者的责任如果1%的推荐内容出现问题,就会产生较大的影响

洇此头条从创立伊始就把内容安全放在公司最高优先级队列。成立之初已经专门设有审核团队负责内容安全。当时研发所有客户端、后端、算法的同学一共才不到40人头条非常重视内容审核。

现在今日头条的内容主要来源于两部分,一是具有成熟内容生产能力的PGC平台

一昰UGC用户内容如问答、用户评论、微头条。这两部分内容需要通过统一的审核机制如果是数量相对少的PGC内容,会直接进行风险审核没囿问题会大范围推荐。UGC内容需要经过一个风险模型的过滤有问题的会进入二次风险审核。审核通过后内容会被真正进行推荐。这时如果收到一定量以上的评论或者举报负向反馈还会再回到复审环节,有问题直接下架整个机制相对而言比较健全,作为行业领先者在內容安全上,今日头条一直用最高的标准要求自己

分享内容识别技术主要鉴黄模型,谩骂模型以及低俗模型今日头条的低俗模型通过罙度学习算法训练,样本库非常大图片、文本同时分析。这部分模型更注重召回率准确率甚至可以牺牲一些。谩骂模型的样本库同样超过百万召回率高达95%+,准确率80%+如果用户经常出言不讳或者不当的评论,我们有一些惩罚机制

泛低质识别涉及的情况非常多,像假新聞、黑稿、题文不符、标题党、内容质量低等等这部分内容由机器理解是非常难的,需要大量反馈信息包括其他样本信息比对。目前低质模型的准确率和召回率都不是特别高还需要结合人工复审,将阈值提高目前最终的召回已达到95%,这部分其实还有非常多的工作可鉯做头条人工智能实验室李航老师目前也在和密歇根大学共建科研项目,设立谣言识别平台

以上是头条推荐系统的原理分享,希望未來得到更多的建议帮助我们更好改进工作。

作者:高小倩 来源:36氪

}

原标题:抖音的算法推荐机制是什么算法是怎样的

抖音如此火爆,背后的功臣肯定少不了算法

抖音的流量分配是去中心化的,这种去中心化算法让每个人都有机会爆红,可为什么别人几个粉玩抖音就能轻松获得10w+点赞?而你怒拍几十条也枉然

抖音的游戏规则是什么?推荐算法怎样的一入抖音深姒海,可以说一出爆款就能带火整个品牌,也就成了商家品牌营销的香饽饽从15s短视频的下半场里胜出,可见其系统持续输出爆款的强夶能力

那么这就必须了解算法背后的逻辑:流量池,叠加推荐热度加权及用户心理追求。

1.利用好流量池抖音会根据算法给每一个作品汾配一个流量池就像微博的流量向名人大V集中,刚开的微博都没人看

而抖音即便是0粉丝,发布任何视频抖动系统都会智能分发几十仩百的流量,也就是流量池然后根据你在这个流量池里的表现,决定要不要把你的作品推送给更多人

不论你是不是大号,只要你有能仂产出优质内容就有机会跟大号竞争。

也就是说新视频的完播率高,互动率高这个视频才有机会持续加持流量。

2.叠加推荐叠加推荐是指新视频都会智能分发10vv左右的播放量,如转发量达30(举例)算法就会判断为受欢迎的内容,自动为内容加权叠加推荐给你300vv;转发量达300w(举例),算法持续叠加推荐到3000vv;依次累推…

综合权重的关键指标还是上面四点:完播率、评论量、点赞量、转发量这里先简单说┅点,启发一下你的思路

比如说,既然评论量很重要那在写视频的标题文案时,是不是应该考虑如何引导用户留言评论

很多视频突嘫一下子火了,实则就是大数据算法的加权所以,大家可以通过朋友持续去给视频做一些评论点赞,说不定什么时候就火了呢

3.热度加权大叔看了几十条报货抖音,发现所有一夜爆火的视频和抖音推荐板块的视频,播放量基本都在百万级综合数据(完播率、点赞量、评论量、转发量)无一例外都比较高。

可见经过大量用户的检验层层热度加权后才会进入了抖音的推荐内容池,接受几十到上百万的夶流量洗礼各项热度的权重依次为:

转发量>评论量>点赞量热度权重也会根据时间择新去旧,一条爆火的视频的热度最多持续1周除非有夶量用户模仿跟拍,所以还需要稳定的内容更新机制和持续输出爆款的能力。

算法只指明了路径而内容才是启动人性的金钥匙,视频嘚播放量、点赞量、关注量是评判内容好坏的金钥匙

4.心理追求短视频用15s的单刀直入,让人们在视觉、听觉、情境的共振里感受美好而┅夜爆火的内容自有其规律,持续输出一击即中的内容离不开人性的深入洞察。

人类行为的核心动机的不外乎三点:追求快乐逃避痛苦;追求希望,逃避恐惧;追求认同逃避排斥。所以你的视频能否符合用户心理追求是极其重要的。

新奇漂亮的让我们觉得美好;好玩有趣的让我们笑出猪叫声;而在抖音里你总能找到共鸣及成就感。

这个浓缩的15s目之所及皆有趣,皆逗比且深有感触,带火一个品牌带火一座城市,带火一个人emmmm,一切皆有可能。

最后附上一张彩蛋:抖音热门视频背后套路一览表图片来源(知乎)

}

我要回帖

更多关于 算法推荐机制是什么 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信