博客首页 -> 运营那些事 -> 贾真:2019年淘宝综合排序算法 -> 日志正文

贾真:2019年淘宝综合排序算法

丰本 2019.06.22 / 09:19:45 运营那些事
日志正文

今年淘宝搜索变化很大,刷单和直通车,这两个常规的打爆款手段,在拉动搜索流量方面,都变得越来越弱了。因为淘宝搜索对外从来不会公布算法,这几天,我找到今日头条对外公开的,同样是人工智能的今日头条算法原理,对应的去理解淘宝搜索的算法,似乎找到了目前淘宝综合排序的算法。


淘宝搜索综合排序的算法,和今日头条的算法类似,目前有三个大的纬度,第一个纬度是商品,找出在某个关键词下,哪些商品能满足用户需求,这是基础通用算法;第二个纬度是用户,没有一个产品能满足所有用户需求,所以这个纬度,是找出每个人群标签下,适合的商品,也就是千人千面;第三个纬度是平台生态,从防止垄断和商品丰富性的角度,进行展示商品的干预。


我们先分析第一个,商品纬度。

在商品纬度里,和之前的淘宝搜索不一样,现在并不是一个宝贝一个权重,而是一个关键词,一个权重。比如一件T恤,如果标题里同时有韩版和欧美风,那么韩版权重高,欧美风的权重就必然不高。

我们目前优化宝贝权重的核心,其实是找到我们商品在哪些关键词上,可能比对手商品数据更好。而可能比对手表现更好的词,往往是因为这个词和我们产品的相关性,超过对手宝贝,也就是精准。

在确定关键词之后,并且大家的关键词相关性都差不多的情况下,我们再去看人气权重。

我们用直通车举例,直通车是竞价排名,但又不是单纬度的竞价排名。直通车学习谷歌广告的算法,用户第一,如果你的产品和用户的需求相近,那么你就可以出价更低排名靠前;如果和用户的需求不一致,那么你出价高,还不一定能排在前面。

直通车的相关性数值,我们可以直观的看到,就是质量得分,而且质量得分并不是一个宝贝一个质量得分,而是一个关键词一个质量得分;同样道理,搜索的相关性数值,是被隐藏掉,我们看不到,但大概原理和质量得分一样,一个关键词一个“质量得分”。

直通车是关键词质量得分越高,关键词出价就可以更低,低质量得分出价再高,也难拿到展现;搜索是关键词“质量得分”越高,权重就可以越低,低“质量得分”权重再高,搜索流量也难增长。

直通车提高质量得分的方法,是刷点击率和收藏加购率,甚至不用刷销量,只要转化不要太差,补一下单就可以;搜索提高质量得分的方法,也是一样。

换句话说,搜索要想拿到流量,点击率不变的情况下,转化率再高都没用;而转化率在某个“阀值”以上,控制住,点击率越高,流量就越高。


我们之前的贾真5分钟内容里,也反复讲到,搜索里的数据没有绝对的好坏,都是相对的。所以,点击率的高低也要找个参考对象,我们直通车测图时会发现,同样的主图,不同的位置点击率也会不同。所以,我猜测淘宝搜索会有类似今日头条的“热点惩罚”,今日头条认为传播越多的新闻,置信度越低,因为有羊群效应,同样道理,越是爆款销量高,点击率相对会更高,销量会影响消费者对商品的准确判断力。

我猜测,淘宝会对爆款点击率做一些惩罚性措施,可能是爆款的点击率6%和新品的点击率5%相同的权重,这样新的产品就更有机会脱颖而出,不会永远被爆款压制。


目前今日头条的算法,是实时反馈,这一批用户的点击浏览行为,就马上影响下一批用户的推送结果。同样道理,目前淘宝搜索结果,也是即使反馈,如果即使反馈那么转化率就不会成为即使反馈的纬度,因为有个转化周期。

举例说明,用户购买一张沙发,很难在一小时内下单付款,正常用户的转化周期可能有几个月。而消费者对某个沙发有兴趣,可能的行为是点击率,收藏率,加购率,所以我们认为,大量用户的这些行为,会决定这个宝贝的即时流量。

但是,如果只看一小时的行为,又可能出现“欺骗”性商品,比如某个沙发主图放了个性感美女,即时的点击率就很具备欺骗性,所以淘宝在实时赛马的同时,又会通过进行长期赛马进行“展现惩罚”,也就是说,如果给了你大量的展现,顾客看了你商品,在转化周期内都不下单,那么说明你可能是欺骗性商品,接下来就要收回这个宝贝的关键词权重。

因为不同商品的转化周期不一样,比如家具转化周期可能几个月,所以“一视同仁”看7天坑产,或者30天坑产,可能都不能真实反馈商品情况,所以转化率这个数值只能是个“阀值”,不要低于某个行业平均数值就好。

正是因为转化周期的存在,阶段转化率的意义不大,但是另外一个数据,可以无视转化周期,比转化率更加真实反馈产品竞争力,这个数据是流失率。流失率指的是,浏览过我们商品的顾客中,去对手家买的顾客占所有最终成功购买的顾客比例。

所以,目前有了流失率这个更客观数据之后,转化率和转化周期就不再重要了,流失率比对手越低,产品权重就越高。

综上所述,在某个关键词上,要想流量提升,在不要低于“转化率阀值”的前提下,“搜索质量得分”越高搜索流量短时间就会越多,搜索流量是否能持续增长下去,取决于你的流失率是否低于其它商品。

未标题-3.jpg

我们关于综合排序上篇的内容,讲的是淘宝搜索筛选商品的纬度,怎么识别什么商品和顾客的搜索关键词匹配,并且在匹配用户需求的商品里选出人气比较高的。也许到这里,聪明的你可能发现一个问题,这里面得到的商品的排序结果,默认了一个结果,就是所有的顾客在搜索同一个词的时候,需求都是一样的,但是现实中这是不合理的。举例说明,男性和女性在搜索“T恤“这个词,需求就不一样;高富帅和学生在搜索“T恤“这个词,需求也不一样。

这里面就要讲到搜索排序的第二个主要纬度,人群标签权重。

人群标签的本质,是做双向匹配,一类人群标签下的顾客匹配某个对应标签的商品。这里的两个标签,人群标签和商品标签,因为这两个标签都是变量,就好像是“先有鸡,还是先有蛋“的博弈,到底是先确定人群标签,在对应的生成匹配的商品标签,还是先确定商品标签,再生成对应的人群标签呢?

阿里巴巴天猫团队里,有个重要的部门,叫品牌打分,他们基于目前线上和线下所有的品牌销售数据,品牌活跃店铺数量和活跃商品数量的数据,给淘宝所有的品牌打分,大概的打分规则是这样的:0-3分,是没有品牌或者低知名度的贴牌商品;3-4分,是有一定数据量的品牌;4-5分,是进行了线上线下布局的,有实体店规模的知名品牌;5分以上,是国际知名品牌。

有了这个品牌分级数据之后,淘宝就会根据用户历史购买品牌的等级情况,进行第一次的人群打标签,经常买国际大牌的一个人群标签,然后把所有得到这个标签的顾客,进行购物反馈,如果这个标签的人,在购买连衣裙的时候,大部分购买的是400元以上的连衣裙,那么这些400元价格以上的宝贝,就会打上高消费人群标签,接下来这个人群标签下的其他所有顾客,在搜索相同关键词的时候,这些打上标签的宝贝就会优先展示。

我们曾经想测试下,淘宝搜索的标签匹配,目前能智能到什么程度,是不是可以完全做到每个商品都准确的打上标签,比如某个商品虽然价格很低,但是5分以上标签的人群仍然很喜欢,那么是否可以做到这个低价的商品,仍然能展示在5分标签人群的搜索结果里。

我们测试的方式是,先找三个人手机搜索某个关键词,确定无线前13名的展示最低价,比如是128元,因为我们的商品虽然在销量排序是第二名,但是因为价格是99元,所以默认搜索结果里不能展示。接下来,我们调整宝贝一口价,把搜索展示价格从99元提高到128,刷新搜索词后这个产品就出现在我们的搜索结果页面里。

所以我们得到的结论,就是搜索到目前位置商品的标签,并没有打的很细,搜索展示价格仍然是商品和人群匹配的主要纬度。这就可以解释,为什么那些单个商品30元,设置销售价格59元,买一送一,或者拍下立减30元,仍然可以拿到搜索流量。

除了有人群消费能力标签外,人群还会有年龄,性别,地域和时间标签等,我之前在看阿里数据负责人的书,里面写到阿里巴巴给每个用户13个性别标签,因为他们发现,一个用户账号并不一定只有一个人用,可能是家庭账户,所以它上午的时候,可能是女人,下午就是男人,晚上是儿童,某个时间又可能是老人。


当给了所有用户打上了属于自己的人群标签后,接下来再对于每个人群分别执行上节课我们说的商品纬度的算法,就得到了一个关键词下的每个人群标签结果,这样就实现了搜索结果的“千人百面“。


没错,是千人百面,并不是千人千面,因为这个结果是每个相同标签的人,看到的结果是一样。比如和你相同标签的人群,搜索手机壳的时候从来不会去点击和购买9.9元的手机壳,那么你在初次搜索手机壳的时候,就看不到这个价格的手机壳;如果你这个标签的大部分人,搜索手机壳都点击了25元以上的手机壳,那么你的搜索结果的主要价格段就在25元。


这个算法利用中国的一句老话:“物以类聚,人以群分“。但是,也可能有例外,比如虽然我购买其他品类都买国际品牌,但是我买手机壳,就买9.9元就可以了。所以,之前的课程讲搜索历史行为标签的时候,我们讲到,搜索会基于你的个人行为,即时的更新你的商品展示结果

最后,人群标签+个人行为实时反馈,就把搜索结果从千人百面升级成了千人千面,这就是我们说的搜索排序的第二个纬度,人群标签权重。


除了商品纬度和人群纬度之外,淘宝搜索排序结果,为了保证平台生态的健康发展,为了展示商品的丰富性,还有第三个比较重要的纬度,叫平台生态纬度,从平台可持续发展角度,去设置一些算法。

这里面就有我们反复提到的,搜索打散原则:同一个关键词下,无线搜索结果前13名,只展示一个店铺的两个宝贝(不算直通车);同人店铺限制:同一个团队,运营的多个商品相同的店铺,会收到搜索流量的限制(同时满足两个条件,同团队,同产品)。

商品纬度和人气纬度只影响单品,而平台生态纬度,影响的整店搜索流量的获取,对于卖家更加重要。


我们说到,我们自己在做淘宝店铺运营的时候,一定要做“猜想-执行-验证“的循环才能真正成长,做每个事情先从逻辑上给出假设,然后把猜想的部分执行下来,最后找数据验证我们的假设是否正确,如果不正确,就循环执行猜想执行验证,一直到提高为止。


淘宝搜索的算法是否会大范围使用,也是要做这种评估分析。他们的做法是,先找一定数量的用户当“小白鼠“,然后把这些“小白鼠“尽量公平的分成几组放到“桶“里,当作对照测试组;接下来,淘宝搜索会给每个“测试桶“的小白鼠使用不同的算法,最后来看每个桶的最终核心数据反馈结果,哪个桶的小白鼠反馈数据好,就证明哪个桶的算法更适合。

所以,有的时候你店铺的某个商品,在周五,周六的搜索流量突然降低,周一恢复,很可能原因就是你的商品周五在某个桶里被测试,这个测试的新算法不太好,所以在周一的时候淘宝搜索就恢复之前的算法,你的搜索流量就恢复了。


标签:贾真:2019 

猜你喜欢

发表评论


赞助商广告
归档
热门推荐
友情链接