|
头条在2019年初开始主推搜索的时候,百度正在发力短视频。上周,百度和头条又打起来了,就是因为头条的搜索业务。
" o/ p4 v2 |5 A6 J$ X* t5 l4月26日,百度起诉头条在搜索结果中大量抓取百度搜索top1的结果,要求立即停止侵权,赔偿9000万元并连续30天在其APP及网站首页道歉。+ F" o+ T0 }0 y3 `- B4 F; a
在同一天,抖音以不正当竞争为由将百度诉至法院,因发现百度在搜索中窃取了海量抖音短视频。抖音要求百度立即停止侵权,赔偿9000万元并在百度首页连续道歉30天。
2 J9 V& Q* e; Q- f2 e9 F. p百度和头条之间的竞争一直互相交错、纠缠不清。信息流、短视频,这些业务的争夺,动辄就是百亿的广告市场份额的得失。如果说百度原来是大街上的一家中餐厅,头条的信息流相当于在隔壁开了一家西餐厅,百度和头条的关系属于竞争,但不至于水火不容。现在头条开始做搜索,就好比在路对面又开了一家中餐厅,这是直接进攻百度大本营,如果说之前的争斗关乎钱,那这次是关乎基业,关乎命,可谓是生死之战。
9 I6 O1 Y0 q- e# e! C百度和头条不断地侵入到对方的领域,业务也走得越来越像。就在上周,有媒体报道称百度在开发一款产品,形态是线上的抖音+线下的歌手。为何百度和头条会打得如此的胶着、激烈?其根本在于两家公司的基业存在着很多的相似之处,无论是主动搜索还是被动推荐,百度和头条做的,都是信息筛选的生意。而信息筛选的基础,就是数据(内容+服务)和算法。
7 L, b* ^+ B) j o$ y( [通过数据和算法,搜索和推荐这两种形态的业务,有了衔接点和过渡点,双方的重合度就会越来越高。当头条的推荐做的足够好的时候,做搜索就是必然。" ?. B2 ]& N- p$ I
一、百度和头条的算法5 M! n( l; m9 l7 K# {
搜索的两个基础条件:数据和算法。百度的搜索引擎结果排序和头条的信息流推荐,都是算法。; w1 F; m2 z3 g* C
这两种算法,从表现形式上是不同的。搜索引擎的算法追求的是精准,用户输入关键词,如果返回结果(不考虑广告)是10条,那越优质的内容应该排得越靠前。比如说,Top1就应该是当前最好的答案。对于好的标准,是基于结果页被引用的次数等维度,这个结果对于大多数人来说是最优结果,在当前关键字下,是一个标准的求解。
) |) p- K' [% B8 `6 }: |7 Z! ^头条的算法,基于内容生态属于消费型,容错率比百度高。比如,对于某个用户,当前一屏10条内容,可以推荐5条体育新闻,5条娱乐新闻,都可能是用户感兴趣的。而这10条新闻中,有2条可能用户兴趣度并不高。但是对于内容消费型的推荐结果,是允许这种情况存在,2条匹配度不高的内容并不会对用户使用体验造成特别大的影响。& G6 l) c# a, y% }2 `3 ~% S. H
头条的算法,推荐维度上比较复杂。我们可以这样具象化的简单理解:百度的搜索结果,是一条内容流,基于搜索关键词展现相关度最高的内容。而头条用户每屏内容,是基于用户兴趣,如体育、娱乐等多条内容流,初始状态下,是根据用户特征进行的推荐。比如,用户在没有发起搜索的时候,其实可以认为信息流在默认地为某个特征,比如“体育”展示搜索结果。
1 ^& G, v& S/ p0 [当用户在头条主动发起搜索后,信息流在原先的结果中,根据关键字匹配出相关度更高的内容展示。比如搜索“足球”,就会在“体育”的搜索结果中选择与足球相关的内容,减少甚至去除原先娱乐特征下的内容。
. b- b# Y: z2 s( |7 u8 i z也就是说,头条的推荐结果,本身就是多个小的搜索引擎在同时工作,推荐和搜索,本质上是没有太大的差别。7 D- q# I5 F5 M: X7 K* I5 q
那么,头条的搜索引擎做的够好吗?这在信息流大战中头条已经证明了自己,头条的算法无论是在灵敏度还是复杂度上,都是建立起了一定的壁垒。; Z. K3 \* i/ G- D, Z
算法推荐,可以细分为三个阶段:数据准备、数据检索和数据推荐。头条经过多年的头条号、头条问答、微头条等内容建立,算法的不断优化,起码已经准备得有能力一战了。" C* T/ Y: t/ P/ T
头条和百度的搜索,又有可能不一样。百度虽然多次提到要做搜索结果千人千面,但目前还是给每位用户推荐标准版的结果。举个例子,如果搜索结果的来源有机构、个人站点等多个维度,那机构站点的权重可能高于个人站点,导致相同的内容下,机构站点会在显示结果中排在个人站点前面。由于当前关键字下搜索结果的排序是基于网站本身的权重和属性,对于所有的用户最终显示的结果都一样的。
- q9 A$ W- K8 J+ l2 ^# i$ q而头条目前的内容体系除了阅、转、评、赞等赋予内容本身的属性和权重外,用户自身还存在大量的特征,搜索结果对应的匹配,又多了一层用户特征的过滤,因此每一个用户在同样关键字的搜索结果下,会得到不同的内容展示,也就是千人千面。目前不同用户在头条的搜索结果差异并不明显,但是确实存在不同。. b; f, J5 ~ o4 G1 d: Z4 {/ p" z8 d
百度不是说没有用户特征,而是百度多年来未完善的用户体系,导致至今没有很准确的用户特征。这也是百度在今年春节期间,除了大力推广手机百度和视频等单独的应用外,也希望通过打通用户账号来建立一个比较完善的用户体系。
7 H- Y# N2 V0 }二、百度和头条的数据
1 D. T- M, H$ @4 w2 L搜索的另一个基础条件是数据。头条和百度在数据储备上差距大吗?谁的数据更优?
, V4 B8 l& _( c/ S6 B' ^$ C8 ]0 O百度自然不必说,通过多年的积累,被认为拥有全网的数据,但现在对百度来说情况早已开始起变化。比如说拥有海量用户微信的数据,百度拿不到;头条号的数据,百度拿不到。# \4 U1 a; a" v! v3 i {
反观头条,其数据储备正在快速的增长。头条起家时用爬虫网罗了大量的数据,媒体的资讯、微博的内容,到现在头条建立起来的内容生态,头条号、微头条、问答,以及第三方内容,比如互动百科、360百科等,头条的数据储备也具备开展搜索业务的基础。甚至,对于大多数普通的内容使用者来说,头条的数据优于百度。$ Y8 d5 i# f5 k/ \9 m
百度近些年来在内容生态的短缺,造成了与互联网信息的割裂,百度对内容的把控开始显得不足。很多企业在近些年逐渐地把网站作为一个基本信息展现的地方,甚至放弃PC端网站。反而是企业的头条号、公众号,有大量的信息不断地产出,而这是百度无法收录到的。# g7 A+ @) b5 Y
直到百家号的出现。今年初,一篇《搜索引擎已死》,重新挑起了人们对于百度生态的怀疑,百度大力发展的百家号,被指是将流量圈在自家体系中。事实上,对于百度来讲,这是对自身体系的一种补救。百家号的这种策略,从商业的角度来看是正确的,如果没做百家号,那现在头条做搜索,百度会更加的被动。反观头条,依仗得不就是数据逐渐丰富的优势吗?1 k7 q4 C3 C6 y: r/ I
三、头条做搜索的必然( b. v C+ N3 h7 j! d
头条拥有足够的数据储备和算法能力,进军搜索是必然。而且,张一鸣也有足够的商业动力去这么做。头条发展凶猛,但是头条有压力吗?有的。互联网红利消失,每一家互联网公司都有发展压力,当然头条也有。前些年头条的发展速度太快了,以致于现在对于头条来说,想要达到之前的增速几乎是不可能了。而就在今年初,传出了今日头条母公司字节跳动要上市的消息。如果要在上市后给资本市场交代,那搜索这块既成熟,又顺手,又肥的业务,是头条最好的选择。
1 f7 {- [6 v/ [2 F如果说百度某天突然消失了,李彦宏手里只剩全网的数据和一套成型的算法,那李彦宏会做什么?李彦宏应该依然会做搜索引擎,或者去做一个头条。+ h; ~' P( X/ S4 y) V
现在的情况是,张一鸣恰巧有家店面,还有几个不错的厨子。那对他来说,开个餐馆,是顺气自然,也是必然。这也就是,头条现在具备了数据储备,具备了算法能力,去做搜索也是必然。
7 A1 H7 j3 ^* }9 O搜索引擎需要的数据,无非就是内容+服务。内容方面,百度和头条各有优劣,但是服务,两家的能力都不能算及格。0 R- O7 G$ r# E. P7 k1 n
近些年来,百度的搜索引擎对用户在交易(服务)方面的能力不断地弱化,消费者的习惯改变,早已不会在PC甚至是移动端的网页上进行交易。而且,百度在账号体系和支付方面的不足,甚至自身都不能完成很好的闭环。同样,头条在这方面和百度半斤八两,这也就不难理解,头条和百度,都在跟进小程序了,这是完成服务闭环的一个解决方案。百度和头条今年春节大战的红包提现,都有意识在支付的环节上进行完善。
+ A) Z$ M, n% N: g* q9 n$ B" r百度和头条,在搜索引擎的基础建设上,一个是守城,一个是进攻。城墙并非牢不可破,进攻方并非无坚不摧,这也是,双方才有打这场仗的必要。搜索的战场,未完,待续...
+ Z+ B& B& o; ]9 C( W2 }4 x2 E- [! `6 t
来源:http://www.yidianzixun.com/article/0LsitZZ63 N* {' @1 b; I5 }$ d
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|