大数据给你贴上了各种标签(怪不得能推荐你感兴趣的内容)

qinzhiqiang 07-18 9:07 901次浏览

大数据给你贴上了各种标签(怪不得能推荐你感兴趣的内容)

几乎我们每天都会使用头条等新闻APP,我们常常发现,新闻APP背后的大数据系统总是能够推荐我们,今天我们以最通俗易懂的方法,来讲讲大数据是怎么发现我们喜欢的东西的。

原来大数据早就给你贴上了各种标签,怪不得能推荐你感兴趣的内容

首先,当有作者在新闻后台撰写一篇文章后,文本分析引擎会对整篇文章进行分词,什么叫分词呢?通俗易懂的讲,就是对文章进行断句。例如下面这个句子,“中国移动采购5G终端13100台,华为占比近半”,机器通过分词算法后,就会变成“中国移动/采购/5G/终端/13100/台,华为/占比/近半”。

分词完之后,机器就会开始提取关键词。什么是关键词呢?出现的次数越多,越有可能是关键词,语气词一般都不是关键词,名词是关键词的可能性更高。一般都会有一个大数据关键词库,会从跟大数据库里面的关键词进行配对。例如,上述例子中,最后成为关键词的就有可能是,中国移动、华为、5G。至于其他的词语,一般都比较通用或者很难表达准确的意思,所以不会被认为是关键词。

提取关键词之后,大数据推荐系统会根据算法,对关键词进行分类,例如上述例子中,关键词是中国移动、华为、5G,那么,文章就会被分类到科技类目下,根据而华为、中国移动、5G这些都是通信的词语,就会再一次被划分到通信类目下。于是,这篇文章就会被归纳到科技类目下,并且被打上通信、华为等标签。

那么,这个内容会推荐给谁呢?很显然,当然是推荐给对科技感兴趣的人啦。那么怎么知道哪些人对科技,对通信感兴趣呢?

在每一个互联网公司里面,每一个用户,都有一个用户画像,什么是用户画像呢?通俗易懂的说,就是大数据系统描述一个用户是什么样的呢?例如男、女等性别标签,用户所在城市等位置标签,用户多少岁等年龄标签,还有用户的喜好,例如喜欢旅行、喜欢数码、喜欢科技这样的种种爱好。

原来大数据早就给你贴上了各种标签,怪不得能推荐你感兴趣的内容

大数据怎么给用户打上标签呢?一般在用户第一次登陆APP的时候,通常都会给用户一些标签,让用户选择感兴趣的内容,这个在专业领域,我们称之为冷启动。例如用户选择了科技之后,我们就能够把上述的文章推荐给这样的用户。

接下来,大数据的后台都会时时刻刻地监视着用户的一举一动,例如同样是科技类目,如果连续给用户推荐5个谷歌的新闻5个微软的新闻,但用户不点击,大数据就可能会认为这个用户对国外的科技不感兴趣,以后就会倾向推荐国内的科技新闻,如果一直推荐科技新闻用户不感兴趣,大数据就会渐渐地认为这个人对科技不感兴趣,会逐渐减少这类新闻的推荐量。

原来大数据早就给你贴上了各种标签,怪不得能推荐你感兴趣的内容

同时,大数据除了对用户的画像不停地调整,也会对文章不停地调整,让用户不停地看到自己感兴趣的,而又优质的文章,所以不得不说,现在大数据是越来越懂用户了!这也是科技的发展,给人们生活带来的便利。

  • 暂无推荐