长尾分布(long-tail distribution)和长尾效应「建议收藏」

长尾分布(long-tail distribution)和长尾效应「建议收藏」长尾分布(long-taildistribution)和长尾效应1、长尾效应作者:赵澈链接:https://www.zhihu.com/question/20027490/answer/20420381来源:知乎长尾效应其实是幂率分布的通俗提法,在物理上也被称为无标度现象,这种现象在自然界与社会生活中都相当地常见,可参考幂律分布_互动百科。里面也提到之所以叫无标度,是因为「系统中个体的尺度相差悬殊,缺乏一个优选的规模」。如下图这般,极少数个体(横轴)对应极高的值(纵轴),而拥有极低值的个体,数

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全家桶1年46,售后保障稳定

长尾分布(long-tail distribution)和长尾效应

1、长尾效应

作者:赵澈
链接:https://www.zhihu.com/question/20027490/answer/20420381
来源:知乎

长尾效应其实是幂率分布的通俗提法,在物理上也被称为无标度现象,这种现象在自然界与社会生活中都相当地常见,可参考幂律分布_互动百科。里面也提到之所以叫无标度,是因为「系统中个体的尺度相差悬殊,缺乏一个优选的规模」。

如下图这般,极少数个体(横轴)对应极高的值(纵轴),而拥有极低值的个体,数量却占总体的绝大多数。形象地描述可称曲线靠近纵轴的部份为tall head,而靠近横轴的部份则是所谓的long tail:
长尾分布(long-tail distribution)和长尾效应「建议收藏」

据维基百科:長尾(英語:The Long Tail),或譯長尾效應,最初由《連線》的總編輯克里斯·安德森(Chris Anderson)於2004年發表於自家的雜誌中[1],用來描述諸如亞馬遜公司、Netflix和Real.com/Rhapsody之類的網站之商業和經濟模式。是指那些原來不受到重視的銷量小但種類多的產品或服務由於總量巨大,累積起來的總收益超過主流產品的現象

因此长尾效应这个提法,强调的是那些数量占绝大多数的个体的商业价值,它们单个的值虽然极低,但是这个长长的尾巴,总和不可小觑。而长尾之所以常常与互联网、电子商公司放在一起,主要是因为互联网与IT技术的发展使产品与服务的信息到达用户的平均成本降到了极低的值。幂率分布在海量产品信息与用户信息的情形下表现得尤其明显,并且被这些公司较早加以了良好利用。

以下拿网店与线下商店对比为例:

网店相当于用极小的成本,便换来几乎无限长的货架,可以同时包括大热门以及几乎无人问津的众多冷门。这众多冷门带来的效益总和则相当可观,甚至可以去与几个大热门相较量。用一个不恰当的比喻,「蚁多咬死象」。相较而言,线下实体商店由于可观的空间等成本是无法做到同样的事情的,边际效益不允许。

从用户的角度看,即使再小众的需求也可能通过互联网平台得以满足,相当于毫不费力逛一个无限大的、能尽可能满足自己的超级市场,可以说只要是世上存在的,都可能唾手可「见」(当然这是一种极为理想的描绘,实际的状况很大程度上依赖于技术的发展,比如搜索引擎、个性化推荐等,这裡暂且不谈)。之所以我不说唾手可「得」,是因为有物流这个实物类电子商贸无法逃避的瓶颈;O2O等服务类商品则也难以回避实际的消费一定发生在线下这一问题。即使消费者与商品之间碰撞出火花所需的时间再短,终不得不考虑这漫长多艰的蜀道难。这也是线下商店不会被电子商贸轻易打垮的重要原因之一。而手机话费、游戏点卡这类的虚拟(或者说完全数字化)商品,包括现在很热的网络金融产品,在这方面则受到很小的影响。

这种在电子商贸领域中的现象同样能够在其他互联网应用特别是平台化的应用上见到,比如多媒体内容分享平台、网络社区等。这时用户所拥有的值就从对商品或服务的需求(可能还对应为他们为实现这一需求愿意付出的代价)变成了对有趣、有价值的信息的需求(也可能对应愿付出的代价,当然这时可能更像是时间、精力这样的代价)。而这些信息同样主要来自于用户,也就是所谓的UGC。这种生产的长尾与需求的长尾同时作用,便是我所理解的Web 2.0的一个重要特徵。

现在也有不少其他领域借鉴了长尾这个说法,用以描述各自领域内的幂率分布现象。此外值得一提的是,幂率分布与正态分布都给人一种用以区分大多数与极少数的印象,但是正态分布的大多数集中于中间,极少数则分居两端,是个倒挂金钟的形状,二者描绘的其实是极为不同的现象。

2、长尾分布(和重尾分布即幂律分布)

Zipf分布是一种符合长尾的分布:

在这里插入图片描述

就是指尾巴很长的分布。那么尾巴很长很厚的分布有什么特殊的呢?有两方面:一方面,这种分布会使得你的采样不准,估值不准,因为尾部占了很大部分。另一方面,尾部的数据少,人们对它的了解就少,那么如果它是有害的,那么它的破坏力就非常大,因为人们对它的预防措施和经验比较少。也要所谓的二八法则。
https://www.cnblogs.com/huangshiyu13/p/6217180.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/215931.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • pycharm安装库老是失败_申报状态已申报未导入

    pycharm安装库老是失败_申报状态已申报未导入解决Pycharm导入库失败的问题在pycharm中每一个project都可以有一个属于自己的库,在创建新project的时候会给到一个新的库,这个时候的话就有可能会出现安装过的库报错,还需要重新安装的问题。如果不是创建一个大工程的话可以把这个工程的库的路径指向默认的文件夹,然后在默认的文件夹中安装常用的库,然后小脚本之类的就指向这个文件夹,这样子就不用下次重新安装库了。acondana使用方法:https://blog.csdn.net/weixin_44857413/article/de

  • 对数及运算法则_log公式运算法则

    对数及运算法则_log公式运算法则1.对数源于指数,是指数函数反函数因为:y=ax所以:x=logay2.对数的定义【定义】如果N=ax(a>0,a≠1),即a的x次方等于N(a>0,且a≠1),那么数

  • linux命令: chown命令

    linux命令: chown命令

  • sql连接查询和嵌套查询_sql子查询和连接查询

    sql连接查询和嵌套查询_sql子查询和连接查询subject表:grade表:sql语句:结果:自连接:查询父子信息,把一张表看成两张一样的表现在有一张包含子父关系的,名为category的数据表:我们把这一张表拆分成两张表:执行sql语句:结果:…

  • lstm是rnn中的一种吗_经验公式是什么

    lstm是rnn中的一种吗_经验公式是什么前言好久没用正儿八经地写博客了,csdn居然也有了markdown的编辑器了,最近花了不少时间看RNN以及LSTM的论文,在组内『夜校』分享过了,再在这里总结一下发出来吧,按照我讲解的思路,理解RNN以及LSTM的算法流程并推导一遍应该是没有问题的。RNN最近做出了很多非常漂亮的成果,比如AlexGraves的手写文字生成、名声大振的『根据图片生成描述文字』、输出类似训练语料的文字等应用,都让人感

  • GitHub开源的10个超棒后台管理面板

    GitHub开源的10个超棒后台管理面板项目开发中后台管理平台必不可少,但是从零搭建一套多样化后台管理并不容易,目前有许多开源、免费、样式丰富的后台管控面板,深夜学习简书上一位大神的博文,共总结10项优秀后台管理控制面板(9个GitHub项目,1个在线UI框架)。

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号