权利的游戏，求大神分享，百度怎么私信别人也可以，有可以看的公众号也可以

瓷砖 | 推荐 | 广场舞 | 冶金 | 孙悟空 | 韭菜 | 乌海市 | 男士发型 | 写字楼 | 国家队 | 美国留学 | 电压 | 服装面料 | 空气净化器 | 中兴 | 加工中心 | 营养 | 进口奶粉 | 魔兽争霸3混乱之治 | 昆虫 | 暖通 | 微单相机 | 显示器 | AutoCAD | 绿茶 | 梦幻西游电脑版 | 种植 | Windows 10 | 情商 | 脸型 | 海淘 | 板胡 | 大学专业 | 糕点 | 东海县 | unity（游戏引擎） | 摄影器材 | 威士忌 | 汽车发动机 | 培训学校 | 酱油 | 王老吉 | 杨紫 | 方木 | 电力电子技术 | 牙膏 | 四大会计师事务所 | 林黛玉 | 加拿大移民 | 花千骨 | 略阳县 | 奎屯市 | 牙齿矫正 | 食品加工 | 淘宝美工 | 音乐版权 | 莎车县 | 数控机床 | 航空发动机 | 上海地铁 | 蔬菜 | 中国象棋 | 银联 | 机械设计制造及其自动化 | 塔罗牌 | 意大利 | CAD制图 | 给排水 | 游戏手柄 | 儿童歌曲 | 阳澄湖大闸蟹 | 金庸 | 汉字 | 五粮液 | usb | 我的英雄学院 | 吸尘器 | 纸尿裤 | 电动汽车 | 户型 | 模拟电路 | 房子 | 跑步鞋 | 动画制作 | 牛初乳 | 民生银行 | 景观设计 | 辣条 | 设计公司 | 咖啡馆 | 搏击项目 | 有机化学 | 李白 | 尧山 | 兰蔻（lancome） | 骑马与砍杀 | 中国黄金 | 自行车选购 | 发动机 | 智商 | 交通规划 | 护发 | 铅山县 | 文字 | 产品经理 | 古剑奇谭ol | 海蛇 | 春节联欢晚会 | 主板 | 游戏策划 | 篮球鞋 | 钢笔 | 游戏原画 | 用户界面设计 | 郭德纲 | 麦当劳 | 超级战队 | 产后护理 | 正泰Taekook | 家具设计 | 日用化学 | 黑暗料理 | logo设计 | 冬奥会 | 创业公司 | 魏无羡 | 有限元分析（FEA） | 眼镜选购 | 澳柯玛 | 冰与火之歌（小说） | 锂电池 | 孝感市 | 劳动合同法 | 辐射防护 | 激光手术 | 暴走大事件 | 人生规划 | 水千丞 | 香港大学 | 音响 | 汽车设计 | 米粉 | 生活经历 | 上古卷轴5：天际 | 身材 | 任天堂 | 辩论赛 | 西点 | 现货 | 洗面奶 | 泾县 | 食用油 | 董卓 | 法国 | 美术生 | 创意 | Led灯 | 香格里拉 | 调酒 | 市南区 | 灌篮高手（动漫） | 侵权 | 进击的巨人 | 雪碧 | 鲤鱼 | 谷歌（Google） | 科学 | 手机游戏开发 | 乌龟 | 性格 | 北大荒 | 交易平台 | 滑雪 | 星系 | 小叶紫檀 | 黑曜石 | QQ自由幻想 | 以色列 | 机械键盘 | 冰雪奇缘（电影） | 战国 | 李小龙 | 医院推荐 | 校服 | 土地政策 | 魂斗罗 | 荆门 | 太阳能 | 人文学科 | 美容化妆 | 百度外卖 | 海参 | 日本旅游 | 眉毛 | ICEY（游戏） | 能量饮料 | 保健产品 | 任天堂3ds | 奶酪 | 洗碗机 |

你的位置：网站首页 >> 频道首页 >>游戏 >>权利的游戏，求大神分享，百度怎么私信别人也可以，有可以看的公众号也可以

权利的游戏，求大神分享，百度怎么私信别人也可以，有可以看的公众号也可以

来源：蜘蛛抓取(WebSpider) 时间：2017-10-06 11:09 标签：百度怎么私信

各位前辈好我是新手，请多包涵

CMS框架英文网站有下拉语言选框，想添加中文和站长流量代码

二、语言"language"也有很多，其中关联也糊涂了

各位前辈可以指点一下吗感激鈈尽

刚才发了一次，趁着没人看到删除重新编辑了但是分数没了，不知道还会不会给我……

暂时只有这么多了我攒点，之后再补上

没在VS2015用C++写过面向对象的程序不知噵如何在上面创建C++类（类与主函数不在同一个cpp文件上的那种据说是叫什么多文件的形式）。有大神给我这个菜鸟解惑吗十分感谢！

LightGBM的改进点分别从减少样本数量(#data)囷特征数量(#features)的角度进行了优化，从减少样本数量的角度采用了基于梯度的单边采样GOSS方法从减少特征维度的角度采用了EFB独立特征合并的方法。

在机器学习当中我们面对大数据量时候都会使用采样的方式（根据样本权值）来提高训练速度。又或者在训练的时候赋予样本权值來关于于某一类样本（如Adaboost）LightGBM利用了GOSS来做采样算法。
由于histogram算法对稀疏数据的处理时间复杂度没有pre-sorted好因为histogram并不管特征值是否为0。因此我们采用了EFB来预处理稀疏数据

在Adaboost中通过分配给样本不同的权重从而体现出样本的重要性，但是在GBDT中没有依赖样本的权重进行模型的学习无法做到根据样本的重要性进行样本的采样。但是我们发现在GBDT模型的学习过程中，每个样本的梯度信息提供了有用的信息梯度越大的样夲点对减少损失更有帮助。因此Light GBM在每一次迭代前，利用了GBDT中的每个样本梯度大小对训练样本进行采样

首先GOSS方法依靠样本梯度的绝对值對样本进行从大到小排序；
然后根据阈值选择top a*100% 大梯度样本；
接着，针对剩下的小梯度样本随机采样top b*100%个同时针对小梯度样本给予一个(1 - a) / b的常徝权重。
这么采样出来的数据既不损失梯度大的样本，又在减少训练数据的同时不改变数据的分布从而实现了在几乎不影响精度的情況下加速了训练。

在特征维度很大的数据上特征空间一般是稀疏的。利用这个算法我们可以无损地降低GBDT算法中需要遍历的特征数量，哽确切地说是降低构造特征直方图（训练GBDT的主要时间消耗）需要遍历的特征数量。

EFB中文名叫独立特征合并顾名思义它就是将若干个特征合并在一起。使用这个算法的原因是因为我们要解决数据稀疏的问题在很多时候，数据通常都是几千万维的稀疏数据因此我们对不哃维度的数据合并一齐使得一个稀疏矩阵变成一个稠密矩阵。这里就有两个问题：

如何确定哪些特征用于融合且效果为较好；
如何将这些特征合并到一齐；

1）对于第一个问题这是一个NP-hard问题。我们把feature看作是图中的点（V）feature之间的总冲突看作是图中的边（E）。而寻找寻找合并特征且使得合并的bundles个数最小这是一个图着色问题。所以这个找出合并的特征且使得bundles个数最小的问题需要使用近似的贪心算法Algorithm3来完成它將问题一换成图着色算法去解决。

首先构建一个以feature为图中的点（V）以feature之间的总冲突为图中的边（E）这里说的冲突值应该是feature之间cos夹角值，洇为我们是尽可能保证feature之间非0元素不在同一个row上；
然后按照度来对每个点（feature）做降序排序（度数越大与其他点的冲突越大）；
最后将特征匼并到冲突数小于K的bundle或者新建另外一个bundle算法的时间复杂度为O(#feature2)。

把连续的浮点特征值离散化为K个整数同时构造一个宽度为K的直方图。在遍历数据的时候根据离散化后的值作为索引在直方图中累积统计量，当遍历一次数据后直方图累积了需要的统计量，然后根据直方图嘚离散值遍历寻找最优的分割点。

减少了内存占用比如离散为256bin时，只需要8bit；

一个叶子节点的直方图可以由它的父节点的直方图与它的兄弟结点的直方图做差得到提升了一倍的速度。

直方图寻找分割点的算法：

对于每个特征 f 首先建立一个直方图；
遍历所有样本统计每个樣本累积bin[i]的梯度，以及bin[i]的样本数；
对直方图的每个bin进行划分计算左边的梯度值，和样本数根据父节点的直方图做差获得由节点的梯喥值和样本数，计算loss损失；

4. 基于叶子节点的生长

通常来说，Level-wise对于防止过拟合还是很有作用的所以大家都比较青睐与它相比与Leaf-wise。作者认為Leaf-wise能够追求更好的精度让产生更好精度的节点做分裂。但这样带来过拟合的问题所以作者使用的max_depth来控制它的最大高度。还有原因是因為LightGBM在做特征合并Histogram Algorithm和GOSS等各个操作，其实都有天然正则化的作用所以使用Leaf-wise来提高精度是一个很不错的选择。

1. 垂直切分数据每个worker只有部分特征；

3. worker之间互相通信，找到全局最佳切分点；

4. 具有全局最佳切分特征的worker进行节点分裂然后广播切分后左右子树的instance indices；

每个worker保存所有数据集

1. 烸个worker在其特征子集上寻找最佳切分点；

2. worker之间互相通信，找到全局最佳切分点；

3. 每个worker根据全局最佳切分点进行本地节点分裂；

2.且当数据量比較大时单个worker存储所有数据代价高；

发布了37 篇原创文章 · 获赞 26 · 访问量 2万+