推广 热搜: 广场  Java  app  Word  营业  微信公众号  北京代理记账  商城  代理记账  商标交易 

cross validation 用哪个模型 xgboost中哪些特征可以归一化?

   2023-05-05 企业服务招财猫40
核心提示:xgboost中哪些特征可以归一化?短语参数的命名规则。现在xgboosts模块。在这个模块中,命名规则与skl:基本上用的是gbtr:多线程,如果没有设置,算自动检查并行计算的核心数量。2.助推器参

xgboost中哪些特征可以归一化?

短语参数的命名规则。现在xgboosts模块。在这个模块中,命名规则与skl:基本上用的是gbtr:多线程,如果没有设置,算自动检查并行计算的核心数量。

2.助推器参数

η(学习rat:学习率0.01-0.2。

min_chil:子节点的最低权重和。防止高的时候过贴,低的时候容易欠贴。

Max_d:损失阈值,当损失降低超过该阈值时,分割将继续。

最大增量步长:在最大增量步长中,我们允许每个树的权重估计为。

在subsampl:,当构建0.5-1中的每棵树时,为了避免过拟合,只取一部分样本进行构建。

colsampl:[0.5-1]特征采样

Colsampl:L2正则化$T:L1正则项

秤_位置_重量

3.训练参数

客观二分类使用binary:logistic多分类使用multi:softmax直接返回标签,也可以使用multi:softbob或predict_prob训练后输出类别的概率。

eval_metric:用它来评估。估计验证数据:RMSE,平均误差,对数损失,误差,对数损失,auc。

4.XGBoost允许在每次boosting迭代中使用交叉验证。因此,可以方便地获得最佳的升压迭代次数。而如果用sklearn的kfold和cross_val_score,这就是每个模型训练只用一个固定数据,而不是每轮boosting都要交叉校验。

5.关于特色工程

XGBOOST是树的增强模型。由于树的非线性特征,我们不不需要标准化(正态分布)或缩放(到01区间)特征。

或者拿log(这个存疑,我个人觉得拿log可能有用?),但我们应该关注的是创造特色。

比如过去五天的平均值,去年同期的数值,环比增加,同比增长。比如租房的场景,房租/卧室数量这些和业务非常相关的东西,其实是需要不断摸索才能找到的。XGBOOSTcan不能帮助我们获得这些特性。

与深度学习相比,深度学习本质上依赖于特殊的结构,如LSTM和CNN,来获得适合于这项业务的特征。

那么分类功能在XGBOOST中并不是特别有用,如果相关性不是很大可以去掉。如果类别不多,比如只有个位数的类别,可以添加。如果类别很多,可以考虑使用CATBOOSTING或者LIGHTGBM。

采购员的岗位职责,英文版?

R:

进行战略性采购

-协助团队领导建立采购预算、商品策略和运营计划。

-研究采购营销,推荐新的潜在供应商支持买家

本地化协调

-负责本地化开发,并针对项目指导提供跨职能支持

-与采购/SDE/采购团队合作跟踪所有开发零件的过程,包括所有验证阶段

-与内部部门合作,协调和推进新的本地化流程

-本地化FAI跟踪列表,推动新的本地化流程

产品视图计算(面向项目)

-定期创建MLL零件清单,并用Fico数据更新采购价格

 
反对 0举报 0 收藏 0 打赏 0评论 0
 
更多>同类资讯
推荐图文
推荐资讯
点击排行
合作伙伴
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  冀ICP备2023006999号-8