当前位置: 首页 > news >正文

网页打不开但是有网什么原因无法显示此网页/百度seo工作室

网页打不开但是有网什么原因无法显示此网页,百度seo工作室,阿里云网站建设步骤,六安哪家公司做网站好CatBoost(CategoricalBoosting)是专门用于处理类别特征的Boosting框架 一、目标变量排序 类别特征在结构化数据集中非常常见,如性别(男、女)、学历(本科、硕士、博士)等,对于这类数据,直接采样对类别特征进行编码,有多少类别取值就…

CatBoost(Categorical+Boosting)是专门用于处理类别特征的Boosting框架

一、目标变量排序

类别特征在结构化数据集中非常常见,如性别(男、女)、学历(本科、硕士、博士)等,对于这类数据,直接采样对类别特征进行编码,有多少类别取值就映射多少数值,这种直接的编码方式称为硬编码。除了这种编码方式外,one-hot编码也非常高效,但是对于特征类别数目特别多的情况下,该编码容易出现大量冗余特征(一个特征有50个类别值,那么就会产生50个稀疏特征),对于这种情况的优化方式,可以选择对类别数目重新归类将其降低到较少数目时,再进行one-hot编码。除了编码和one-hot编码外,另外一种方式则是目标变量统计(Target Statistics,TS),其核心思想是通过目标变量的统计信息来编码类别特征,从而提升机器学习模型的性能。具体例子如用户ID这一类别特征,可以使用历史点击率(目标变量)的均值代替原始ID值,这种方法的适用场景为存在明显类别分布差异的数据,是的其通过目标变量的计算均值能尽可能的将其类别特征区分开来。具体理解:比如对于学历这一特征中的本科生、研究生、博士生进行数目统计求其均值(或者可以使用多个特征进行计算对其进行标识,比如:总人数这一特征,购买人数这一特征,编码值=购买人数/总人数),来实现对其特征类别的区分的标识。所以可以看出这种方法可以对多个特征进行统一编码。但是容易出现一个问题,就是在对数据进行划分的过程中,即训练集和测试集(希望数据划分中尽可能不改变数据分布),其训练集和测试集的数据分布不同,造成条件偏移,故为了避免这个问题,故使用一个先验项用于减少噪声和低频类型数据受数据分布的影响(如果不加先验项的话容易很好的拟合训练集数据,对测试数据的拟合效果就不好,这样就容易出现过拟合,故一般都需要加上先验项),其具体加上先验项的公式如下:

不加先验项的公式如下:

二、排序提升算法

由于训练样本的分布与测试样本的分布存在偏移,故CatBoost来实现排序提升解决预测偏移的问题

CatBoost算法已经在封装好了,可以直接在pycharm中通过pip insatll catboost进行安装使用。你只需要知道CatBoost是专门用于高效处理类别特征的梯度提升模型即可。

http://www.whsansanxincailiao.cn/news/31948698.html

相关文章:

  • 网站后台账号密码忘记了怎么办/北京做网络优化的公司
  • 没有网站可以做app吗/百度站长工具seo查询
  • wordpress图片延迟/商丘关键词优化推广
  • 一家专做土特产的网站/网络营销课程
  • 中国网站排名 优帮云/百度站长平台官网
  • 网站优化具体是怎么做的/百度提交工具
  • 学做网站要学什么/数据网站
  • 谷歌有做网站建设/网络营销的作用
  • wordpress關閉評論/宝鸡seo外包公司
  • 网站模板源码下载网/seo免费培训教程
  • 广州做网站建设哪家专业/网站流量查询网站统计查询
  • 好的品牌设计网站/桔子seo网
  • 做网站唐山/网站技术外包公司
  • 做游戏的php网站/长沙网络科技有限公司
  • 宜都网站设计/百度小说app下载
  • 销售网站建设公司/html简单网页代码
  • 网站建设有哪些困难/b2b平台有哪些
  • 网站后台怎么上传图片产品/网络推广员工作内容
  • php做网站视频/必应搜索网站
  • 龙华做网站天无涯网络/天津seo网络
  • 做网站 做好把我踢开/苏州百度推广开户
  • 做招聘的网站有哪些/色盲眼镜
  • 淄博网站建设公司/大数据培训
  • 深圳市建设行业门户网站/朋友圈营销
  • 哪个网站做头像比较好/网络营销有哪些方式
  • 公司网页网站建设ppt模板/网站优化排名查询
  • 网站如何做好用户体验/徐州seo管理
  • 阿里云快速建站教程/谷歌浏览器网页版进入
  • 企业做网站建设/如何创建自己的个人网站
  • 石家庄市住房和建设局网站/平台seo什么意思