第 2 页 / 10 页

hyper0x hyper0x / 11 小时前

一文读懂 CatBoost 算法原理(附代码)

一、背景 我们来看看与 XGBoost 和 LightGBM 并列为数据挖掘类比赛三大杀器中的 CatBoost [1]。作为“后浪” (2017 年代码开源,2018 年论文发表),CatBoost 解决了预测偏移 (Prediction Shift)。那什么是预测偏移?预测偏移发生在哪里?别急,往下看就知道了。 1. 什么是预测偏移? 在 GBDT 一类模型中,弱学习器模型均在同一完整训练集上训练,然后不断提升成强学习器,但如果训练集和测试集存在分布不一致...

算法 代码 CatBoost

BloomingRose BloomingRose / 11 小时前

分库分表实战之一叶知秋:图览分库分表外卖订单项目

「关注“石杉的架构笔记”,大厂架构经验倾囊相授」 “从零开始带你成为 JVM 实战高手” 免费加餐啦!点击查看 专栏目录 导读 |儒猿技术团队将在“石杉的架构笔记”、“狸猫技术窝”、B 站:”儒猿架构“以连载的形式(图文 / 视频)为读者送出最新制作的“基于 ShardingSphere 的分库分表实战”(免费)中的部分内容,希望和读者朋友一起探究业务发展中的问题,特别是数据库的性能瓶颈问题。希望各位读者朋友喜欢。

项目 订单 分库分表 外卖 实战

豌豆花下猫 豌豆花下猫 / 14 小时前

Python 为什么不设计 do-while 循环结构?

△点击上方“Python 猫”关注 ,回复“1”领取电子书 作者:豌豆花下猫来源:Python 猫在某些编程语言中,例如 C/C++、C#、PHP、Java、JavaScript 等等,do-while 是一种基本的循环结构。 它的核心语义是:先执行一遍循环体代码,然后执行一遍条件语句,若条件语句判断为真,则继续执行循环体代码,并再次执行条件语句;直到条件语句判断为假,则跳出循环结构。

Python 设计 循环 DO

博文视点Broadview 博文视点Broadview / 14 小时前

做数据分析已经会 Excel 了,还要学 Python 吗?

【以下文章来源于 CDA 数据分析师 ,作者张俊红】 Hello 大家好,我是“对比 Excel”系列畅销书作者张俊红。 今天我给大家做一些关于我个人的分享,希望对大家的成长能够有所帮助。 我叫张俊红,目前在一家互联网公司从事数据分析相关的工作。在工作之余,我个人会写一些公众号文章,还会写数据分析相关的书籍,比如说我最近新出的这本对《对比 Excel,轻松学习 Python 报表自动化》...

Python 数据分析 Excel

开发者头条 开发者头条 / 14 小时前

抖音生猛,张小龙以退为进;30 天 JS 编程挑战;解读 Go 语言的 2021——码农周刊 VIP 会员专属邮件周报 Vol.077

以下内容节选自「码农周刊 VIP 会员专属邮件周报 Vol.077」,查看完整链接版请点击「阅读原文」。 互联网广告的葬礼 https://mp.weixin.qq.com/s/gIwZfGiHtNM3B1fXZRO5dA “泡沫以肉眼可见的速度消失,身在其中的落差感确实很大。这要搁在两三年前,互联网的钱就像大风刮来似的,几十万的预算稀松平常,几百万的预算才能叫做重点项目。

Go 编程 码农周刊 JS IP 周报 张小龙 邮件 语言 抖音 会员 V

sjf0115 sjf0115 / 14 小时前

弃用 Lambda,Twitter 启用 Kafka 和数据流新架构

作者 | Lu Zhang、Chukwudiuto Malife 译者 | Sambodhi 策划 | 闫园园 在 Twitter 上,我们每天都要实时处理大约 4000 亿个事件,生成 PB 级的数据。我们使用的数据的事件源多种多样,来自不同的平台和存储系统,例如 Hadoop、Vertica、Manhattan 分布式数据库、Kafka、Twitter Eventbus、GCS、BigQuery 和 PubSub。

架构 Lambda Kafka Twitter 数据流

冷星1024 冷星1024 / 14 小时前

前端领域的 “干净架构”

大家好,我是 ConardLi,前端有架构吗?这可能是很多人心里的疑惑,因为在实际业务开发里我们很少为前端去设计标准规范的代码架构,可能更多的去关注的是工程化、目录层级、以及业务代码的实现。 今天我们来看一种前端架构的模式,原作者称它为“干净架构(Clean Architecture)”,文章很长,讲的也很详细,我花了很长时间去读完了它,看完很有收获,翻译给大家,文中也融入了很多我自己的思考,推荐大家看完。

前端 架构

编程一生 编程一生 / 14 小时前

Spring Kafka 的 bug 导致超时问题

背景 这是我们团队负责的一个不太核心的服务。之前与外部交互时应外部要求由普通 kafka 集群改成加密 kafka 集群。我们是数据生产端。 改的过程中并跑上线,60% 的请求耗时增加了 2 倍,也还是在百毫秒的量级可以接受。但是每次重启的第一个请求要 5s 以上,会超过;运行过程中,一两个月也会有一次超时。因为我们有三次重试,整体没有影响成功率。 上线的时候我们问过网络组,还专门请教过公司专业负责 kafka 的团队。

bug Kafka Spring 超时 问题

虞大胆 虞大胆 / 14 小时前

新一代消息队列 Pulsar

作者:joylei,腾讯 PCG 后台开发工程师 在信息流场景,内容的请求处理、原子模块调度、结果的分发等至关重要,直接影响到内容的外显、推荐、排序等。基于消息 100% 成功的要求,我们团队对 Pulsar 进行了调研,并采用腾讯云的 TDMQ(Pulsar 版)实现消息的可靠处理。本文主要参考 Pulsar 的官方文档和技术文章,对 Pulsar 的特性、机制、原理等进行整理总结。

消息队列 Pulsar

逗逗 逗逗 / 14 小时前

如何使用 Prometheus 和 Grafana 优雅的实现服务器可视化

1Prometheus 简介 Prometheus 是一个开源监控工具,实现了高维数据模型。Prometheus 有多种数据可视化模式,其中一种是集成 Grafana。Prometheus 以高效的自定义格式将时间序列数据存储在内存和本地磁盘上。 Prometheus 有许多客户端可用于轻松监控服务,也可以轻松创建自定义客户端。每台服务器的可靠性都是独立的,仅依赖本地存储。用 Golang 编程语言编写,所有二进制文件都是静态链接的,易于部署。

服务器 可视化 Prometheus Grafana

为了减少您的阅读压力,首页仅提供最新的 10 页文章列表,如需查阅更多内容请点击对应的文章标签。

Top