9 天前 / 北鱼扶摇
点击卡片关注我们,更多技术干货,及时为您送达! 1. Snowflake 简介互联网快速发展的今天,分布式应用系统已经见怪不怪,在分布式系统中,我们需要各种各样的 ID,既然是 ID 那么必然是要保证全局唯一。 除此之外,不同的业务还需要不同的特性,比如像并发巨大的业务要求 ID 生成效率高,吞吐大;比如某些银行类业务,需要按每日日期制定交易流水号;又比如我们希望用户的 ID 是随机的,无序的,纯数字的,且位数长度是小于 10 位的,等等。
10 天前 / 冷星1024
前言 由一个案例延伸出算法在前端的运用。今日前端早读课文章由腾讯 @camdyzeng 授权分享。 @camdyzeng:腾讯 CSIG 前端开发高级工程师。团队主要致力于前端相关技术的研究和在腾讯业务的应用,团队内部每周有内部分享会,有兴趣的读者可以加入我们或者参与一起讨论。邮箱:[email protected]。 正文从这开始~~ 之前看到技术同学提问“刷算法题对实际工作有多大的作用呢?”,我觉得算法是有用的,所以就简短的回答了一下。
11 天前 / 博文视点Broadview
点击“博文视点 Broadview”,获取更多书讯 很多人都说背乘法表是他们教育经历中特别痛苦的一件事。问父母为什么要背乘法表,父母通常会说不背就不会做乘法。他们大错特错。 俄罗斯农夫乘法(Russian peasant multiplication, RPM)就是在不了解大部分乘法表的情况下进行大数相乘的方法。 这是一种算术方法,尽管它叫这个名字,但也可能是埃及人,或者与农民没什么关系。 RPM 的起源尚不清楚。
17 天前 / hyper0x
作者:郭必扬本文主要根据 cs224n 的 assignment2 的计算题和编程题进行一个总结回顾。我发现这份作业设计太棒了,循序渐进,有理论有实践,前后呼应,难度适中,整个的编排我觉得更像是一份详细的教程。所以这里我就从这些题目出发,来复习、思考 Word2Vec。本文的主要内容:使用「朴素 softmax」损失函数的 word2vec 使用「负采样」式损失函数的 word2vec 编程实现的细节 一些 Notationsskip-gram 的目标就是学习由中心词预测其上下文中某特定词的概率,o 就是 outside 的意思,c 就是 center 的意思。
18 天前 / hyper0x
本文转载自 |AI 科技评论 编译 |黄楠 最近,吴恩达在其创办的人工智能周讯《The Batch》上更新了一篇博文,总结了机器学习领域多个基础算法的历史溯源。 文章开头,吴恩达回忆他的研究历程中曾有一次抉择: 多年前,在一次项目中,选择算法时,他不得不在神经网络与决策树学习算法之间做选择。考虑到计算预算,他最终选择了神经网络,在很长的一段时间内弃用增强决策树。 这是一个错误的决定,「幸好我的团队很快修改了我的选择,项目才成功。」吴恩达谈道。 他由此感叹,不断学习与更新基础知识是十分重要的。
26 天前 / hyper0x
NLP,自然语言处理就是用计算机来分析和生成自然语言(文本、语音),目的是让人类可以用自然语言形式跟计算机系统进行人机交互,从而更便捷、有效地进行信息管理。 NLP 是人工智能领域历史较为悠久的领域,但由于语言的复杂性(语言表达多样性 / 歧义 / 模糊等等),如今的发展及收效相对缓慢。比尔·盖茨曾说过,"NLP 是 AI 皇冠上的明珠。" 在光鲜绚丽的同时,却可望而不可及(...)。 为了揭开 NLP 的神秘面纱,本文接下来会梳理下 NLP 流程、主要任务及算法,并最终落到实际 NLP 项目(经典的文本分类任务的实战)。
29 天前 / hyper0x
日常笔面试中,常见考点举例:XGBoost 原理是什么?XGBoost 如何处理缺失值?XGBoost 如何避免过拟合?本文着重介绍 算法原理 + 高频笔面试题 温馨提示: 时间紧急的朋友可重点掌握原理 + 笔面试真题部分时间充裕的 建议对照本文讲解,进一步了解推导部分。 ------ 正文手动分割线 ------ 本文结构速览:一、XGBoost 原理介绍二、目标函数1、损失函数 2、树的复杂度 三、模型训练 四、常见笔面试真题 一、XGBoost 原理介绍 之前介绍过决策树,那么 XGBoost 和决策树有啥关系呢?Xgoost 可以简单的理解为一堆的 Cart 树。
36 天前 / 逗逗
作者 | 袁易之编辑 | 蔡芳芳信息流业务背景介绍信息流业务基本上伴随着互联网的诞生一起同步发展,不断为互联网用户提供信息来源,从而促进了门户网站的快速发展,比如腾讯网、搜狐、新浪等。 早期大部分的门户网站都是按照专题频道等划分,通过专业的人工编辑来维护信息的更新,所有人在同一时刻看到的门户新闻都是一样的。 而随着信息的爆炸,互联网上源源不断生产出海量内容,通过人工的方式已经很难去维护和更新。除此之外,随着互联网的用户爆发性的增长,每个用户对信息的喜好亦有所不同,这就导致了千人一面的门户网站难以满足用户的需求。
37 天前 / sjf0115
在《Redis 数据缓存满了怎么办?》我们知道 Redis 缓存满了之后能通过淘汰策略删除数据腾出空间给新数据。 淘汰策略如下所示: redis 内存淘汰设置过期时间的 key volatile-ttl、volatile-random、volatile-lru、volatile-lfu 这四种策略淘汰的数据范围是设置了过期时间的数据。 所有的 key allkeys-lru、allkeys-random、allkeys-lfu 这三种淘汰策略无论这些键值对是否设置了过期时间,当内存不足都会进行淘汰。 这就意味着,即使它的过期时间还没到,也会被删除。当然,如果已经过了过期时间,即使没有被淘汰策略选中,也会被删除。
42 天前 / 逗逗
分享嘉宾:苗大东 京东 算法工程师 编辑整理:吴祺尧加州大学圣地亚哥分校 出品平台:DataFunTalk 导读:电商场景的搜索排序算法根据用户搜索请求,经过召回、粗排、精排、重排与混排等模块将最终的结果呈现给用户,算法的优化目标是提升用户转化。传统的有监督训练方式,每一步迭代的过程中优化当前排序结果的即时反馈收益。但是,实际上用户和搜索系统之间不断交互,用户状态也在不断变化,每一次交互后排序结果和用户反馈也会对后续排序产生影响。因此,我们通过强化学习来建模用户和搜索系统之间的交互过程,优化长期累积收益。
49 天前 / 劼哥stone
前言 博主是工业互联网行码农一枚,虽然不是算法工程师和自动化方向的,但经常参加同事介绍控制算法原理的培训,慢慢的对小部分控制算法有一定了解,其中使用频率最高的控制算法非 PID 莫属。很多同学在学习 PID 的时候,会被繁杂的数学公式吓倒,今天我们就抛开数学公式,用逻辑和例子给大家讲明白“到底什么是 PID”? PID 算法简介 PID 是一种控制算法,是 Proportional(比例)、Integral(积分)、Differential(微分)的缩写。它是连续系统中技术最为成熟、应用最为广泛的一种控制算法。
59 天前 / 布客说
本篇将对之前所述的 AES 算法基于 PHP 语言做实战讲解,由于 ECB 工作模式相对其他工作模式安全性低(不推荐使用),本文将不对其进行展示,如在工作中确实需要使用,请自行实现。 由于篇幅限制,所有的演示代码将只展示关键步骤,如果想要直接上手使用,请移步:https://github.com/aurthurxlc/php-utils 。 本示例仅演示了 PHP7+ 的加密解密方式,PHP 5.6 及以下请参考理论知识自行查找相关函数实现。 PHP7+ AES 加解密要点使用 openssl_encrypt() 函数实现加密,官方文档地址:https://www.php.net/manual/zh/function.openssl-encrypt.php 使用 openss...
61 天前 / hyper0x
文 | 局长 出品 | OSC 开源社区(ID:oschina2013)根据 Go 的 commit 记录,其计划在下一个版本使用知名快速排序算法——pdqsort。从提交信息来看,这个 commit 的作者是来自字节跳动的员工,开发者在 commit 中对 pdqsort 算法进行了如下的介绍: 在所有基准测试中,pdqsort 从未明显慢于以前的算法 在常见模式中,pdqsort 通常更快(即在排序切片中快 10 倍) pdqsort 是 Pattern-defeating quicksort 的缩写,是一种新型的排序算法,将随机快速排序的快速平均情况与堆排序的最坏情况快速组合在一起,同时在具有特定模式的输入上实现了线性时间。
63 天前 / 开发者头条
今天,Twitter 官宣了:该公司已与埃隆·马斯克全资拥有的一家实体达成了最终协议。 根据协议,马斯克以每股 54.20 美元的现金收购 Twitter,交易价值约为 440 亿美元。交易完成后,Twitter 将成为一家私人控股公司。 消息一出,不知道是不是受之前老马所说的「收购 Twitter 意在开源算法」的影响。 Twitter 在其官方 GitHub 仓库里添加了一个叫做「the-algorithm」的项目,虽然这个项目仅仅是一个连 README 都没有的「空项目」。
64 天前 / rainNight
对于算法的理解、可以看成解决问题的过程和方式、无论算法的好坏,它都是一个独立的个体。在众多算法中,排序算法是经常被用到,或者在以往的生活或者面试当中会被提到的,所以理解和学会排序算法是非常重要的。 还记得上小学的时候,老师会叫我们按照身高高低,进行低的在前高的在后的原则、进行排队放学回家。那么大家思考下,如何排队是最有效的呢?! 首先,我们第一个想到的是什么呢?从第一个学生开始以此与相邻的学生进行比较,如果右边学生的身高大于左边的,就把右边的学生和左边的学生的位置调换,反之不交换位置。他的思维大概是这样的。