读芯术 读芯术 / 6 天前

[译] 缺失数据别怕!这里有份强大的初学者指南

全文共4898字,预计学习时长10分钟 实际上,数据科学家80%到90%的工作是数据清理,而这项工作的目的是为了执行其余10%的机器学习任务。没有什么比完成数据集分析后的收获更让人兴奋的了。如何减少清理数据的时间?如何为至关重要的10%的工作保留精力? 根据很多专业人士的经验,对数据清理涉及的过程有充分的认知总是好的。了解流程、流程的重要性以及流程中可使用的技巧,将减少执......

机器学习 数据

mr7 mr7 / 6 天前

千亿级的数据难题,优酷工程师怎么解决?

优酷一天的日志量会达到千亿级别,面对如此大的数据样本,2017年5月,优酷完成了从Hadoop迁移到阿里云MaxCompute,实现计算消耗和储存的消耗呈下降趋势,得到了非常大的收益。阿里数据技术专家门德亮给大家做个分享,从为什么要用MaxCompute,到优酷的业务场景下典型的方案及应用分析,聊聊迁移后对业务及平台的具体价值。 大家好,我是门德亮,很荣幸,我正好见证了优酷从没有MaxCompute到有的,这样一个历......

数据 架构 优酷

hyper0x hyper0x / 7 天前

DL 时代的代码补全利器,北大出品,效果远超语言模型

点击上方“Python数据科学”,选择“星标”公众号重磅干货,第一时间送达作者:思源、一鸣转自:机器之心从程序员到数据工程师,编写程序代码是一项基本功,但是编写冗长代码的过程也极大地消耗了开发者的耐心。近来,有不少关于代码补全工具的消息爆出,例如,来自美国的 Kite,来自加拿大的 TabNine 等,一时间获得了不少程序员的关注。但其实很多人还并不知道,在这些国外产品不断被媒体推送的背后,有一......

深度学习 aiXcoder 代码补全

一猿小讲 一猿小讲 / 7 天前

人生靠反省,Java 靠泛型

【这是一猿小讲的第42篇原创分享】 昨天有同事问 UserService、XxxService 都会调用 Dao 的 insert、update ... ...,这些重复的代码,有没有办法变得灵活一些? 巧了,和咱们分享的主题刚好碰上,卖个关子,先不谈解决方案,就当啥事没有发生,重新引入今天的话题(捂嘴笑)。 想蜕变的研发人员,偶尔会品味一下 Java 的源码;久经职场的码农,时不时也会搭建一下项目架构。其实无论你是刚入......

Java 泛型

力扣LeetCode 力扣LeetCode / 7 天前

阿里面试题:Nginx 所使用的 epoll 模型是什么?

点击上方蓝字关注我们 下面开始今天的学习~ 对于 Nginx,相信有过 Web 服务部署经验的同学都不陌生,它有以下特点: 是一个高性能的 HTTP 和反向代理服务器,也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 相较于 Apache 具有占有内存少,稳定性高等优势,并且依靠并发能力强,丰富的模块库以及友好灵活的配置而闻名。 Nginx 目前部署量逐渐增加,大多数运维人员多多少少都懂点 Nginx,但是真正其明白......

Nginx 阿里 面试题 epoll

编程一生 编程一生 / 7 天前

线上问题排查的四类方法

最正统的方法 日志 这是排查问题的最常用的方法,需要预估自己每日日志量和需要存储的日志时间。申请磁盘空间时一般会留35%的冗余以备突发流量。 一般需要打日志的有:每个对外提供方法的入口和出口,调用第三方的调用前和调用后。打印内容主要包括入参和出参。https://github.com/xiexiaojing/concise-logger 我在简明日志规范里定义:几种常用的类里用切面的形式注入日志。 监控 传统的方法如果JV......

Java

Hollis Hollis / 7 天前

我说我精通字符串,面试官竟然问我 Java 中的 String 有没有长度限制

String是Java中很重要的一个数据类型,除了基本数据类型以外,String是被使用的最广泛的了,但是,关于String,其实还是有很多东西容易被忽略的。 就如本文我们要讨论的问题:Java中的String有没有长度限制? 这个问题要分两个阶段看,分别是编译期和运行期。不同的时期限制不一样。 1 编译期 首先,我们先来合理的推断一下,当我们在代码中使用String s = "";的形式来定义String对象的时候,""中字符的个......

Java 字符串 String 面试官

AIOps智能运维 AIOps智能运维 / 7 天前

Pythonic:Python 修炼之道

作者简介 金海飞 百度高级研发工程师 负责百度智能运维产品(Noah)基础组件的设计研发工作,在程序部署、数据传输方面有广泛的实践经验。 干货概览 作为一个码农,大家一定会有阅读祖传代码的经历。由于“快功出粗活”,很多人写代码就是一把“梭”,最终码农们互相吐槽,冤冤相报,导致一个业务系统代码可读性越来越差,越来越难以维护。 为了让码农们的头发少掉一些,我们需要从自身做起......

Python

网易云 网易云 / 7 天前

如何建设中台?中台建设的组织、支撑技术和方法论

编者按:本文转载自网易副总裁,网易杭州研究院执行院长汪源的个人公众号“冷技术热思考”(欢迎搜索关注)。上一篇中台系列的文章重点阐述了中台的概念,本文是系列文章的第二篇,目的是说明什么情况下可以考虑建设中台,如果要建怎么建的问题,可以作为企业思考中台建设的大框架。以下为原文(有少量改动): 本文将例举典型的需要建设中台的场景,供参考判断要不要建中台。建设中台需要考虑组织、技术支撑......

架构 组织 中台 方法论

为了减少您的阅读压力,首页仅提供最新的 10 页文章列表,如需查阅更多内容请点击对应的文章标签。

Top