5 天前 / lxneng
点击上方"云祁 QI"关注,星标或置顶一起成长前言大家好,我是云祁! 今天分享一篇淘系大佬关于未来数据开发技术方向的文章,不能一昧埋头赶路,远方的风景值得一瞻 关于未来数据开发技术方向,我认为有三个,首先是流批一体成为主流开发模式,其次是代码自动化技术走向成熟,第三是 OLAP Cubes 终将衰落。 一、流批一体成为主流开发模式先说说我看到的数据开发的历史。 “远古”时代,通过写 SQL 脚本抽取 OLTP 数据库中数据进行分析和统计,大量查询有可能把数据库拖挂;OLAP 分析成为数据库的一项重要能力,这个时候,可以写 SQL...
25 天前 / 知了一笑
一、基础思维数据在现在互联网的行业中可以说是最核心的话题,数据的价值已经被称为资产了,大部分的互联网应用都会源源不断的产生各种数据,如何管理和使用这些数据,让这些看似平常的数据产生更大的价值,一直是热门的探索领域。比如常见的风控、营销、推广等各种业务,都需要依赖大量的用户行为数据作为依赖,才能精准的对相关流程做出分析判断。 数据管理是一项复杂而且庞大的工程,需要付出的时间和成本非常高,通常的说法就是对用户有效的数据进行采集,存储,分析,组建业务模型,二次业务应用,以此让数据发挥更大的价值。
32 天前 / u550266
科创大咖们的成长心路 — 文| babayage 编辑 | 笑 笑 恐惧于一眼到底的人生放弃教职加入微软 2005 年,谢映莲完成卡内基梅隆计算机专业的博士学位,开始纠结于未来选择。卡内基梅隆位于美国匹兹堡,是计算机工业最初的推动者之一,计算机专业排名高居全美第二。有别于硅谷“技术创新 + 商业模式 + 金融资本”构成的自由氛围,匹兹堡的空气中弥漫着 Old-School 的保守醇香,“留在学界获得教职是更被尊敬的选择,不能留在学校的人才会考虑进入工业界。
34 天前 / hyper0x
热力图是网站、H5、APP 运营的分析利器,可帮助产品经理分析用户行为。 热力图帮助我们深入了解用户在页面上的操作习惯和行为路径,并指导产品经理对产品进行用户体验优化,进而提升网站的转化效果。 而热力图分析是数据分析的重要手段之一。如何进行热力图分析,是数据产品经理工作中的重中之重。 1.了解热力图 热力图通过记录用户在网站或 APP 的点击与浏览行为,并通过热力图的形式展现出来。 简而言之,热力图就是将用户行为可视化展示。
43 天前 / 数据虫巢
作者·黄崇远 『数据虫巢』 全文共 4800 字 题图 ssyer.com “计算广告,从多方博弈以及发展历程的角度看,其本质是 ROI 的平衡;但从商业角度的看,本质是信息差的利用。” 已经有半年未更新这个系列了,一方面是下半年厂里赶着上一些核心的项目,正事要紧;另一方面是想沉下心来思考,看看能不能把整个广告的知识体系做的更加完善一些,查缺补漏,最终形成相对偏严肃性的内容输出。 而这一篇也算是整体体系中的一篇,也是之前没有涉及的内容(有点遗憾的是目前公众号这个系列编号其实是有点杂乱了,没有分门类别,更多是想到了一块补充一块的内容...
98 天前 / 秦夏
这是《数据平台服务化建设》系列的第 3 篇,预计会写 10 篇左右。通过这个系列,我希望和大家分享下数据平台怎么去做服务化建设。扫描文末二维码,关注公众号,不再错过精彩。也欢迎转发朋友圈分享给更多人。 这个系列的前面几篇文章,我们分享了一些总体思路和前置设计。接下来,就到了具体的服务化产品了。 毋庸赘言,数据平台的目的,是为了让大家更方便地存储和使用数据。而要使用数据,就必须先了解数据。 数据地图,就是我们用来了解数据的服务化建设成果。
177 天前 / 秦夏
这是《数据平台服务化建设》系列的第 2 篇,预计会写 10 篇左右。通过这个系列,我希望和大家分享下数据平台怎么去做服务化建设。扫描文末二维码,关注公众号,不再错过精彩。也欢迎转发朋友圈分享给更多人。 数据平台包含的模块和组件特别多,相关硬件资源又往往由于共用而显得紧张,再加上数据又是及其重要的资产,必然就会有很多需要申请权限的场合。 草创之初,大家都会直接钉钉 / 微信找管理员,或者发邮件走走流程。 而具体流程是什么样,即使有文档和规范写清楚,往往也很难执行准确。
182 天前 / 数据虫巢
作者·黄崇远 公众号 『数据虫巢』 全文 8968 字 题图 ssyer.com “人不够,系统给你凑。” 这个系列上一篇《数据与广告系列二十一:关于品牌广告,奔涌吧后浪》是五月底,这两个月时间倒不是停止了学习和前进,一直在进步从未停止过,只是确实没有通过公众号对外输出了,有点分身乏术。 一方面半年年关,项目要收尾,项目要回收数据,衡量产出,毕竟干了大半年不能当做白干。 另一方面新的半年开始,要做半年项目规划,前半年都熬过去了,可不能折在下半年。 性命(奖金)攸关,可不能大意。
214 天前 / 秦夏
这是《数据平台服务化建设》系列的引子,预计会写 10 篇左右。通过这个系列,我希望和大家分享下数据平台怎么去做服务化建设。扫描文末二维码,关注公众号,不再错过精彩。也欢迎转发朋友圈分享给更多人。 数据平台对一个以数据为核心资产的公司来说,实在太重要了。但作为基础设施技术部门,却很容易变成纯运维部门。 不是说运维不好,但是没有人会否定,纯运维部门,是得不到公司和合作部门的重视的,自己也很难有足够的成就感和回报。 要想找出路,服务化建设是不二选择。 这么说,不是要没事硬找事做,也不是奔着为了显得自己重要而去做。
236 天前 / xF0rk
我是正阳,很高兴能够通过文字认识你 考察一个人的判断力,主要考察他信息来源的多样性。无数的可怜人,长期生活在单一的信息里,而且是一种完全被扭曲、颠倒的信息,这是导致人们愚昧且自信的最大原因。 ——阿玛蒂亚。森(诺奖得主) 说明传统金融的风控主要利用了信用属性强大的金融数据,一般采用 20 个维度左右的数据,利用评分来识别客户的还款能力和还款意愿。信用相关程度强的数据维度大概在十个左右,包含年龄、职业、收入、学历、工作单位、借贷情况、房产,汽车、单位、还贷记录等;而互联网金融公司在利用大数据进行风控的同时...
244 天前 / Ccww
欢迎关注公众号【Ccww 技术博客】,原创技术文章第一时间推出前言 在 Oracle 数据库中,我们通常在不同数据库的表间记录进行复制或迁移时会用以下几种方法: A 表记录利用 toad 或者 pl/sql 工具将其导出为一条条分号隔开的 insert 语句,然后再执行插入到 B 表中 建立数据库间的 dblink,然后使用 create table B as select * from A@dblink where...,或者 insert into B select * from A@dblink where... exp/expdp A 表,再 imp/impdp 到 B 表 那么除了上面的三种常用的方法,还有其他比较好的方法进行数据迁移吗...
246 天前 / 数据虫巢
作者·黄崇远 公号『数据虫巢』 全文 6378 字 题图 ssyer.com “看似大愚实为大智的品牌广告。” 哪怕是广告行业从合约时代稳定的步入到效果广告时代,甚至是现在已经逐步的往保成本的 oCPX 广告形态转换,品牌广告依然存在,并且还将会一直存在下去。 经久而不衰! 01 滚滚长江东逝水 滚滚长江东逝水,浪花淘尽英雄。 是的,关于品牌广告,我们从这个“浪”开始讲起。 前几天,朋友圈一则视频刷爆了,那就是 B 站联合何冰老师制作的“后韭菜”,不对,是“后浪”。 言称,借着五四青年时节,送给新一代的人们,额,说的好像就是我。
252 天前 / 数据虫巢
作者·黄崇远 『数据虫巢』 全文共 3681 字 题图 ssyer.com “人口买卖的时代终究会过去的。” 这个系列上一篇是《数据与广告系列十九:推荐召回与广告 LookAlike,万物皆可 Embedding》,时间是 3 月中旬,不觉时间又过了 2 个月,从开始写这个系列都快一年了。 中间隔了几篇写个小朋友们的(初学者系列),今天我胡汉三又回来了。 今天要聊的广告话题是一个非常应景的话题,也非常时髦的话题,那就是在全民 oCPX 的大趋势下,常规定向模式该何去何从。
264 天前 / sjf0115
漫谈数据治理之二:思想上的体系化数据的滚雪球效应现代数仓体系中,数据数量的高速增长已经不是什么新鲜事了,在大数据的作用被业界所认知到后,几乎所有对于业务有价值的行为,都将以数据的形式被收集。虽然这些数据很有价值,但在体现数据的价值之前,数据存储的成本已经扛不住了。据可靠统计,大公司每年数据的存储量以 60% 的速度在增长,5 年后业界的数据规模就将达到今天的 10 倍,数据的滚雪球效应正在体现。
273 天前 / 技术小黑屋
能有什么用我们举一个简单的例子(非全部示例)来描述cut有什么用,可以做什么 简洁输出,去除干扰冗余信息比如这个日志,可能会出现折行,另外假设04-19 18:26:55.605 22750 22883 W这些列的信息属于干扰信息 12345678910111213141504-19 18:26:55.605 22750 22883 W System.err: java.lang.NoSuchFieldException04-19 18:26:55.605 22750 22883 W System.err: at com.xiaomi.push.au.a(Unknown Source:16)04-19 18:26:55.605 22750 22883 W System.err: at com.xiaomi.push.au.a(Unknown Source:4)04-19 18:26:55.605 22750 22883 W System.err: at...