14 天前 / 读芯术
全文共2446字,预计学习时长5分钟 来源:Pexels “概率是生命的向导。” ——列纳德·蒙洛迪诺, 《醉汉的脚步:随机性如何支配我们的生活》 首先,确保你想戏弄的人真的聪明。 其次,提的问题需直观易懂。 事实上,在互联网领域,仍存争议的严谨话题所剩无几(因为有谷歌和维基百科)。 但今天笔者要讨论的是过去几年在互联网上引起激烈讨论的话题。科学专家和数据科学家在这一问题上各有看法。 事不宜迟,现在开始吧。 先来看问题 列纳德·蒙洛迪诺是一名物理学家,他与斯蒂芬·霍金合......
51 天前 / openio
选自towardsdatascience 作者:Rebecca Vickery 机器之心编译 参与:魔王 如何通过免费方式学习数据科学?数据科学家 Rebecca Vickery 从技术能力、理论和实践经验三个方面入手介绍了自己的经验。在传统教育机构中读硕士学位的平均成本差不多在 3 万到 12 万美元之间。在线数据科学学位课程也不便宜,最低成本为 9000 美元。如果你想学数据科学,但支付不起这笔费用,应该怎么办呢? 我在成为数据科学家之前没有经历过任何正式的专业教育。本文将分享我的个人课程表,无需支付数千美元也能学习数据科学。 该课程包含 3 个主要部分:技术......
61 天前 / hyper0x
关注上方“数据挖掘工程师”,选择“星标公众号”, 关键时间,第一时间送达! 编译 | 艾奇 作者 | Rahul Agarwal 来源 |towardsdatascience 数据决定了模型的上限,算法只能无线逼近这个上限。模型好坏很大程度上还是取决于数据的质量、特征的选择。 面对海量数据我们无法手动挨个EDA挑选,那么如何科学地使用方法筛选特征显得尤为重要,今天个大家介绍数据科学家必须掌握的5种常用特征选择方法。 1、特征选择的原因 我们可能会想为什么不适用所有特征呢?特征选择的意义到底是什么? 有这......
166 天前 / hyper0x
选自 | towardsdatascience 作者 |Conor Dewey 全文长 | 2200字 “数据科学家必知的12345点建议”这类文章,相信你也读过很多,每位作者根据自己的经验,从不同的角度,或者不同的行业经历出发为大家提供了很多优秀的看法,但是一些行业新人遇到的情况,可能和下文这位Conor Dewey小哥所看到的一样,因为建议太多,反而要首先花费很多时间去梳理这些信息。 那么我们看一下这位贴心的Conor Dewey所作的工作---他将看到的很多优秀的建议文章做了汇总和提炼,并对其中共同的建议做了描述。大家可以先通过他的文章了解一些通用的建议,再......
185 天前 / hyper0x
对数据科学人才的需求日益增加,随之而来的是对更多数据科学家的需求。但数据科学的应用是独立的领域,并不属于一个行业或业务线。数据科学家可以在任何组织的任何地方产生影响。 如果您是一名迅速成长的数据科学家或者正沿着这条道路前进,那么您就知道教育是第一步。然而,在技术课程之外,还有一些超越学科的数据科学技能。随着这一领域的发展,练习和巩固这些技能将有助于您从求职者和科学家的人群中脱颖而出。 非技术技能 这些技能不需要过多的技术培训或正式认证,但它们是将数据科学严谨地应用于业务问题的基础。如今,......
250 天前 / hyper0x
3月23日,TDU在中国人民大学举办了“数据科学学习规划”活动,人大副教授郭绍俊老师、TDU执行校长杨慧女士以及TalkingData数据科学家殷尧为大家带来了精彩分享。 今天为大家分享的是TalkingData数据科学家殷尧的分享,介绍了数据科学项目的流程以及一些个人学习成长的经历。 数据科学到底在做什么 数据科学是一个包含很多技能的一个学科,以我自身的经验来看,数据科学中最重要的技能是编程。坦白讲大家做技术的本质还是程序员。 这听起来可能和大家的想法有一点出入,大部分人之前接触到数据科学课程也好,相关信息也......
278 天前 / Data2Art
前言2012年,哈佛商业评论的一篇文章中称“数据科学家”为21世纪“最性感“的职业[1],预测着未来数据科学行业需求将急速增长。Glassdoor的美国最佳工作榜单上,数据科学家从2016年到现在的2019年,四年以来都位居榜首[2]。这四年长居美国最佳工作榜首的数据科学家,到底是做什么的呢? 初次接触的疑惑 我刚上大学的时候,数据科学这个概念几乎没有被周围的人提及,那时大数据才是一个非常火的概念。后来,人工智能开始流行。其中,在风口浪尖上的,即是机器学习。大四在豆瓣和百度实习时,我主要的方向还是做移动开发(iOS)。实习所在的团队每季......
306 天前 / 忄落北
云栖君导读:Python是开源的,所以有很多开源固有的问题。如果你是Python新手,很难知道针对特定任务的包哪个是最好的。你需要有经验的人来告诉你。今天我要告诉你们的是:在数据科学中,有一个软件包是你们需要学习的,那就是pandas。 而pandas真正有趣的地方是,很多其他的包也在里面。pandas是一个核心包,因此它具有来自其他各种包的特性。 pandas类似于Python中的Excel:它使用表(即DataFrame)并对数据进行转换,但它还能做更多。 如果你已经熟悉Python,可以直接进入第三部分。 现在让我们开始: pandas包......
317 天前 / hyper0x
点击上方“Python数据科学”,选择“星标公众号” 关键时刻,第一时间送达! 作者:Peter Gleeson 出品:Python数据科学 编译:wLsq Python是目前世界上最流行的编程语言之一。因为: 1.它容易学习 2.它用途超广 3.它有非常多的开源支持(大量的模块和库) 作者 Peter Gleeson 是一名数据科学家,日常工作几乎离不python。一路走来,他积累了不少有用的技巧和tips,现在就将这些技巧分享给大家。这些技巧将根据其首字母按A-Z的顺序进行展示。 ALL OR ANY Python之所以成为这么一门受欢迎的语言一个原因是它......
343 天前 / hyper0x
选自towardsdatascience 作者:Jeremie Harris 机器之心编译 参与:李诗萌、王淑婷 想做数据科学家的话,该不该读硕士、博士?本文作者根据自己的工作经历,基于收集过的上千样本给出了一个非常规的答案:这些都不是必需的。作者甚至认为,适当的时候本科辍学更好…… 我是一个辍学的 PhD。 这意味着,虽然我已经完成了许多研究生课程,但最终收获的只有「辍学」这么个字眼。如果博士顺利毕业,你就是万千书呆子中的一个。但读了两年半后辍学,你就是一个前卫的书呆子。人们会想知道你接下来还会做些什么。他们会说,「马斯克......
368 天前 / hyper0x
本文是TalkingData University翻译自George Liu发表在towardsdatascience的一篇文章。 在昨天的推送中,George给出了不同角色数据人才能力画像,本文是他通过分析Indeed网站的招聘信息进一步分析得到的结果。点击【阅读原文】可查看英文原文。 感兴趣的同学,还可发送关键词“数据人才报告”至本公众号,看看报告中TDU和美世咨询如何定义数据人才的不同角色及能力集。 前篇:数据科学职业全景导航【点击阅读】 如果您是数据科学方向的求职者,您一定想知道在您的简历添加哪些技能可以让您接到面试电话;如果您想进入这个领......
373 天前 / hyper0x
编者注:文中超链接如果不能访问可以点击“阅读原文”访问本文原页面;2019年6月18-21日在北京举行的人工智能大会议题征集已经开始。 了解数据工程师和数据科学家之间的差异非常重要。 误解或不了解其差异,会导致团队在处理大数据时失败或者表现不及预期。 一个核心的误解是每个职位各自的优点和弱点。 我认为,其中一些误解来源于描述数据科学家和数据工程师的图表。 图1.关于数据科学家和数据工程师过度简化的维恩图。 来自Jesse Anderson的插图像图1这样的维恩图,过度简化了岗位的复杂性,以及岗位的区别之处。它使两个岗位看上去可以......
409 天前 / hyper0x
作者:Iliya Valchanov 原文:What are the Skills Needed to Become a Data Scientist in 2018 译者:TalkingData市场部 本译文禁止商用,转载请注明来源! 据Glassdoor,数据科学家是2017年美国的头号职业。这并不意外,因为这一领域的中位基本工资达到了12万3千...
412 天前 / hyper0x
下面是77个关于数据分析或者数据科学家招聘的时候会常会的几个问题,供各位同行参考。1、你处理过的最大的数据量?你是如何处理他们的?处理的结果。2、告诉我二个分析或者计算机科学相关项目?你是如何对其结果进行衡量的?3、什么是:提升值、关键绩效指标、强壮性、模型按合度、实验设计、2/8原则?4、什么是:协同过滤、n-grams, map reduce、余弦距离?...
426 天前 / openio
选自Medium 作者:Harrison Jansma 机器之心编译 参与:李诗萌、Chita 当你干着一份并不喜欢且薪资又低的工作时,是否想要做出改变?本文作者曾在日托中心上班,却从零开始自学了数据科学,并已经小有成就。本文是他关于自学数据科学的一些参考建议,有志者不妨一读? 去年,我自学了数据科学,搜集了几百个在线资源,每天学 6~8 个小时。与此同时,...