发现假数据科学家的20个问题
现在,数据科学家是21世纪最性感的职业,每个人都希望分一块蛋糕。
这表示会有一些装腔作势的数据人士。这些人称自己为数据科学家,但他们并不掌握对应的技能。
这个问题的出现不一定是因为欺骗的目的。数据科学是全新的,且缺乏具有广泛共识的职位描述,意味着很多人只因为处理数据就认为自己是数据科学家。
“假的数据科学家往往是某个特定学科的专家,并且坚持他们的学科是唯一真正的数据科学。这种信念没有抓住数据科学的要点,数据科学涉及到应用全部科学工具和技术(数学、计算机、可视化、分析、统计、实验、问题定义、模型构建和验证等等)以得到来自数据的发现、洞察和价值。”
——Kirk Borne,Booz Allen Hamilton的首席数据科学家和RocketDataScience.org的创始人
第一种发现假数据科学家的方法是了解你应该寻找的技能。知道数据科学家、数据分析师和数据工程师之间的不同之处很重要,尤其是如果你打算雇佣这些不常见的人时。
为了帮助对数据科学家由真到假(或者被误导的)排序,我们提出了一个20道题的列表,你可以在面试数据科学家时问问他们。
解释什么是正则化,以及它为什么有用。
你最欣赏哪些数据科学家?哪些相关的创业公司?
如何验证一个用多元回归生成的对定量结果变量的预测模型。
解释准确率和召回率。它们和ROC曲线有什么关系?
如何证明你对一个算法的改进确实比什么都不做更好?
什么是根本原因分析?
你是否熟悉价格优化、价格弹性、库存管理、竞争情报?举例说明。
什么是统计检定力?
解释什么是重抽样方法和它们为什么有用。并说明它们的局限。
有太多假阳性或太多假阴性哪个相比之下更好?说明原因。
什么是选择偏倚,为什么它很重要以及如何避免它。
举例说明如何使用实验设计回答有关用户行为的问题。
“长”数据和“宽”数据有什么不同之处?
你用什么方法确定一篇文章(比如报纸上的)中公布的统计数字是错误的或者是为了支持作者观点,而不是关于某主题正确全面的事实信息?
解释Edward Tufte“图表垃圾”的概念。
你会如何筛查异常值?如果发现它会怎样处理?
如何使用极值理论、蒙特卡洛模拟或其他数学统计(或别的什么)正确估计非常罕见事件的可能性?
推荐引擎是什么?它如何工作?
解释什么是假阳性和假阴性。为什么区分它们非常重要?
你使用什么工具进行可视化?你对Tableau/R/SAS(用来作图)有何看法?如何有效地在一幅图表(或一个视频)中表示五个维度?
“一名‘真正的’数据科学家了解如何应用数学和统计,如何使用合理的实验设计构建和验证模型。掌握IT技能但没有统计技能只会让你成为一个造手术刀的外科医生那样的数据科学家”
数据分析咨询请扫描二维码
CDA数据分析师在中国航信高科技产业园进行了面向测试度量的数据分析培训课程,培训人数近2 ...
2024-05-01CDA数据分析师走进深圳迈瑞生物医疗电子股份有限公司,在迈瑞总部展开了为期两天的培训,本次课程参训人员线上及线下近百人, ...
2024-05-01CDA数据分析师在合肥市对合肥阳光新能源科技有限公司开展了为期8天的企业内训。 合肥阳光新能源科技 ...
2024-05-01CDA数据分析师走进海尔大学,进行了《数据治理与数据中台建设的道与术》专题培训,培训现场爆满,近百人参加了此次培训。 ...
2024-05-01在中国银行苏州分行培训中心开始数据分析师培训,此次培训课程共10天内容,包括Excel、MySQL、概率论与数理统计、SPSS等内容, ...
2024-05-01从实际的业务需求出发,结合行业的典型应用特点,围绕实际的商业问题,探讨数据挖掘、机器学习模型在金融领域的应用,包括获客、信用评分、细分画像、交叉销售、反欺诈、违规识别、时序预测、运筹优化、流程挖掘九个方面,形成 ...
2024-05-01本次培训课程为线上+线下的模式,由于学员编程能力不一、部分学员没有编程基础,故提供统计学、python基 ...
2024-05-01华夏银行信用卡中心-机器学习培训 1、课程亮点 取材于业界一流企业和顶级咨询公司的行业实践;已经被证明是人人 ...
2024-05-01主 题:数据中台建设及数据分析应用主题分享 1. 数据中台市场洞察 2. 主流数据中台产品比较 3. 某企业数据中 ...
2024-05-01围绕“数据驱动”战略,全力打造我行 300 人数字化人才梯队,着力培养数字化管理人才、大数据专业团队 ...
2024-05-01在当今数据驱动的商业环境中,数据分析成为了企业决策的重要依据。通过对大量数据的收集、处理和分析,企业能够更好地理解市场 ...
2024-04-29在人工智能(AI)的世界里,提示词(Prompt)是一种强大的工具,它能够引导AI按照用户的需求产生特定的输出。本文将深入探讨AI ...
2024-04-29CDA立足未来职场,拓展前沿视野——对外经贸大学保险学院举办“三全育人大讲堂”分享行业最新动态。 ...
2024-04-294月2日,CDA数据分析师创始发起人兼协会理事长赵坚毅博士受邀在浙江万里学院举办了一场以“数字化能力在职场中的作用” ...
2024-04-29随机森林(Random Forests)现在机器学习中比较火的一个算法,是一种基于Bagging的集成学习方法,能够很好地处理分类和回归的问 ...
2022-12-23方差分析是数据分析中常用的一种统计分析方法,接下来让我们简单了解一下方差分析的基本思想和原理吧。 方差分析(Analysis ...
2022-12-23来源:关于数据分析与可视化 关于streamlit-aggrid 数据排序 表格样式的调整 数据 ...
2022-08-03作者:麦叔 定义 「把上面晦涩的概念汇成一句话就是:」 ❝ 回调函数就是一个被作为参 ...
2022-08-03现今,高学历人群日益增多,物以稀为贵的高学历光环淡去。无论本科生还是研究生,甚至博士生,求职竞争力都大不如前,就业压力越来越大。
2022-06-01某家企业10个人面试,有9个本科生……如何脱颖而出,除得体的举止和良好的沟通力外,证书成重要筹码,这也是很多人考证的关键所在。
2022-04-14