2021-01-12 08:52:18 阅读(194)
以下是关于数据分析或数据科学家招聘的77个常见问题,供您参考。1、你如何处理你处理过的最大数据量的结果?2、告诉我你如何衡量两个分析或计算机科学相关项目的结果。、什么是:提升值、关键绩效指标、强度、模型按合度、实验设计、2/8原则4、什么是协同过滤,n-grams,mapreduce、余弦距离5、如何让网络爬虫更快,提取更好的信息,更好地总结数据,从而获得一个干净的数据库6、如何设计一个解决剽窃的解决方案7、如何检验个人支付账户多个人使用8、为什么点击流数据应该实时处理?、你认为哪个更好:无论是好的数据还是好的模型,你如何在所有情况下定义“好”通用模型?你不知道有些模型的定义不是那么好吗?10、什么是概率合并(AKA模糊融合)使用SQL处理或其他语言方便处理半结构化数据?您将选择使用哪种语言11、您如何处理缺乏数据?您推荐使用什么样的处理技术?12、为什么你最喜欢的编程语言是13、告诉你喜欢和不喜欢你喜欢的统计软件的三个原因。14、SAS,R,Python,Perl语言的区别在于15、大数据的诅咒是什么?16、你参与过数据库和数据模型的设计吗?17、您是否参与过仪表板的设计和指标选择?您对商业智能和报表工具有何看法?18、您喜欢什么特点的TD数据库19?、如何发送100万营销活动邮件?如何优化发送?如何优化反应率?你能把这两个优化分开吗?20、如果有几个客户查询ORACLE数据库,效率很低。为什么你所做的可以提高10倍以上的速度?同时,可以更好地处理大量输出21、如何将非结构化数据转换为结构化数据真的有必要进行这样的转换。将数据存储在平面文本文件中是否比存储在关系数据库中更好?22、如何避免哈希表碰撞攻击的频率是多少?23、如何判断mapreduce过程中良好的负载平衡是什么?负载平衡24、请举例说明mapreduce是如何在什么应用场景下工作的。云的安全性有哪些?25、(在内存满足的情况下)你认为100个小哈希表好还是大哈希表好,数据库分析对内部或运行速度的评价26、为什么简单的贝叶斯很差?如何使用简单的贝叶斯来改进爬虫检测算法?27、你处理过白名单吗?主要规则(欺诈或爬行检查)28、什么是星型模型,什么是查询表29、你能用excel建立逻辑回归模型吗?如何解释建立过程30?、在SQL,Perl,C ,在Python等编程过程中,为了提高速度,优化了相关代码或算法吗?如何提高31、用5天时间完成90%精度的解决方案,或者用10天时间完成100%精度的解决方案,取决于什么内容32、定义:QA(质量保证)、六西格玛,实验设计。好坏的实验设计能举个案例33吗?、你知道普通线性回归模型的缺陷是什么吗?34、你认为叶数小于50的决策树比大的好吗?为什么35、保险精算是否是统计学的一个分支?如果没有,为什么36、给出一个不符合高斯分布和对数正态分布的数据案例。好坏的实验设计能举个案例33吗?、你知道普通线性回归模型的缺陷是什么吗?34、你认为叶数小于50的决策树比大的好吗?为什么35?、如果没有,保险精算是否是统计学的一个分支,为什么要36?、给出不符合高斯分布和对数正态分布的数据案例。给出一个分布非常混乱的数字案例。37、为什么平均误差不是衡量模型的好指标?你建议用哪个指标代替38?、你如何证明你带来的算法改进真的比不做任何改变更有效?你熟悉A/B测试39吗?、什么是敏感性分析?更低的敏感性(即更好的强度)和较低的预测能力正好相反。你如何使用交叉来验证你对如何在数据集中插入噪声数据来测试模型的敏感性的看法?40、逻辑回归、决策树、神经网络。这些技术在过去15年中取得了哪些重大改进?41、除了主要成分析,你还使用其他数据降维技术吗?你怎么想逐渐回到你熟悉的技术?什么时候完整的数据比降维数据或样本好?42、如何建议非参数置信区间43?、您熟悉极值理论、蒙特卡罗逻辑或其他数学统计方法,以正确评估稀疏事件的概率44、归因分析如何识别归因与相关系数的例子是什么?45、如何定义和衡量一个指标的预测能力46、如何为欺诈测试评分技术找到最好的规则集?如何处理规则冗余、规则发现和两者本质问题?如何找到一个可行的近似解决方案?你如何决定这个解决方案足够好,以便停止寻找另一个更好的47、如何创建关键字分类48、僵尸网络如何检测49?、您是否有过使用API接口的经验?谷歌、亚马逊或软件实时服务50是什么样的API?、什么时候自己编号代码比使用数据科学家开发的软件包更好?51、在绘图方面可视化使用哪些工具?如何评价TableaurSAS在一张图片中有效显示52维度?、53的概念验证是什么?、内部、外部、销售部/财务部/市场部/IT部的人是否有咨询经验与供应商打交道,包括供应商的选择和测试。54、您是否熟悉软件生命周期和IT项目的生命周期,从收入需求到项目维护55、什么是cron任务56?、你是单身编码人员、开发人员还是设计师57?、假阳性好还是假阴性好、您是否熟悉价格优化、价格弹性、库存管理、竞争智能?59、ZillowS算法是如何工作的60、为了不好的目的,如何检验虚假评论或虚假FB账户61、如何创建一个新的匿名数字账户62、你有没有想过自己创业是什么样的想法?、您认为帐户和密码输入的登录框会消失吗?它将被64取代?、您使用过时间序列模型吗?时滞相关图光谱分析信号处理和过滤技术在什么场景下65、你最佩服的数据科学是什么?66从哪里开始?、如何开始对数据科学感兴趣的67?、效率曲线的缺点是什么?如何克服这些缺陷?68、什么是推荐引擎?它是如何工作的?69、什么是精密测试,什么时候模拟可以帮助我们不使用精密测试70、你认为如何成为一名好的数据科学家71?、你认为数据科学家是艺术家还是72科学家?、什么是好的、快速的聚类算法计算复杂性,什么是好的聚类算法,你如何决定一个聚类聚数73、在数据科学中给出一些“最佳实践案例”。74、什么使图形产生误解,难以理解或解释有用图形的特征75、您知道在统计或计算科学中使用的“经验法则”吗?76、你认为未来20年最好的五种预测方法是77、你如何立即知道一篇文章(如报纸)发表的统计数据是错误的,或作为支持作者的论点,而不仅仅是列出事物的信息,例如,你觉得如何使这些数据更准确
以上就是关于77个数据分析岗位面试的高频问题的相关介绍,更多77个数据分析岗位面试的高频问题相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对77个数据分析岗位面试的高频问题有更深的了解和认识。
推荐阅读
最新文章
猜你喜欢以下内容:
一 客户顾问-张三 一