2021-01-06 09:35:52 阅读(172)
对于现在的企业来说,利用数据来推动商业决策的制定尤为重要,企业可以知道如何销售和服务自己的客户群。然而,IBM调查发现,大约三分之一的企业领导人不相信他们用来做决策的信息。当企业领导不相信自己的数据时,他们很可能不支持公司花精力收集更多的数据,而是不使用数据。那么,你能有什么办法让你的执行者相信他们使用的数据信息呢?首先,你应该让他们清除数据本身的真实性。如今,我们可以用许多不同类型的性质来描述数据的真实性。在大数据时代,有三个关于数据的特点——规模、速度和多样性——在谈论大数据话题时引领了人们的内容。但也有人为数据的特征引入了另外三个特征(如Value-价值,Veracity-真实性,Viability-可行性)。然而,SethGrimes正确地指出,这三个新特征误导了人们对大数据的理解,因为这三个特征并没有清楚地向你解释你的数据是什么“大”。尽管如此,我们仍然需要考虑数据的这些特征——你的数据是大是小,稳定还是不断移动,结构化还是非结构化。您的数据真实性关系到数据的准确性和可靠性,以及数据分析的结果。您的数据的真实性会受到生成、收集和分析过程中不同类型错误的影响。如果您的数据在处理过程中引入的误差越多,您的数据的可信度就不会很高。2013年初,Ensuringveracityofyourdata必须确保数据的准确性和真实性,KateCrawford(凯特·克劳福德)在《哈弗商业评论》杂志上发表了他对数据“真实性”特征的看法,题为《大数据背后隐藏的偏见》。“如果你有足够的数据,它的数量是不言而喻的”——凯特正确地解释说,人们给了数据发言权;人们从数据中得出推断,并给了数据和更多的内涵。但不幸的是,人们将自己的偏见引入其中,无论是故意的还是无意的,这种做法都大大降低了数据的质量。为了提高数据的真实性,您必须减少来自不同误差源的频率。这些误差源往往与采样方法、数据不足、科研偏见和测量方法不尽如人意密切相关。在您使用数据做出决定之前,请仔细回答以下问题:1.Whatis(are)yourhypothesis(es)你的假设是什么?“大数据技术是为了找出每个变量之间的相关性,而不是测试这种关系的原因”——尽管这种观点很受欢迎,但我相信对于企业的长期价值,大数据技术应该是为了找出变量之间的偶然相关性。假设实验旨在识别为什么变量相互关联,以及驱动这些被发现关系的基本过程。假设实验有助于通过试错方法改进分析模型,从不同的条件下找到因果变量和新的发现。在过剩变量和数据集的帮助下,企业可以快速检测到数百种关系。在检测关系的绝对数量时,发现数据中存在统计关系的可能性会显著增加。通常由于概率的原因,当变量之间没有相关性的原因时,实际上,我们可以发现两个变量之间存在的统计关系。所以,如果你用这些虚假的发现结果来支持你现有的想法,那么结果就是你的决定肯定不是最好的。你能做的就是先做一个假设,然后测试一下。2.你对Whatareyourbiases有什么偏见?人们总是寻找/记住/解释支持他们现有想法的结果,忽略或低估那些无法支持他们观点的结果。这些被视为确认偏见的认知捷径,往往会导致你对数据的错误结论。你能做什么?具体来说,你需要做的是查看你的数据,并获得证据证明你可以驳斥你的信仰。如果当你预测消费者忠诚度时,人工产品质量远比服务质量重要,那么你必须收集服务质量的相关影响的证据。不要依赖你的记忆。在任何数据的基础上做决定时,记得引用相关数据的报告或研究案例。参考你的信息员可以帮助别人识别信息,帮助他们理解你的决定,让他们知道你将如何实现你的决定。如果他们得出与你大不相同的结论,一定要弄清楚你的结论和别人有什么区别(数据质量?不同的指标?还是分析不同?)您还使用推理统计学方法来区分真实、系统和有内涵的数据差异。在图片下面添加语言描述。清晰的描述可以确保你的图片不会引起太多的误解。您还可以让来自不同领域的专业人士(如IT或销售)为您解释,这样您就可以从不同的角度解释数据。3.Whatisthesamplesize样本的大小如何?我们很少(或根本没有)获得所有对我们感兴趣的群体。相反,我们依靠从这个群体中提取的样本来推断这些群体。例如,从我们的部分客户群体(样本)中收集消费者满意度信息,以了解整个消费群体的满意度。当你使用样本来了解整个群体的情况时,你必须了解样本中的误差。样本误差可以反映来自客户群数据的样本误差。因为这个样本只是整个群体的一个子集,我们的评估只会涵盖误差,因为样本只是整个消费群体的一部分。你能做什么?如果你发现样本可能反映了整个人群的情况,你可以用推断统计学来帮助你理解。4.Whatisthedatasource数据源是什么样子的?即使我们有大量的数据集,由于数据量巨大,样本误差也可能会减少。我们需要知道数据源在哪里——因为数据不会凭空产生。我们可以故意生成并收集一些数据,然后通过这些数据来解决问题。例如,我们可以分析人们在飓风桑迪发生时发布推特的地点。数据显示,与新泽西相比,曼哈顿市中心的博客文章更多。依靠简单的数据计数,你会发现飓风的主要攻击地点位于曼哈顿市中心。但事实上,飓风袭击了新泽西,但飓风瘫痪了新泽西的电力供应,因此人们暂时无法使用推特发布推文。此外,据估计,只有18%的美国年轻网民使用推特,其年龄主要分布在18至29岁之间。同样,2012年,只有8%的人使用移动设备购物,并通过推特发布自己的购物体验。在商业场景中,推特代表了一小撮,也许也是一种偏见数据集。你能做什么?仔细检查数据源,看看数据是否适合有足够的信息来支持你的问题。考虑使用不同的数据源来测试你的假设。多线的聚合证据总比单线的证据更有说服力。商业决策的最终质量取决于商业数据的质量(以及使用数据的预测分析模型)。如果你从最华而不实的分析模型中推断,你的数据是基于不可靠和无效的信息,那么当你的模型在实践中运行时(例如,你的模型可以预测现实),整个过程就像炼狱一样。正如业内人士所说——输入垃圾,输出垃圾!
以上就是关于商业决策的质量取决于商业数据的质量的相关介绍,更多商业决策的质量取决于商业数据的质量相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对商业决策的质量取决于商业数据的质量有更深的了解和认识。
推荐阅读
最新文章
猜你喜欢以下内容:
一 客户顾问-张三 一