想你有一个好的EDA框架?再想想

想擁有一個優秀的EDA框架?你可得再思考一下
图像由 storyset 在 Freepik 上

一位优秀的数据科学家对数据了如指掌。要构建一个好的模型,你必须与数据真正相连。

开始和完成一个机器学习项目当然是令人兴奋的。然而,将一个机器学习产品从头到尾完成是一项比想象中更加艰巨的任务。

建立全面的机器学习流程就像构建一部经过精心调试的交响乐,其中的每个音符,从数据预处理到模型评估,都和谐地为预测和智能系统的创建做出贡献。为此,你首先必须磨练理解数据的技能。

“框架为成功的结构提供了支撑;没有框架,就没有骨干。”

— 蒂姆·法戈

为什么拥有一个有效的框架如此重要?

<p要构建一个成功的机器学习项目,几乎没有容错的空间。要完成这样的壮举,必须全面检查所有要点。没有一个有效的框架会导致项目时间线上出现漏洞和损伤,你可能会错过一些微小的东西,这可能带来不利的影响。

数据探索

当开始进行机器学习项目时,我们往往充满了建立复杂模型和高级算法的肾上腺素。在这个过程中,我们往往对数据本身的重要性下降。

Forbes所做的调查图

在Forbes的一项调查中,我们可以看到,数据科学家在数据本身上花费了绝大部分的时间,无论是探索性分析还是预处理,只有很小一部分时间用于构建算法。重要的是要记住,机器学习不是魔法。虽然它们帮助我们产出洞察力,但它们仍然受到输入数据质量的限制。我们必须能够验证数据的完整性,并确保它适合项目的使用案例和范围。

在探索性数据分析中要注意什么

</p要构建一个成功的机器学习项目,几乎没有容错的空间。要完成这样的壮举,必须全面检查所有要点。没有一个有效的框架会导致项目时间线上出现漏洞和损伤,你可能会错过一些微小的东西,这可能带来不利的影响。