为什么我有一个数据科学博客?分享代码的7个好处

Antoine Soetewey 2020-09-02 14 minute read

我的博客 statsandr.com. 于2019年12月推出。虽然与其他人的写作是一个非常短的时期,但我已经可以说这是一个令人难以置信和非常丰富的冒险!

45篇文章 发布(在撰写本文时)和主题范围从 描述性统计, 可能性, 推论统计r markdown.数据可视化,我看到通过技术博客分享我的代码的许多好处。

在这篇文章中,我突出了其中7个(没有特定的顺序),希望它会给你一些人提供想法和激励。在本文结束时,我还提到了启动自己的博客所需的几种现代解决方案。

请注意,在这9个月内,我没有从博客中谋生,这不是我的目标,因为我需要使它成为优先事项。1 但是,我已经收到了读者的足够积极的反馈,更重要的是,我已经学会了足以继续写作。

(对于感兴趣的读者,请参阅 一年后审查博客—and some thoughts about the future plans. In this review, I track its performance in R by analyzing page views, sessions, users and engagement with the {googleAnayticsR} package.)

#1通过写作学习

我真的很喜欢在许多不同的域中学习新的东西。我学习(我仍然学习)通过向不同背景的学生教授统计数据作为我的一部分 教学助手 大学的职位。

在推出此博客之前,我相信我能够尽快了解统计概念 它给我的学生。如果我无法以明确又可以理解的方式解释它,这意味着我需要更彻底地研究它,因为我实际上没有完全理解它。

这通常被称为Feynman技术。这种学习方法基于这一事实,以便完全掌握一个主题,您需要能够以简单的术语解释它。

在整个博客中,我实际上意识到才能学习和 完全了解新的东西,必须:

  • 能够清楚地传达它并以简单的方式教授它,
  • 能够 以精确和简洁的方式写下它

所以虽然这个博客首次发起以分享我最熟悉的统计概念(希望它对某人有用),但我现在也将它用作 写作学习。我认为这种额外的学习方式实际上是 与教学一样强大 因为写作让我允许 巩固我的理解.

显然,我主要学习 统计数据 及其应用程序 R 因为它们是博客的主要话题。但是,我从来没有想过我也会学到这么多:

  • 网页开发和SEO / Analytics(现在是越来越重要的技能)
  • 项目管理(当您从划伤中构建某些东西并希望发展)
  • 写作(我仍然需要改进作为非母语英语人)的技巧)2
  • 沟通结果(因为任何数据科学家都会告诉您,没有适当的沟通的结果是无用的,写一个博客是一个很好的做法)
  • 营销/公共关系/品牌管理(考虑社交网络以及如何处理读者的各种问题)
  • 等等。

维护博客教导了我通常在全职工作中教授的基本技能。通过博客,您将对从内容到读者的查询中的所有内容负责,类似于项目的员工,并且必须与最终用户交易和沟通。

除了例外,我不认为博客可以完全取代个人发展,但它绝对有助于学习广泛的重要技能。阅读书籍和完成数据科学在线课程是其他示例,以获得技能,除了工作,但博客往往更加多样化和应用,使其更有益(在我看来)。

我学习的另一种方式是 关于我写作的主题的研究.

这是我的帖子 r中的异常值检测 。作为任何一部分 描述性分析,我用来检查潜在的异常值。因为我熟悉这个话题,我决定写它。但是,我发现帖子不够完整,所以我做了一些进一步的研究。事实证明,实际上有几种统计测试我不知道。我写了关于这些测试,每当我检查潜在的异常值时,我现在都包括这些新技术。

最后但并非最不重要的是,我经常收到来自读者的电子邮件,要求写入他们选择的主题。有时会发生我从未听说过他们建议的话题,所以我做了一些好奇心的研究。即使我仍然没有写过它,因为我不熟悉它,至少我知道它存在,我或多或少地了解这是什么。

如果学习的唯一好处并没有说服您开始博客,请参阅以下部分中所经历的其他福利。

#2获得反馈

得到反馈,建议和建设性批评者 来自更有经验的用户。备注在纠正我的代码中存在的错误和错误方面有助于,他们也有助于提高我的技能。

你会惊讶地看到,虽然你花了无数的时间来检查你的代码,但总会有人发现你错过的错字。例如,世界各地人民的宝​​贵反馈绝对改善了我的质量和完整性 闪亮的应用程序 我每天使用。

因此,博客可以被视为一个 强大的同行评审方法 你对概念,代码或r做法的理解。在玩具示例中纠正并纠正它们时,犯错误也是更好的,而不是在你的工作场所犯错误。

此外,有些人将他们的博客帖子汇总到文章或书籍中,因此可以看到博客可以看出:

  • 对长期发布目标进行增量进展,
  • 在这个长期目标的每个步骤中获得反馈。

#3个人票据提醒我的未来自我

您在计算机的文件夹中搜索了多少次代码,最终查找谷歌上的解决方案,因为您不记得您写了哪些代码的项目?它每天都发生在我身上。

博客帖子组织 主题,现在需要更少的时间(和更少的挫折!)。 查找我在几个月前写的代码片段。这也让我保持我的 代码和R实践最新,因为我只需要在一个地方编辑它们。

这是我的文章的一个例子 r的图形 {ggplot2}. I prefer plots with the {ggplot2} 包裹 over plots available by default in R base, but I cannot remember all layers and their arguments. Now every time I struggle with a plot using this package, I simply revisit the corresponding article to find the solution. Same goes for many of my articles, every time I have forgotten the code or a nuance around how it works.

您可以在不同的文件中存储代码(r markdown. 例如,作为我过去常常做的文件或r脚本),但博客帖子具有以下优势:

  • 代码片段突出显示,
  • 通过使世界可用,您被迫保持整洁,完整和最新。

#4有助于开源社区

我已经学到了很多,而且由于伟大的资源,我一直在努力学习r,因为伟大的资源可由相信的开发人员和科学家免费提供 开源和免费材料.

通过博客自由获得所有代码和文章是有些人的方式:

  • “偿还”人们帮助我学习并感谢我现在所在的地方,以及
  • 提前支付的是我将来会学到的更多更多。

如果您还相信分享您的知识或专业知识,则拥有博客绝对是一种很好的方式 为社区做出贡献。只要它增加某些东西,您的贡献并不一定要巨大,有人会使用它。请记住,每个人都开始作为初学者,甚至世界专家都在其他领域是初学者。而且你会看到,当你继续与他人分享你的知识时,有些人会因为他们可以从中学习而欣赏它。

据我所知,如果我的小贡献对于一些人在更好地了解统计或学习r时,我的目标将会达成。在一个主题中热情地相信的人可能希望为人们提供通知它,希望更多的人反过来又有助于这个话题。你是完全的 自由选择贡献 你想向社区做。

#5保持谦虚,保持好奇

自推出我的博客以来,我发现了大量的高品质的数据科学博客。我越看到了关于不同主题的新事物,我看到人们做出令人难以置信的东西,我意识到我实际上不太了解。这让我想起了 保持谦虚.

除此之外,还通过与来自不同背景的科学家分享我的代码并从世界各地来,它允许我 考虑其他观点 和练习开放性,反过来有助于我 保持好奇.

在我看来,谦虚而好奇是保持学习的良好起点。我不想失去好奇心,否则我可能会失去对学习的胃口。

供你参考, R-Bloggers.每周r 是两个伟大的博客聚合器,专注于r,以及 走向数据科学 关于媒体的出版物充满了高质量的博客文章,涵盖了与数据科学有关的许多主题。如果您有兴趣发现更多技术博客,请订阅这些。

#6学会不太完美主义者并优先考虑

无论你在博客上花多少时间,都记得 一切都不能总是完美。作为一个完美主义者,我不能否认我会喜欢一切都在我生命中的各个方面都是完美的。

在撰写本文的第一个文章时,我对完美主义的趋势有时是如此普遍,这是一个真正的弱点:我可以花几分钟思考两种单词之间是否需要逗号(当然当然也没有任何区别)。但是,在某些时候, 改善某些东西需要这么多的时间和精力,即附加的值并不像你可以创造的增加的价值那么大,因为你在制作新的东西时可以创造.

当您每天都在学习时,这会变得更糟。因此,在过去的文章中可能无法再被视为今天完美的文章,因此您想在所有先前的文章中更改或添加一个小细节。我不是说你不应该编辑博客帖子,甚至建议!尽管如此,我建议您仅在对其添加重大值时才编辑它。否则,我相信最好花那个时间和努力创造别的东西。

通过博客,您将逐步学会使您的努力和时间(资源有限,似乎是多年来的稀缺)最富有成效。换句话说,你会学会 优先考虑.

#7构建连接和专业关系

通过在特定领域分享您的实践,您有时会遇到实际上与您相同的主题或具有类似的研究兴趣的人。这是如此:

这些 合作扩展了我的专业网络 并允许我与来自不同大学的新研究人员和不同国家建立联系。如果没有首先在特定主题上分享我的分析,我永远不会知道这些人。

我相信一个博客可以导致众多合作,使整个旅程更加有趣和丰富。谁知道,你的专业生活的下一章可能是一个人,你过去的工作。

即使您的博客不会导致任何合作,它仍然是一个 自我推广的伟大工具。做一些研究,练习和写作有关一个主题有助于成为(并被视为) 专家 在该领域。而且,你的博客将成为你的 文件夹 申请工作或项目时。招聘人员肯定会感谢您看到您的能力。

您的博客是处于一些富有成效的合作的起源还是您的工作的展示,它是一个 有价资产 申请梦想工作时。

如何开始自己的博客?

我在我的学习曲线上看到了加速,更深入地了解统计数据和R,自从开始我的博客以来,我的沟通技巧的巨大改善。我从未意识到维护博客有用如何作为学习技术。这是可以为自己和其他人存储信息和代码的增加的好处,这对于获得反馈和与其他研究人员来说至关重要。

如果这7个好处确信你,那么好消息就是现在它比以往任何时候都更便宜,更容易。

对于非技术博客,我推荐中等或WordPress,因为它很容易设置,它不需要代码。为了 技术博客,有很多 静态站点发电机 选择,但我强烈推荐使用 雨果{blogdown} package (在阅读本书后,我创建了我的博客)。然后你可以举办它 GitHub. 并使用它发布 netlify..3

谢谢阅读。我希望这篇文章回答了“你为什么有博客?”这样的问题或者“它的目的是什么?”,谁知道,给了你启动自己的博客的动机。如果你仍然尚未确定,我真的建议这样做并记住最难的部分是开始。如果您对主题感到耐心,那么您只需启动,其余的将遵循。

一如既往,如果您有问题或与本文所涵盖的主题相关的建议,请将其添加为评论,以便其他读者可以从讨论中受益。


  1. 我故意避免在本文中写下金融激励,因为我相信开始博客并不是一个好动力。首先,许多人没有用博客赚钱,永远不会赚钱。其次,还有很多人与他们的博客赚钱,但对于大多数人来说,钱不值得的时间。我从个人经历中看到一个博客有时可能会耗时,因为我肯定会更容易赚钱。而且,正如你所看到的,我选择不把广告或横幅放在我认为读过的阅读体验中(当我在其他博客上看到它们时,我发现广告和横幅极其烦人)。这当然是我的意见,它仍然是个人选择的问题,并且权衡问题:更糟糕的阅读经验和更多的金钱与更好的阅读经历和更少的钱。我也倾向于更愿意将选择留给读者 支持我的项目 而不是强加他们的广告或横幅。↩︎

  2. 即使是母语英语扬声器也可以用博客提高他们的写作技巧。↩︎

  3. 请注意,我不是程序员,也不是计算机科学家,所以我在创建网站方面没有广泛的知识。必须有更多的选项可用,但我发现这些选项最佳选择是我的计算机技能和我的目标。↩︎



喜欢这篇文章?

获取更新 每次发布新文章。
任何垃圾邮件都没有任何垃圾邮件。
分享: