University of Agder交换记录–Data Science Applications(课程)

  • A+
摘要这一篇是记录Data Science Applications这一门课的相关内容. 之前上课的笔记都是记录在本子上的, 也就是都是纸质的, 第一次在网站上进行上课内容的记录, 可以尝试一下.

简介

这是关于Data Science Applications这门课程相关内容的记录. 会记录一下这一门课程的内容, 也是当作每一节课的课后笔记, 方便之后的回顾与复习.

会包含这一门课程的考试要求, 也会包含老师上课讲到的一些知识点. 总是我也就是当作笔记本, 都记录下来吧.

关于课程的作业, 我会另外在一篇新的文章中进行书写, 因为作业可能涉及的内容比较多, 所以就不混在一起写了, 关于课程Data Science Applications的作业链接:

 

关于课程基础内容

这门课程不是关于技术的介绍, 更多的是介绍关于data science如何在实际生活中发挥作用, 以及他需要什么样子的人才.

最终成绩计算方式

  • Individual assignments - Two 1-page reports (2x15 points) and one peer review (5 points) hand in (35 points)
  • In-class Quizzes (15 points). 这个课前会有一些小视频, 我们需要看完小视频来回答问题.
  • Group Project (50 points, 5/8)

大概的提交作业的时间节点, 和每一份作业的分值占比如下所示:

University of Agder交换记录--Data Science Applications(课程)

作业的详细内容

作业1: 第一个作业更加注重的是这个问题的重要性, 也就是这个问题可以帮助在这个领域内解决什么样子的问题. Here you need to come up with a case study that can benefit from data science (e.g., a company/organization) with a specific problem to work with and explain why you came up with this and why it is important to analyze this case.

作业2: 第二个作业需要包含具体分析的数据和分析数据的方法. Should include the method you will follow to find and analyze the data. Explain here what type of data you will use, what tool(s) you will use to analyze them. Also, add what you expect to find by analyzing the data

等级与百分比转换

  • A: 88–100 points
  • B: 76–87 points
  • C: 62–75 points
  • D: 51–61 points
  • E: 41–50 points
  • F: 0–40 points

课程使用的软件和数据集

工具集

Orange (Scratch for ML using Python), https://orange.biolab.si (用起来会比较简单, 我可能不用这个)

数据集

Try Kaggle (这里每个数据集后面有一个Usability, 代表这个数据集数据的完善性, 或者说代表这个数据集的易用程度, 可以选择数字大的数据集进行使用) https://www.kaggle.com/datasets

 

课程内容记录

我们按照课程的顺序, 来记录一下每一节课的相关内容.

Data science, digital transformation and business change

Q1. In Data Science Teams do we Need Generalists or Specialists? (在数据科学领域, 我们需要通才还是一些专注于某些方向的人)

  • 一个典型的Specialists的例子是流水线(Assembly line).
  • 那么为什么Specialists在assembly line是好的呢, 因为我们知道我们想要生产什么.
  • 在data science terms中, 包含下面不同的职责: Data engineers, machine learning engineers, causal inference scientists working under a product manager
  • 但是在data science中, 我们的目标是去发展新的业务能力, 那么所使用的算法和服务很难提前去设计好, 这些需要在实验, 测试, 错误和迭代中进行改进.
  • 当产品仍在发展阶段, specialization hinders our goals in several ways:
  • It increases coordination costs
  • It exacerbates (makes even worse) wait time
  • It narrows context.

 

 

 

  • 微信公众号
  • 关注微信公众号
  • weinxin
  • QQ群
  • 我们的QQ群号
  • weinxin
王 茂南

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: