编号按照对应的内容,1-1代表第一大部分遇到的第一题,R代表Review,C代表运行的代码(Code)。
1-1
解:C
具有多个阶段/组件的系统,其中几个可以使用机器学习。
1-2
解:C
200 * 200,每次移动4像素,总共是50 * 50=2500次。
1-3
解:D
复制样本没有用途,还是会以与之前训练相同的结果θ结束。
1-4
解:B
您刚刚加入了一个产品组,该产品组在过去12个月中使用1000个培训示例开发了一个机器学习应用程序。假设通过手工收集和标注例子,你平均需要10秒钟才能获得额外的训练样本,假设你每天工作8小时,你需要多少天才能得到10,000个例子?(最接近的答案)
10000/(8 * 60 * 60 / 10)=3.47天。
1-5
解:BC
假设您在流水线机器学习系统上执行上限分析,当我们为其中一个组件插入正确的标签时,整个系统的性能几乎没有什么改善,这可能意味着:(检查所有应用程序)
这可能不值得投入工程资源来改进系统的组成部分。
如果该组件是一个使用梯度下降的分类器训练,需要看它是否收敛到最好的参数。
R
R1-1
解:A
1000 * 1000,每次移动2像素(两个窗口),总共是500 * 500 * 2=500000次。
R1-2
解:A
(10000 * 10)/(4 * 60)约等于400。
R1-3
解:AD
B是学习曲线的优点。
C是人工合成数据的优点。
R1-4
解:A
获取更多数据,我们可以对原有数据进行镜像,不会更改数据中的车辆信息。
R1-5
解:AB