机器学习和编程面试题笔试题

用均值填充; > 均值填充可能需要取条件均值,例如某训练集中患癌症和不患癌症的数据中,该值的差距很大,那么就应当填充label相同的数据的均值。 ```python data_train.fillna(data_train.mean()) 。。。。。。想了解更多请下载附件

应用介绍

## 1) 缺失值较多

缺失值较多.直接将该特征舍弃掉,否则可能反倒会带入较大的噪声,对结果造成不良影响。

## 2) 缺失值较少

缺失值较少,其余的特征缺失值都在10%以内,我们可以采取很多的方式来处理:

- 方式1: 把NaN直接作为一个特征,假设用0表示;

    ```python

    data_train.fillna(0)

    ```

- 方式2: 用均值填充;

    > 均值填充可能需要取条件均值,例如某训练集中患癌症和不患癌症的数据中,该值的差距很大,那么就应当填充label相同的数据的均值。

    ```python

    data_train.fillna(data_train.mean())

    ```

- 方式3:用上下数据进行填充;

    ```python

    # 上一个数据填充

    data_train.fillna(method='pad')

    # 下一个数据填充

    data_train.fillna(method='bfill')

    ```

- 方式4:插值法

    ```python

    # 即估计中间点的值

    data_train.interpolate()

    ```

- 方式5:用随机森林等算法拟合

    > 将数据分为有值和缺失值2份,对有值的数据采用随机森林拟合,然后对有缺失值的数据进行预测,用预测的值来填充。

。。。。。。。。想了解更多请下载附件。

文件列表(部分)

名称 大小 修改日期
sklearn-cluster-compare.ipynb50.98 KB2020-09-06
1.md0.82 KB2020-09-06
10.md0.87 KB2020-09-06
11.md0.79 KB2020-09-06
12.md1.17 KB2020-09-06
13.md1.19 KB2020-09-06
14.md1.64 KB2020-09-06
2.md2.30 KB2020-09-06
3.md1.94 KB2020-09-06
4.md0.98 KB2020-09-06
5.md2.17 KB2020-09-06
6.md2.26 KB2020-09-06
7.md1.31 KB2020-09-06
8.md2.19 KB2020-09-06
9.md0.41 KB2020-09-06
10.svm.png17.63 KB2020-09-06
11.accuracy.png3.68 KB2020-09-06
11.confusion_matrix.png14.16 KB2020-09-06
11.F1.png3.59 KB2020-09-06
11.precision.png1.57 KB2020-09-06
11.recall.png1.87 KB2020-09-06
13.laplace.png79.83 KB2020-09-06
13.naive.bayes.formula.png34.21 KB2020-09-06
14.decision_tree_eg.gif56.09 KB2020-09-06
14.entropy.jpg23.11 KB2020-09-06
14.gain.jpg45.46 KB2020-09-06
14.gain.ratio.jpg43.22 KB2020-09-06
14.splitInfo.jpg39.63 KB2020-09-06
4.cosine.png104.85 KB2020-09-06
6.nlp.jpg8.79 KB2020-09-06

立即下载

相关下载

[基于机器学习的混合光伏和风能(负荷)管理系统] 基于机器学习的混合光伏和风能(负荷)管理系统,机器学习应用在新能源,是当前和未来的研究热点。
[机器学习和编程面试题笔试题] 用均值填充; > 均值填充可能需要取条件均值,例如某训练集中患癌症和不患癌症的数据中,该值的差距很大,那么就应当填充label相同的数据的均值。 ```python data_train.fillna(data_train.mean()) 。。。。。。想了解更多请下载附件
[用于量子电路和控制的量子几何机器学习] 量子电路,量子几何机器学习,我们的结果表明,如何使用几何控制技术来(a)验证几何合成的量子电路沿着测地线分布的范围,从而验证时间最优路径的路线,以及(b)合成这些电路。
[使用 TensorFlow 识别简单图像验证码] 使用 TensorFlow 识别简单图像验证码 使用 pipenv install # 安装环境依赖 pipenv run prepare # 生成测试数据标签 pipenv run train # 训练模型 pipenv run work < test.jpg # 识别 test.jpg

评论列表 共有 0 条评论

暂无评论

微信捐赠

微信扫一扫体验

立即
上传
发表
评论
返回
顶部