我有一个看起来像这样的数据集
1908 January 5.0 -1.4
1908 February 7.3 1.9
1908 March 6.2 0.3
1908 April NaN 2.1
1908 May NaN 7.7
1908 June 17.7 8.7
1908 July NaN 11.0
1908 August 17.5 9.7
1908 September 16.3 8.4
1908 October 14.6 8.0
1908 November 9.6 3.4
1908 December 5.8 NaN
1909 January 5.0 0.1
1909 February 5.5 -0.3
1909 March 5.6 -0.3
1909 April 12.2 3.3
1909 May 14.7 4.8
1909 June 15.0 7.5
1909 July 17.3 10.8
1909 August 18.8 10.7
我想替换 NaN
使用KNN作为方法。我抬头 sklearn
小号 Imputer
但它只支持均值,中位数和模式插补。有一项功能要求 这里 但我认为现在没有实施。关于如何更换的任何想法 NaN
使用KNN从最后两列开始?
编辑: 由于我需要在另一个环境中运行代码,我没有安装软件包的奢侈。我只能使用sklearn,pandas,numpy和其他标准包装。