问题 减少纬度和经度点数的最快方法


我正在尝试减少并将多个点组合到这些位置的中心点。现在我通过寻找最接近的一对来强制它,将它们组合并重复直到我将它减少到我的目标(旁注:实际上我通过排序减少了问题) (lat*lat+long*long) 然后在每个点的两侧搜索10%,我的测试总是找到该范围内的最短距离)。

举个例子,我想将4000点减少到1000点,理想情况下将最近点组合到最近点的中心。基本上是构建反映该区域中地址数量的标记点。

有没有更好的算法可以给我尽可能准确的结果?或者更快的距离算法?我想它只需要在短距离内准确


现在我找到了距离(维基百科在“投射到飞机上的球形地球”下):

double dLat = pos2.LatitudeR - pos1.LatitudeR;
double dLon = pos2.LongitudeR - pos1.LongitudeR;

double cosLatM = Math.Cos((pos2.LatitudeR + pos1.LatitudeR)/2) * dLon;
double a = dLat*dLat + cosLatM*cosLatM;

我已经考虑过将所有点分组在彼此的x距离内,然后扩展x直到达到我的目标最终点数,但我不知道如何使它像我的完美主义所希望的那样准确。这就是我能想到的所有方式都会略有不同,具体取决于输入点列表的顺序。


编辑以描述我当前的算法如何处理(这是找到我想要的结果的理想方式,但是更快的近似值得):

如果你有线性描述它 x=1,4,5,6,10,20,22

  1. 它会结合4 + 5 = 4.5 [找到的第一个1.0距离]
  2. (4.5 * 2 + 6)/ 3 = 5 - x=1,5,10,20,22 [1.5距离]
  3. 20 + 22 = 21 - x=1,5,10,21 [2.0距离]
  4. (5 * 3 + 1)/ 4 = 4 - x=4,10,21 [4.0距离]
  5. (4 * 4 + 10)/5.2 - 所以你最终得到了 x=5.2,21。 (它跟踪CombineCount,以便以这种方式找到正确的平均中心)

结果: 这是我当前的距离函数,其中cos ^ 2的查找表生成。没有时间检查我的点有多接近,所以没有实现Joey建议的近似cos ^ 2,但这可以提高查询表的速度。

我尝试过的K-Cluster算法(参见我对该答案的评论)并没有像我想的那样将它们组合在一起,它最终得到了地图中心附近的大量点和边缘的几点。所以除非我能纠正我正在使用的算法慢一些。

public static double Distance(AddressCoords pos1, AddressCoords pos2, DistanceType type)
{
    if (LookupTable == null) LookupTable = BuildLookup();

    double R = (type == DistanceType.Miles) ? 3960 : 6371;

    double dLat = pos2.LatitudeR - pos1.LatitudeR;
    double dLon = pos2.LongitudeR - pos1.LongitudeR;

    double LatM = ((pos2.LatitudeR + pos1.LatitudeR)/2);
    if (LatM < 0) LatM = -LatM; //Don't allow any negative radian values
    double cosLatM2 = LookupTable[(int)(LatM * _cacheStepInverse)];
    double a = dLat*dLat + cosLatM2 * dLon*dLon;

    //a = Math.Sqrt(a);

    double d = a * R;

    return d;
}

private const double _cacheStep = 0.00002;
private const double _cacheStepInverse = 50000;

private static double[] LookupTable = null;

public static double[] BuildLookup()
{
    // set up array
    double maxRadian = Math.PI*2;
    int elements = (int)(maxRadian * _cacheStepInverse) + 1;

    double[] _arrayedCos2 = new double[elements];
    int i = 0;
    for (double angleRadians = 0; angleRadians <= maxRadian;
        angleRadians += _cacheStep)
    {
        double cos = Math.Cos(angleRadians);
        _arrayedCos2[i] = cos*cos;
        i++;
    }
    return _arrayedCos2;
}

8389
now


起源

只是为了更好地了解您的要求,如果您的4000点在整个网格中完全均匀分布会发生什么? - SimonC
如果是这种情况,我的要求就不关心它选择合并的哪一对......如果它们都是正方形,我认为我现在的算法会将前面两个相邻的它们组合成一个中心点。在它的中途将有矩形,然后组合那些最近的对以获得4点的中心点。如果没有减少2的幂,则取决于点的顺序 - Thymine
如果你和其他人在很长一段距离之后有3分接近,你会想要发生什么?结合两个并留下另一个?结合两个,然后将另一个与一个很远的地方相结合?别的什么? - Joey
是的,我认为您理解它,但确保我添加了当前代码的每次迭代的示例 - Thymine


答案:


加快计算点之间的距离:

如果你做一些初等代数,你会得到:

D = R*Sqrt(Lat2^2 + Lat1^2 - 2*Lat1*Lat2 + cos^2((Lat2 + Lat1) /2)(Lon2^2 + Lon1^2 - 2*Lon1*Lon2))

你可以做的第一件事是加速地球半径(R)并比较平方距离而不是距离,从而避免平方根和R项,每次比较可以节省2次计算。离开:

valToCompare = Lat2^2 + Lat1^2 - 2*Lat1*Lat2 + cos^2((Lat2 + Lat1) /2)(Lon2^2 + Lon1^2 - 2*Lon1*Lon2)

您可以做的另一件事是为每个坐标预先计算Lat ^ 2和Lon ^ 2 - 将每次比较的计算次数减少4。

此外,如果这些点在纬度上都相对接近,则可以通过使用随机点的纬度或所有点的平均纬度预先计算cos ^ 2项来近似,而不是两个点的平均纬度。被比较的要点。这减少了每次比较的计算次数4。

最后,您可以为每个点预先计算2 * Lat和2 * Lon,从而为每个比较减少2个计算。

这些都不会改善您的算法本身,但它应该使它运行得更快,并且可以应用于任何需要比较点之间距离的算法。


5
2017-10-04 08:04



不要忘记纬度和经度必须以弧度为单位才能工作。 - Joey
在C#中执行此操作并没有提高我的速度。但它确实帮助我确定Math.Cos绝对是寻找距离的缓慢部分。所以我想我可能会构建一个使用查找数组的新Cos函数。 - 使用我的测试数据,我的算法使用距离函数或你的算法需要140秒,但删除对Math.Cos的调用需要30秒,因此查找表应至少在60秒内(这是