如何优化批量经纬度距离计算,提升代码执行效率?

如何优化批量经纬度距离计算,提升代码执行效率?

批量经纬度距离计算优化

所需解决的问题是计算两张含经纬度的表的点之间距离,并找出距离某点的其他点。

原代码问题:
原代码处理时间过长,主要耗时代码为:

df41 = df4[(df4['longitude']>df4_lon_min) & (df4['longitude']<df4_lon_max) & (df4['latitude']<df4_lat_max) & (df4['latitude']>df4_lat_min)]

优化方案:
减少不必要的条件语句,采用矩阵求解代替循环计算,优化如下:

df41 = df4[(df4['longitude']>df4_lon_min) & (df4['longitude']<df4_lon_max)]
df42 = df4[(df4['latitude']<df4_lat_max) & (df4['latitude']>df4_lat_min)]
df41 = pd.concat([df41, df42], axis=0, ignore_index=true)  # 如果需要保留行数据,避免重复,可改用 df41.append(df42)

或采用矩阵求解:

from scipy.spatial import distance_matrix

...

min_distance = 15
tmp = distance_matrix(df1, df2)  # 求出 df1、df2 的所有距离
idx = np.where(tmp<min_distance)  # 比对距离边界,获取原始数据索引

经过优化后,处理时间将大幅缩短,具体效果需根据数据量和具体应用而定。

以上就是如何优化批量经纬度距离计算,提升代码执行效率?的详细内容,更多请关注其它相关文章!