如何优化批量经纬度距离计算,提升代码执行效率?
批量经纬度距离计算优化
所需解决的问题是计算两张含经纬度的表的点之间距离,并找出距离某点的其他点。
原代码问题:
原代码处理时间过长,主要耗时代码为:
df41 = df4[(df4['longitude']>df4_lon_min) & (df4['longitude']<df4_lon_max) & (df4['latitude']<df4_lat_max) & (df4['latitude']>df4_lat_min)]
优化方案:
减少不必要的条件语句,采用矩阵求解代替循环计算,优化如下:
df41 = df4[(df4['longitude']>df4_lon_min) & (df4['longitude']<df4_lon_max)] df42 = df4[(df4['latitude']<df4_lat_max) & (df4['latitude']>df4_lat_min)] df41 = pd.concat([df41, df42], axis=0, ignore_index=true) # 如果需要保留行数据,避免重复,可改用 df41.append(df42)
或采用矩阵求解:
from scipy.spatial import distance_matrix ... min_distance = 15 tmp = distance_matrix(df1, df2) # 求出 df1、df2 的所有距离 idx = np.where(tmp<min_distance) # 比对距离边界,获取原始数据索引
经过优化后,处理时间将大幅缩短,具体效果需根据数据量和具体应用而定。
以上就是如何优化批量经纬度距离计算,提升代码执行效率?的详细内容,更多请关注其它相关文章!