本篇文章给大家带来的内容是关于地理位置geo处理之mysql函数的详细介绍(附代码),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。
目前越来越多的业务都会基于lbs,附近的人,外卖位置,附近商家等等,现就讨论离我最近这一业务场景的解决方案。
目前已知解决方案有:
mysql 自定义函数计算mysql geo索引mongodb geo索引postgresql postgis索引redis geoelasticsearch本文测试下mysql 函数运算的性能
准备工作
创建数据表
create table `driver` ( `id` int(11) unsigned not null auto_increment, `lng` float default null, `lat` float default null, primary key (`id`)) engine=innodb default charset=utf8;
创建测试数据在创建数据之前先了解下基本的地理知识:
全球经纬度的取值范围为: 纬度-90~90,经度-180~180中国的经纬度范围大约为: 纬度3.86~53.55,经度73.66~135.05北京行政中心的纬度为39.92,经度为116.46越北面的地方纬度数值越大,越东面的地方经度数值越大度分转换: 将度分单位数据转换为度单位数据,公式:度=度+分/60分秒转换: 将度分秒单位数据转换为度单位数据,公式:度 = 度 + 分 / 60 + 秒 / 60 / 60在纬度相等的情况下:
经度每隔0.00001度,距离相差约1米在经度相等的情况下:
纬度每隔0.00001度,距离相差约1.1米mysql函数计算delimiter //create definer=`root`@`localhost` function `getdistance`( `lng1` float(10,7) , `lat1` float(10,7) , `lng2` float(10,7) , `lat2` float(10,7)) returns double comment '计算2坐标点距离'begin declare d double; declare radius int; set radius = 6371000; #假设地球为正球形,直径为6371000米 set d = (2*atan2(sqrt(sin((lat1-lat2)*pi()/180/2) *sin((lat1-lat2)*pi()/180/2)+ cos(lat2*pi()/180)*cos(lat1*pi()/180) *sin((lng1-lng2)*pi()/180/2) *sin((lng1-lng2)*pi()/180/2)), sqrt(1-sin((lat1-lat2)*pi()/180/2) *sin((lat1-lat2)*pi()/180/2) +cos(lat2*pi()/180)*cos(lat1*pi()/180) *sin((lng1-lng2)*pi()/180/2) *sin((lng1-lng2)*pi()/180/2))))*radius; return d;end//delimiter ;
创建数据python脚本# coding=utf-8from orator import databasemanager, modelimport loggingimport randomimport threading 中国的经纬度范围 纬度3.86~53.55,经度73.66~135.05。大概0.00001度差距1米 # 创建 日志 对象logger = logging.getlogger()handler = logging.streamhandler()formatter = logging.formatter( '%(asctime)s %(name)-12s %(levelname)-8s %(message)s')handler.setformatter(formatter)logger.addhandler(handler)logger.setlevel(logging.debug)# connect to the databaseconfig = { 'mysql': { 'driver': 'mysql', 'host': 'localhost', 'database': 'dbtest', 'user': 'root', 'password': '', 'prefix': '' }}db = databasemanager(config)model.set_connection_resolver(db)class driver(model): __table__ = 'driver' __timestamps__ = false passdef ins_driver(thread_name,nums): logger.info('开启线程%s' % thread_name) for _ in range(nums): lng = '%.5f' % random.uniform(73.66, 135.05) lat = '%.5f' % random.uniform(3.86, 53.55) driver = driver() driver.lng = lng driver.lat = lat driver.save()thread_nums = 10for i in range(thread_nums): t = threading.thread(target=ins_driver, args=(i, 400000)) t.start()
以上脚本创建10个线程,10个线程插入4万条数据。耗费150.18s执行完,总共插入40万条数据
测试测试环境系统:mac os
内存:16g
cpu: intel core i5
硬盘: 500g 固态硬盘
测试下查找距离(134.38753,18.56734)这个坐标点最近的10个司机
select *,`getdistance`(134.38753,18.56734,`lng`,`lat`) as dis from driver order by dis limit 10
耗时:18.0sexplain:全表扫描我测试了从1万到10万间隔1万和从10万到90万每间隔10万测试的结果变化
结论此方案在数据量达到3万条查询耗时就会超过1秒大约每增加1万条就会增加0.4秒的耗时
以上就是地理位置geo处理之mysql函数的详细介绍(附代码)的详细内容。