您好,欢迎访问一九零五行业门户网

NEO4J数据插入测试

cpu: i3 2.4ghz 4核,内存8g 方式一:采用其原生接口操作 jvm:-xms1024m -xmx1024m -xmn512m-xx:permsize=128m -xx:maxpermsize=256m 4000节点(50个属性),4000关系:1秒,其间cpu使用率25%,761m 8000节点(50个属性),8000关系:2秒,其间cpu使用率25%,82
cpu: i3 2.4ghz 4核,内存8g
方式一:采用其原生接口操作jvm:-xms1024m -xmx1024m -xmn512m-xx:permsize=128m -xx:maxpermsize=256m
4000节点(50个属性),4000关系:1秒,其间cpu使用率25%,761m
8000节点(50个属性),8000关系:2秒,其间cpu使用率25%,829m
16000节点(50个属性),16000关系:5秒,其间cpu使用率25,983m
24000节点(50个属性),24000关系:9秒,其间cpu使用率25%,1079m
32000节点(50个属性),32000关系:14秒,其间cpu使用率25%,1187m
40000节点(50个属性),40000关系:执行1多分钟以后直接报outofmemery: java heap space
内存使用:
结论:插入时用事务插入接口的话,在jvm 1g内存的配置下最后能够插入3万多个节点和关系,再多就内存溢出。
方式二:采用batchinserter接口jvm:采用jvm默认设置
40000节点(50个属性),40000关系:6秒,其间cpu使用率25%,内存288m
80000节点(50个属性),80000关系:17秒,其间cpu使用率25%,内存288m
120000节点(50个属性),120000关系:31秒,其间cpu使用率25%,内存289m
200000节点(50个属性),200000关系:56秒,其间cpu使用率25%,内存288m
分析:
根据官方文档,当少量数据(根据测试观察5000条以下)插入时,建议使用事务型插入接口(即通常neo4j的数据操作接口),速度还是可以的;当数据量比较大时,建议采用专用的batchinserters接口,这个接口在插入时不创建事务,估计内存占用很少,基本上在不同数据量的操作期间内存无太大变化。由此可见,在向neo4j导入大量数据时,可以有以下两种方法实现快速插入:
化大为小法此法是将大量的数据集合分成5000条或者更少集合,使用事务型插入接口插入数据,这样整体的插入时间按照以上的测试结果,100000条数据可以在30秒内插入完毕。缺点是需要分拆数据集合为小的集合;优点是当用户已经在运行一组neo4j的数据库时,只需改造相关的代码即可,也不需要在导入期间暂停数据库。
批量插入法此法不管数据量多大,都可以实现快速插入,实现速度和内存的平衡,适合在初始化数据库时(或者需要大量导入数据时)一次性导入大量的数据;缺点是导入数据时要暂停数据库,采用batchinserters接口导入,不能实现业务无中断运行。
建议:
采用化大为小法,当插入(导入)数据量大于1000个时,采用分批插入的方法,可以达到快速插入数据的目的,也能保证内存占用量不会有太大的变化而导致oom。
其它类似信息

推荐信息