最近做一个导入大文件,因为涉及到要对文件处理得到需要的结构的数据。
把大量数据保存在数组中。
在处理的过程中,消耗很大内存,不是memory_limit设置问题,我已经设置足够大。
处理过程中自己也有unset掉不要的。但是通过memory_get_usage()输出函数调用前跟调用后的内存对比。
发现函数调用后,内存并没有明显的下降。那些大数组都已经unset掉了。也是一样。
如果导入的文件量不大,不会出现内存溢出的错误提示。但是当文件大到一定程度。就因为执行过程中,
函数调用完,内存还是占用很大。而导致内存溢出。
这个让我有点郁闷了。函数调用完不是都释放了局部变量空间了吗?
是不是什么内存泄露,有人遇到相同问题吗。希望有遇到相同问题的或者有人知道的。一起来讨论下。谢谢。
ps:分数蛮少的,只能这样了。
回复讨论(解决方案) unset()的是数组还是数组元素?
还有,函数中使用的数组是局部变量还是全局变量?
还有,函数中使用的数组是局部变量还是全局变量?
嗯 这些我都考虑了
unset是数组
我也知道 函数里unset()全局变量
只是消除函数里面那个临时变量
我都有把全局$globals 变量给unset
还是如此
以前做的东西没出过类似问题,因为之前没处理过这样大的数据。
现在遇到这样的问题,让我重新思考这个问题。
今天还看了 php内存管理的原理了
不知道是否有人也遇到过
代码。。。
代码。。。
代码太长了,我贴一个函数吧
function importtestsuiteformarray1($db,$parentid,$tproject_id,$userid,$duplicatelogic,&$testsuitearray,&$testcasearray){ global $productindex; $unexistpf = array();//用于存放当前项目中没有的excel文件存在的平台 $producerelfb = array(); $resultmap = null; $tsresult = null;//测试套件导入结果 $tables = tlobject::getdbtables(platforms); $pfsql = select id,name from .$tables['platforms']. where testproject_id=$tproject_id; $pfre = $db->fetchcolumnsintomap($pfsql,id,name); $pfre = is_null($pfre) ? array() : $pfre; foreach($productindex as $vkey=>$pitem){ if(!in_array($vkey, $pfre)){ $unexistpf[] = $vkey; } }// $memory1 = memory_get_usage();// $filename = date(md-his);// $hand = fopen(e:/testcase/.$filename..txt,a+);// $btime = microtime_float(); $temptsarray = array(); $createsuc = 创建成功。; $updatesuc = 更新成功。; if(is_array($testsuitearray) && count($testsuitearray)>0){ foreach($testsuitearray as $key=>$tsitem){// $begin = microtime_float(); if ($tsitem['name'] != ) { if($tsitem['parentnum']==0){ $parid = $parentid; }else{ $parid = $temptsarray[$key]['parentid']; } $tsuitemgr = new testsuite($db); $info = $tsuitemgr->get_by_name($tsitem['name'],$parid); if( is_null($info) ) { $ret = $tsuitemgr->create($parid,$tsitem['name'],,$tsitem['node_order']); $tsuiteid = $ret['id']; $tsresult[] = array($tsitem['name'],$createsuc); } else { $tsuiteid = $info[0]['id']; $ret = $tsuitemgr->update($tsuiteid,$tsitem['name'],,null,$tsitem['node_order']); $tsresult[] = array($tsitem['name'],$updatesuc); } if(is_array($tsitem['children']) && count($tsitem['children'])>0){ foreach($tsitem['children'] as $val){ $temptsarray[$val]['parentid'] = $tsuiteid; } } }// $end = microtime_float();// fwrite($hand, 每条规约用时:.($end-$begin).\r\n); } }// echo testsuitearray前.memory_get_usage().
; $testsuitearray = null;// echo testsuitearray后.memory_get_usage().
; $globals['testsuitearray']=null;// echo 全局testsuitearray后.memory_get_usage().
; if(is_array($testcasearray) && count($testcasearray)>0){ $tcdata = array();// $begin = microtime_float(); $flag = 0; foreach ($testcasearray as $key=>$tsitem){ if($tsitem['parentnum']==0){ $parid = $parentid; }else{ $parid = $temptsarray[$key]['parentid']; } $tcdata[$flag] = array( name=>$tsitem['name'], node_order=>$tsitem['order'], parentid=>$parid ) ; if(is_array($tsitem['property']) && count($tsitem['property'])>0){ foreach($tsitem['property'] as $pkey=>$val){ $tcdata[$flag][$pkey] = $val; } } if(is_array($tsitem['custom_fields']) && count($tsitem['custom_fields'])>0){ foreach($tsitem['custom_fields'] as $cfname=>$cfvalue){ $tcdata[$flag][customfields][] = array(name=>$cfname,value=>$cfvalue); } } if(is_array($tsitem['srs']) && count($tsitem['srs'])>0){ $tcdata[$flag]['srs'] = $tsitem['srs']; } if(is_array($tsitem['produce']) && count($tsitem['produce'])>0){ $tcdata[$flag]['produce'] = $tsitem['produce']; } $flag++; }// $end = microtime_float();// fwrite($hand, 循环用例时间:.($end-$begin).\r\n);// echo testcasearray前.memory_get_usage().
; $testcasearray = null;// echo testcasearray后.memory_get_usage().
; $globals['testcasearray']=null;// echo 全局testcasearray后.memory_get_usage().
; $temptsarray = null;// echo temptsarray后.memory_get_usage().
; if(is_array($tcdata) && count($tcdata)>0){// $begin = microtime_float(); $resultmap = saveimportedtcdata1($db,$tcdata,$tproject_id,$userid,null,$duplicatelogic,$producerelfb,$pfre); $tcdata = null;// echo tcdata后.memory_get_usage().
;// $memory2 = memory_get_usage();// $end = microtime_float();// fwrite($hand, 保存用例总时间:.($end-$begin).\r\n);// fwrite($hand, 总用时:.($end-$btime).\r\n);// fwrite($hand, 内存消耗:.($memory2-$memory1).\r\n); } } $return = array(resultmap=>$resultmap,tsresult=>$tsresult,unexistpf=>$unexistpf,producerel=>$producerelfb); return $return;// return $resultmap; }
我说明下:$testsuitearray和$testcasearray是分析文件,得到的数组。两个数组可能有几十m或者上百m。
现在问题不是想说数组太大,可以采用别的方法目的。问题出在我调用完这个函数,和这个函数里面的saveimportedtcdata1函数,调用完saveimportedtcdata1 内存也没有明显降低。我试过把所有返回结果跟那些引用的变量都销毁,内存还是占用很大,最终导致溢出了。这样看代码估计很累,谢谢了。
木有人。。。
可以参考
http://www.laruence.com/2011/03/04/1894.html
可以参考
http://www.laruence.com/2011/03/04/1894.html
哈哈,这篇我看过也研究过博主说的。
它说被符号表占了。那我是想符号表占的如何释放。
我正在问那个博主。谢谢你的回复
文件分析后,数组占用了20m
然后数据库操作,这里涉及的操作很多。
执行完后内存比最开始的大接近1g
这样的结果是不是有什么异常啊。
在处理过程中有把 没必要的数据都unset了。
其实经过仔细分析
那些数组在调用完以后都有释放。
那调用完以后为什么会占用那么大内存?
因为数据库的大量操作?
- -
正想问得问题,,3q
5000个数组,每个数组里面还有的信息较多。
执行了17w多的数据库操作,和40多秒的数据库执行时间
采用循环操作。
每执行完一个数组的操作内存逐渐增加。
照理说每次循环用到得局部变量都一样。
只有保存数据库操作结果的数组有增加,可是它的增加的量小。
不可能需要那么大的内存。
那这些额外的内存占用从哪里来呢?
直到该函数调用完。这些内存空间都没释放,这是为什么呢?
why?why?why?
遇到这个瓶颈让我很苦恼。
经验丰富
很有成就的大哥大叔们
那多出来的内存怎么来的呢?
help。。。。。
你试试,释放下数据库连接试试,可能被数据库操作占用了。
你试试,释放下数据库连接试试,可能被数据库操作占用了。
数据库释放了也一样。
这中间的操作导致了 内存泄露了吗?
有人遇到这样的情况吗
我以前碰到过的情况是create_function有内存泄漏,但你这里没有用
这个大概只能自己慢慢调了,
你装xdebug里面有几个功能可以帮助分析内存
我要炸了- -
想太多了
你需要检查一下承载返回值的 $return 所占的空间
你需要检查一下承载返回值的 $return 所占的空间
返回值 $return 被unset了
还是占用很大
$resultmap=saveimportedtcdata1($db,$tcdata,$tproject_id,$userid,null,$duplicatelogic,$producerelfb,$pfre);
在这个函数调用前后的内存差别很大。
我把返回结果$resultmap,$tcdata,和$producerelfb等有关联的数据都unset,还是一样。
函数调用完不是释放完它执行时所分配的所有临时空间吗。怎么会这样子。想不通啊。那块内存哪去了?where are you- -
你去看下php的垃圾回收机制吧。
你去看下php的垃圾回收机制吧。
这个早在我是学生时代就了解java gc
php gc也早就了解了跟java很像的机制。
我现在是觉得不是这些问题
我觉得应该深入php内核 研究下php内存分配机制
使用xdebug 只有执行实现 没有内存情况
我用wincachegrind .exe 查看的
还是我没找到- -
如果没有处理过这样大的数据
跟这么多次的数据库操作
在一般系统上还碰不到这些问题
这样功能到不是会常用
但是作为一个管理工具
有时候就是要执行这么几次大数据的处理
我想这个东西解决了
应该又是一次成长 会更加注意效率 还有其他问题
一定要解决
感觉好孤单 一个人自言自语- -
你的这个函数中还调用了其他自定义函数,也还实例化了自定义类,这些都有可能产生问题
你得一个一个排查
那就检查一下这个函数saveimportedtcdata1,看看是不是因为他内部的问题
另外如果是从数据库中获取数据,记录集资源有没有被释放……
谢谢楼上两位回答。
自定义类 还有函数没错
其实最大问题saveimportedtcdata1 在这个函数。
我把这个函数产生的所有输出都给释放掉了了。
即使是释放完了 通过meomory_get_usage()输出的内存占用依然是调用这个函数之前内存调用的n倍
大概多了一个数量级。
我看我还是检查下这个函数
话说xdebug 能通过wincachegrind 查看内存消耗吗
我没看到有查看内存的
再次向回答人说谢谢
ps:其实如果百度跟谷歌能找到我要的答案我一般不会问。我发现我问的问题大多数没有得到想要答案。能跟大家交流沟通也学习很多。再努力找原因。
?。
自己排查吧,这个外人真帮不上什么忙,特别是你的saveimportedtcdata1怎么写的都不知道。
加下引用传递再测试一下,可能是因为你函数里有一次变量分离的,而变量本身又很大的缘故。
$resultmap=saveimportedtcdata1($db, &$tcdata,$tproject_id,$userid,null,$duplicatelogic, &$producerelfb,$pfre);
自己排查吧,这个外人真帮不上什么忙,特别是你的saveimportedtcdata1怎么写的都不知道。
加下引用传递再测试一下,可能是因为你函数里有一次变量分离的,而变量本身又很大的缘故。
$resultmap=saveimportedtcdata1($db,&$tcdata,$tproject_id,$userid,null,$duplicatelogic,&$produc……
恩 我的那个函数原型是刚好在$tcdata,和$producerelfb 有引用
刚才检查了一下
上面那个函数中有行代码
$tcdata[$flag][customfields][] = array(name=>$cfname,value=>$cfvalue);
[customfields]忘了加引号,我记得曾经看手册有提到这个问题,这个会导致效率很低。
因为php要额外很多检查。所以一直都是习惯加引号。可能不小心给忘了。
结果因为大量数据 所以一下子开销差别就出来,我算了下空间开销差了二十倍。时间开销没算。
问题还没解决还在找另一个函数出现的问题。
经过xdebug 再调试分析
最终问题得以解决
谢谢以上所有朋友
敬佩楼主啊
不过楼主怎么解决的? 我最近也遇到这个类似的问题了 求解
同问楼主是怎么解决的 主要是那些方面的问题 导致的