有一个txt文件,包含了10万条记录,格式如下:
列1 列2 列3 列4 列5
a 00003131 0 0 adductive#1 adducting#1 adducent#1
a 00003356 0 0 nascent#1
a 00003553 0 0 emerging#2 emergent#2
a 00003700 0.25 0 dissilient#1
……………………后面有10万条………………
需求是要导入数据库中,数据表的结构为
word_id 自动增量
word 【adductive#1 adducting#1 adducent#1】这一个txt记录要转换为3个sql记录
value =第三列-第四列;如果=0,则此条记录略过不插入数据表
复制代码 代码如下:
$li)
{
$arr=explode( ,$li);
$senti_value=$arr[2]-$arr[3];
if($senti_value!=0)
{
if($i>=20000&&$i {
$mm=explode( ,$arr[4]);
foreach($mm as $m) //【adductive#1 adducting#1 adducent#1】这一个txt记录要转换为3个sql记录 {
$nn=explode(#,$m);
$word=$nn[0];
$sql.=(\$word\,1,$senti_value,2),;//这个地方要注意到是 word有可能包含单引号(如jack's),因此我们要用双引号来包含word(注意转义)
}
}
$i++;
}
}
//echo $i;
$sql=substr($sql,0,-1);//去掉最后一个逗号
//echo $sql;
file_put_contents('20000-25000.txt', $sql); //批量导入数据库,5000条一次,大概需要40秒的样子;一次导入太多max_execution_time会不够,导致失败
?>
1,海量数据导入到时候,要注意php的一些限制,可以临时调整一下,否则会报错
allowed memory size of 33554432 bytes exhausted (tried to allocate 16 bytes)
2,php操作txt文件
file_get_contents()
file_put_contents()
3,海量导入的时候,最好分批次导入,失败的几率小一些
4,海量导入之前,脚本一定要多次测试无误再使用,比如用100条数据来测试
5,导入之后,如果php的mem_limit还是不够的话,程序仍然跑不起来
(建议用修改php.ini的方式来提高mem_limit,而不是用临时的语句)
http://www.bkjia.com/phpjc/326817.htmlwww.bkjia.comtruehttp://www.bkjia.com/phpjc/326817.htmltecharticle有一个txt文件,包含了10万条记录,格式如下: 列1 列2 列3 列4 列5 a 00003131 0 0 adductive#1 adducting#1 adducent#1 a 00003356 0 0 nascent#1 a 00003553 0 0 em...