因为工作的需要,我要在网页端编写一段脚本,把数据通过网页批量提交到系统中去。所以我就想到了greasemonkey插件,于是就开始动手写,发现问题解决得很顺利。但是在对脚本进行总结和整理的时候,我习惯性地问了自己一个问题:能不能再简单点?
我的答案当然是“能”。
首先回顾我的数据批量提交的需求:我有一批用户数据要插入到系统中,但是因为系统库表结构不是行列式的,所以无法转化为sql语句插入。要插入的数据有接近200条,就是傻呵呵地手工录入到系统,估计也要1天的时间。作为程序员,当然不会干这么傻的事情,我一定要用程序来解决。这个编程的过程耗费了我1天的时间。相比手工录入,我额外收入是这篇博文,绝对的合算!
编程平台选择没花费时间,直接选定基于greasemonkey写自己的脚本,浏览器当然是firefox了。脚本的工作过程:
在脚本中预先存放要插入的数据
模拟鼠标点击,打开页面中的输入窗口
将数据录入到输入窗口,并模拟点击“提交”按钮,将数据提交到系统中。
依次循环,直到所有数据都处理完毕。
这里的技术难点在于:
打开输入窗口,需要等待不定期的时间,视网络情况而定。
提交数据到后台,需要等待处理完毕之后才可以循环下一个数据。
如果我是菜鸟的话,我当然直接写一个类似这样的应用逻辑:
复制代码 代码如下:
for(var i = 0; i { 3: clickbuttonforinputwindow();
waitinputwindow();
enterinputdata(dataarray[i]);
clicksubmitbutton();
waitinputwindowclose();
}
实际上这样写所有浏览器都会陷入一片白屏,并在若干分钟之后提示“没有响应”而被强行终止掉。原因就是浏览器在调用javascript的时候,主界面是停止响应的,因为cpu交给js执行了,没有时间去处理界面消息。
为了满足“不锁死”的要求,我们可以把脚本修改成这样:
复制代码 代码如下:
for(var i = 0; i {
settimeout(clickbuttonforinputwindow);
…
settimeout(waitinputwindowclose);
}
实际上settimeout和setinterval是浏览器唯一可以支持异步的操作。如何更优雅地使用这两个函数来实现异步操作呢?目前简单的答案是老赵的wind.js。虽然我没有用过这个函数库,但是光是$await调用,就是符合我一贯对简洁的要求的。但是对于我这样的单个文件的脚本来说,去网上下载一个外部js库,明显不如有一段支持异步操作的代码拷贝过来的快和爽。
所以我决定另辟蹊径,做一个不要编译而且易用性还可以更能够copy&paste的异步函数库。
说异步之前,我们一起回忆一下同步操作的几种结构类型:
顺序:就是语句的先后顺序执行
判断:就是判断语句
循环:严格来说应该是跳转(goto),但大多数现代语言都取消了goto。循环其实应该是复合结构,是if和goto的组合体。
异步操作的难点在两个地方:
异步的判断:异步情况下的判断基本都是检测条件十分满足,然后执行某些动作。
异步的顺序:顺序中的每一步操作之后都要交回控制权,等待在下一个时间片中继续执行下一步。难点是如何保持顺序性。尤其在两个顺序动作中间夹杂一个异步的循环的时候。
异步的循环:每次循环之后都交回控制权到浏览器,如此循环,直到运行结束。
最简单的实现当然就是异步循环了,我的实现代码如下:
复制代码 代码如下:
function asyncwhile(fn, interval)
{
if( fn == null || (typeof(fn) != string && typeof(fn) != function) )
return;
var wrapper = function()
{
if( (typeof(fn) == function ? fn() : eval(fn) ) !== false )
settimeout(wrapper, interval == null? 1: interval);
}
wrapper();
}
核心内容就是:如果fn函数返回值不是false,就继续下一个settimeout的登记调用。
实际上,“等待并执行”逻辑,根本上就是一个异步循环问题。这种情况的实现方法示例如下:
复制代码 代码如下:
asyncwhile(function(){
if( xxxcondition == false )
return true; // 表示继续循环
else
dosomething();
return false; // 表示不需要继续循环了
});
对于非等待并执行的逻辑,简单一个 settimeout 就可以了。
异步容易,实现异步中的顺序才叫难度呢。最早的起因是我要实现3步,但是第二部是一个异步的100多次的循环。也就是说,我要实现的3步操作,其实是103次的顺序异步操作。为了一个如何在浏览器中实现可响应的等待,找破了脑袋,只找到一个firefox中的实现,还要申请特权调用。
最后想出了一个简单的方法,就是引入了“执行链(execution chain)”的概念,同一个执行链的所有登记函数是顺序的,不同执行链之间没有任何关系。另外,不提供互斥(mutex)等概念,如果要同步,自行在代码中检查。
在同一个执行链中,保存一个执行令牌,只有令牌和函数序号匹配,才允许执行,这样就保证了异步执行的顺序性。
复制代码 代码如下:
function asyncseq(funcarray, chainname, abortwhenerror)
{
if( typeof(funcarray) == function )
return asyncseq([funcarray], chainname, abortwhenerror);
if( funcarray == null || funcarray.length == 0 )
return;
if( chainname == null ) chainname = __default_seq_chain__;
var tinfos = asyncseq.chaininfos = asyncseq.chaininfos || {};
var tinfo = tinfos[chainname] = tinfos[chainname] || {count : 0, currentindex : -1, abort : false};
for(var i = 0; i {
asyncwhile(function(item, tindex){
return function(){
if( tinfo.abort )
return false;
if( tinfo.currentindex return true;
else if( tinfo.currentindex == tindex )
{
try{
item();
}
catch(e){
if( abortwhenerror ) tinfo.abort = true;
}
finally{
tinfo.currentindex ++;
}
}
else
{
if( abortwhenerror ) tinfo.abort = true;
}
return false;
};
}(funcarray[i], tinfo.count ++));
}
settimeout(function(){
if( tinfo.count > 0 && tinfo.currentindex == -1 )
tinfo.currentindex = 0;
},20); // 为了调试的原因,加了延迟启动
}
由此,一个支持copy&paste的异步js函数库就完成了。具体的使用例子如下:
复制代码 代码如下:
function testasync()
{
asyncseq([function(){println(asyncseq -0 );}
, function(){println(asyncseq -1 );}
, function(){println(asyncseq -2 );}
, function(){println(asyncseq -3 );}
, function(){println(asyncseq -4 );}
, function(){println(asyncseq -5 );}
, function(){println(asyncseq -6 );}
, function(){println(asyncseq -7 );}
, function(){println(asyncseq -8 );}
, function(){println(asyncseq -9 );}
, function(){println(asyncseq -10 );}
, function(){println(asyncseq -11 );}
, function(){println(asyncseq -12 );}
, function(){println(asyncseq -13 );}
, function(){println(asyncseq -14 );}
, function(){println(asyncseq -15 );}
, function(){println(asyncseq -16 );}
, function(){println(asyncseq -17 );}
, function(){println(asyncseq -18 );}
, function(){println(asyncseq -19 );}
, function(){println(asyncseq -20 );}
, function(){println(asyncseq -21 );}
, function(){println(asyncseq -22 );}
, function(){println(asyncseq -23 );}
, function(){println(asyncseq -24 );}
, function(){println(asyncseq -25 );}
, function(){println(asyncseq -26 );}
, function(){println(asyncseq -27 );}
, function(){println(asyncseq -28 );}
, function(){println(asyncseq -29 );}
]);
asyncseq([function(){println(asyncseq test-chain -a0 );}
, function(){println(asyncseq test-chain -a1 );}
, function(){println(asyncseq test-chain -a2 );}
, function(){println(asyncseq test-chain -a3 );}
, function(){println(asyncseq test-chain -a4 );}
, function(){println(asyncseq test-chain -a5 );}
, function(){println(asyncseq test-chain -a6 );}
, function(){println(asyncseq test-chain -a7 );}
, function(){println(asyncseq test-chain -a8 );}
], test-chain);
asyncseq([function(){println(asyncseq -a0 );}
, function(){println(asyncseq -a1 );}
, function(){println(asyncseq -a2 );}
, function(){println(asyncseq -a3 );}
, function(){println(asyncseq -a4 );}
, function(){println(asyncseq -a5 );}
, function(){println(asyncseq -a6 );}
, function(){println(asyncseq -a7 );}
, function(){println(asyncseq -a8 );}
]);
}
var textarea = null;
function println(text)
{
if( textarea == null )
{
textarea = document.getelementbyid(text);
textarea.value = ;
}
textarea.value = textarea.value + text + \r\n;
}
最后,要向大家说一声抱歉,很多只想拿代码的朋友恐怕要失望了,如果你真的不知道怎么处理这些多余的行号,你可以学习一下正则表达式的替换,推荐用ultraedit。