在寫(xiě)PHP 程序的時(shí)候,很多人在傳遞參數(shù)的時(shí)候,喜歡用一個(gè)引用。特別是在一個(gè)數(shù)組非常的大的時(shí)候,更是喜歡加。
function binsearch(&$arr, $key, $value)
{
$low = 0;
$high = count($arr);
while ($low <= $high) {
$mid = floor($low + ($high - $low) / 2);
$item = $arr[$mid][$key];
if ($item == $value) {
return $mid;
} else if ($value > $item) {
$low = $mid + 1;
} else {
$high = $mid - 1;
}
}
return false;
}
在這里,$mid 采用了先減后加的方法計(jì)算,目的是為了防止整數(shù)的溢出。不是故意寫(xiě)復(fù)雜了。
我用下面的代碼進(jìn)行測(cè)試:
$data = array();
for ($i = 0; $i < 1000000; $i++)
{
$data[] = array("sq" => $i * 2);
}
var_dump(binsearch($data, "sq", 10000));
發(fā)現(xiàn),binsearch 的時(shí)候,總是要花個(gè) 0.2s左右。理論上來(lái)說(shuō),100萬(wàn)的數(shù)據(jù),最多也就是循環(huán)20次。怎么會(huì)這樣慢呢。
后來(lái)監(jiān)控了一下內(nèi)存,data 數(shù)組 占用了 230M 的內(nèi)存。而 binsearch 的時(shí)候,占用了60K 的內(nèi)存。但是,理論上來(lái)說(shuō),binsearch
不應(yīng)該占用如此多的內(nèi)存。因?yàn)椋矣X(jué)得,我已經(jīng)用引用了,根本就沒(méi)有對(duì)data 的結(jié)構(gòu)進(jìn)行修改。
我也是百思不得其解,后來(lái),我把引用參數(shù)去掉,居然 binsearch 只要 0.0002s ,看來(lái)是引用耗費(fèi)了大量的cpu 資源。
PHP 內(nèi)部遵循一個(gè)copy on write 的原則。實(shí)際上這個(gè)引用是多余的。
但是為什么,加了引用速度會(huì)變慢呢?今天重點(diǎn)就談?wù)勥@個(gè)問(wèn)題。明白道理后,大家一定知道怎么用引用了。
如果在binsearch 調(diào)用前,直接 $a = &$data,這個(gè)引用的速度會(huì)非常的快。看來(lái)肯定不是引用本身產(chǎn)生的問(wèn)題。
這個(gè)問(wèn)題,實(shí)際上涉及了zend 引擎如何管理PHP變量。