那么PHP驱动真的完全解决了整数问题么?NO!在处理group操作的时候还有BUG:
为了说明问题,我们先来生成一些测试数据:
复制代码 代码如下:
<?php
ini_set("mongo.native_long", 1);
$instance = new Mongo();
$instance = $instance->selectCollection("test", "test");
for ($i = 0; $i < 10; $i++) {
$instance->insert(array(
"group_id" => rand(1, 5),
"count" => rand(1, 5),
));
}
?>
下面让我们使用group操作,根据group_id分组,汇总计算count:
复制代码 代码如下:
<?php
ini_set("mongo.native_long", 1);
$instance = new Mongo();
$instance = $instance->selectCollection("test", "test");
$keys = array("group_id" => 1);
$initial = array("count" => 0);
$reduce = "
function(obj, prev) {
prev.count += obj.count;
}
";
$result = $instance->group($keys, $initial, $reduce);
var_dump($result);
?>
结果和预想的有出入,count没有实现累加,而是变成了[object Object],目前,如果必须使用group操作,那么有两种方法可以缓解这个问题:
复制代码 代码如下:
ini_set("mongo.native_long", 0);
$initial = array("count" => (float)0);
这两种方法都是治标不治本的权宜之计,既然当前PHP驱动里group的实现有问题,那我们就绕开它,用其它的方式实现同样的功能,这个方式就是MapReduce:
复制代码 代码如下:
<?php
ini_set("mongo.native_long", 1);
$instance = new Mongo();
$instance = $instance->selectDB("test");
$map = "
function() {
emit(this.group_id, this.count);
}
";
$reduce = "
function(key, values) {
var sum = 0;
for (var index in values) {
sum += values[index];
}
return sum;
}
";
$result = $instance->command(array(
"mapreduce" => "test",
"map" => $map,
"reduce" => $reduce
));
$result = iterator_to_array($instance->{$result["result"]}->find());
var_dump($result);
?>
把大象放冰箱里需要三步,而使用MapReduce仅仅需要Map和Reduce两步即可,这里有一个PDF文档生动的说明了MySQL中GROUP BY和MongoDB中MapReduce的对应关系:
SQL to MongoDB
此外,还有很多资料可供参考,如:MongoDB Aggregation III: Map-Reduce Basics。
说明:软件版本为MongoDB(1.6.5),PECL Mongo(1.1.4)。不同版本结论可能不同。