这个话题已经被讨论多次了,但是每次总是有不同的声音出现,为什么?原因有很多,但是总结起来,其实就是一句话,忽略了测试结果的实用性,以下用一个直接地理由来说明兵河五四程序同机测试结果的不准确性。
兵河五四同机测试其实只是观察两个引擎在计算细节上的不同,无法利用开局库的差异看出引擎出招的准确性,这是为什么?因为兵河界面不能有效控制出招节奏,每一款引的稳定出招层数是不尽相同的,兵河界面的自动分配出子时间极其不合理,而且不能利用不同使用时间去设置两个引擎的,造成在固定包干时间内走完一局棋,这就和网络实战对局有着极大的区别,简单列举一例:我们假设用兵河界面同机测试5000局,然后用这些对局棋谱制作成为一个对局库,加载所谓的“冠军”引擎,去弈天的华山实战,你就会发现这样一个问题,库招基本用不上,没有一局可以坚持到40步以上,而且脱谱以后很难取得均势局面,这是因为引擎的计算结果单一,虽然在测试中有好表现,但是面对各种飞刀和陷阱,则一筹莫展,况且网络实战中,强硬件使用者众多,精细库招的使用者估计占70%,优劣形势大多是出现在60回合以后,也就是说在120步左右,同机测试使得引擎在开局阶段计算偏离方向的对局比比皆是,怎么去面对复杂的网络实战呢?
小结,兵河界面的测试经常被人误解,其实是这样一个原因,它是单纯测试两个引擎对打的界面,无法达到测试战术的要求,在不加载开局库或者非指定局面对弈的情况下, 只能通过测试看出在包干计时并且平均出步时间的前提下,两款引擎的计算结果差异,让我们知道每一款引擎的大致稳定出招层数,如果想知道更多关于引擎强与弱的信息,不能通过这种方式,只能去利用网络实战一个途径才可能看得更直接一点,当然,网络作战同样牵扯到战略战术问题和引擎操作技巧,也是非常纷繁复杂的对弈过程。