在hifi音响耳机试听中,盲听真的靠谱吗?
一直以来,网上尤其是知乎上,很多烧友都喜欢拿盲听来说hifi玄学的事。没事就来聊聊盲听这个事吧。大家轻点拍,不要随便给玄学的帽子,谢谢!
首先说结论,盲听这玩意靠谱不靠谱呢。自己的看法是,看起来基本靠谱,但其实基本不靠谱!先别急着反驳,容我慢慢说。
为什么说看起来靠谱呢,因为双盲这种方法本身是很科学的。毕竟,药物三期中的双盲可谓深入人心,如果通不过双盲,药物根本无法上市。双盲实验是公认了的在药物研究领域排除心理干扰确认有效性的科学实验方法。这点无可争辩!
为什么个人认为双盲在hifi上基本不靠谱呢,原因和理由就很多了。
科学实验和结论,基于两个基本要求。一是可重复性,即同一实验结果必须能可重复。不可重复的实验是无效的。一是有效性判断方式,即不管你在什么地方正确,只要在一个地方不正确,就可以视为错的,或者是需要修正的。随便举个例,相对论不管其它地方再正确,只要你能找到一个能量或信息或物质的速度快于光速,就能推翻它了。
但这两个要求,双盲试听都不符合。一方面是有效性判断,药物实验入组要求是很夸张的,年龄、病史、是否经治等一项不满足,就不行。如果要组织盲听,那听众的要求也必然是很苛刻的。不然,就会出现我看到的某些的盲听结果。大部分人的随机乱猜掩盖了其中几位人接近甚至就是100%的正确的结果的真相--在几次选择时,猜对的概率是很大的。但如果十来二十次都靠“猜”对,那这个概率是0.5的N次方,10次全猜对就是千分之一了。而常见的双盲都是近二十次,接近全对的概率近百万分之一。但其它人猜的居多,那平均下来,就是无效的玄学结论了(总数几百次的猜,轻松把你这二十次的对掩盖掉)。我甚至知道某个实验中,比较几条线材的双盲试听实验中,某视听杂志的主编还是编辑不仅全对,还把线材是哪条都写了出来的。但总的结果,还是无效的玄学。这就是平均的原因,简单得不能再简单的结论,科学得很。就跟我调侃某些人一样,十个色盲跟你一起双盲,那分辨红色绿色也超过人眼的极限了。
另一个是可重复性的问题,一套音响器材做的双盲实验,你如果想重复的话,必须保证其它所有的因素都不改变,其实这个很难,可以说几乎不可能。音箱、前级、后级、解码、音源、所有线材、电源等都必须完全一样,在这个基础上,所用的音乐,包括音量以及环境等。这些因素都是会影响结果的,而就哪怕这些因素都排除了。下面两个因素就更麻烦了,一个是人,一个是时间。
人的因素,药物双盲实验,几百人是必须的。像新冠疫苗这种,千人的双盲都嫌不够,要近万的数据才能证明其有效性。另一个时间因素,药物双盲实验,三五个月算短的。几年是常有的事。就算这样,通过双盲后被临床证明无效或其它原因而被迫退市的药物每年还是有不少。
药物有效没效,如此简单的事(你要一辈子没生过病,没吃过药,当我没说过),要通过双盲验证其有效性尚且如此困难。而何况想要通过双盲这种方式验证比如一根线材这种的有效性了,实际只会更困难而非相反。
所以,验证的结果是无效是正常得不能再正常的结果,我下面会有例子证明这一点。要是得出其它结果,我倒觉得奇怪了。说得白一点,药厂可以投入千万上亿组织几百上千人来试,通过长年累月的试用收集数据,你音响试听能做到吗?
没有药物是100%有效的,但药物又涉及生命安全,所以药厂也只好这样了。同样,也没有线材、音箱、功放是100%有效的,同一根线材,在某系统上效果明显,换成另外的系统上毫无作用,是稀疏平常的事,这个每个玩音响的人都知道。在这种情况下,你用几人十来人,随便用一套系统,用半天一天,做一个双盲,然后就得出结论:XXX是玄学。这个结论的可置信度基本上就是无限接近0!
盲听究竟有多靠谱呢,我在知乎网上找了两例盲听实验,相当有代表性。
一例是说瑞典电台想用一种压缩格式来替代FM广播,为了确认这种压缩格式的声音是否足够的好,他们找了60个有经验的试验者花了两年进行了20000次的盲听,最后的结果似乎表明这种格式不会对音质造成可闻的劣化。最后瑞典电台决定采用这种压缩格式来播放。
然后瑞典电台把一盘经过压缩格式处理过后的音乐磁带寄给了一位专家,他是数码音频领域的权威人物Bart Locanthi。Locanthi采用传统的方式进行试听,仅用了10分钟就发现这种压缩格式是有损音质的,并明确指出它的具体失真。然后其它人也迅速地发现了这个问题。
具体的链接来源:https://www.zhihu.com/question/20654367/answer/15754991
另一组盲听实验来源于自己的朋友,紫坛俱乐部的小白版主的博客:http://blog.sina.com.cn/s/blog_4e2a04300102dv5a.html
简单说就是Audio Engineering Society convention,即AES年会上(AES是美国著名的专业音响协会)举办了两台hi-fi放大器的盲听实验,两台功率差别巨大的晶体管机和胆机(价格相差近十倍了)去驱动一对顶级的音箱,宝华的801音箱。
在总计3530次的盲听中,正确地回答为1846个,准确率仅有52.3%,和瞎蒙差不多。
上面两个例子已经足以说明,盲听这种方式的可靠性和客观性真的--不太理想!
这也和自己有限的经验很类似,当自己采用一种接近盲听的方式去试听音响器材的差异时,常常完全无法区分其区别。在音箱设计过程中采用不同的分频电路、不同箱体、不同导相管时,通过接近盲听的方式(即把自己搞晕,让自己无法记得接的是哪种情况),自己也很难分清它们的差异。而实际上的频响曲线上的差异常常已经达到3db甚至更多了。
为了更好地区别它们的分别,自己被迫采用自己以前行之有效的一种聆听方式。让自己在一种放松状态下,通过长时间的聆听对比不同的曲目来分辨它们的微弱(其实已经非常大了)差异。这让自己设计和确定音箱的具体参数的时间大幅度地延长了!但真的是没法子,谁叫盲听如此不靠谱呢。
后面自己找了个更简单的办法,通过录像对比,我发现这种方式还是比盲听靠谱多了,几曲下来,不仅是自己,其它人也能纷纷得出和自己相似的结论。