エアーズ『その数学が戦略を決める』ワイン方程式のまちがい?

その数学が戦略を決める (文春文庫)

その数学が戦略を決める (文春文庫)

上記の拙訳、ぼくの訳書のなかでも比較的売れ行きがよく、いまのビッグデータブームを先取りした本でもあるし、なかなかおもしろい。

で、その冒頭のところに、アッシェンフェルターによるワイン方程式が出てくる。

ワインの品質 = 12.145 + 0.00117×冬の降雨量
+ 0.0614 ×育成期平均気温
- 0.00386×収穫期降雨量

というもの。さて、最近いくつかのウェブサイトで、これがまちがってるという指摘が行われた(というかかなり前のやつもあるけどぼくが気がついたのが最近ということ)。以下の三つ:

原データと論文にあたって正しい式を出してみると、以下のようになる、とのこと。

ln(あるビンテージの平均価格/1961年ビンテージの平均価格)
= -12.145 + 0.00117×冬の降雨量
+ 0.614 ×育成期平均気温
- 0.00386×収穫期降雨量
+ 0.0239 ×1983年基準でのワインの熟成年数

切片のマイナス符合がないし、最終項が入っていない。これはコピペミスじゃないの、ということだ。最初に疑われたのはもちろんこの訳者だけれど、エアーズの原著を見てもこの式になっている。つまり、イアン・エアーズがコピペをまちがえたんじゃないか、というのがだいたいの結論になっている。

おもしろかったので、この件を著者に問い合わせてみた。すると意外な返事がかえってきた。

Thanks for your email. Ashenfelter's liquidassets website has conflicting regression results.
His website has posted a page with the same regression results that I used in the book: http://www.liquidasset.com/feature1.html :

Price = 12.145 + 0.00117 winter rainfall + 0.0614 average growing season temperature – 0.00386 harvest rainfall

But his website also includes a page with the regression results to which you refer (http://www.liquidasset.com/winedata.html ):

Price = -12.145 + 0.00117 winter rainfall + 0.6164 average growing season temperature – 0.00386 harvest rainfall + 0.0239 number of years aged till 1983.

I think you're right that the second result is likely to be the correct/authoritative one. I relied on the first source (which was also published in the Princeton Packet).

訳:

めーるありがとう。アッシェンフェルターのliquidassetsウェブサイトの回帰式がいくつか種類があるのですよ。ウェブサイトにあるのは、私があの本で使ったのと同じ回帰式の結果。http://www.liquidasset.com/feature1.html

Price = 12.145 + 0.00117 winter rainfall + 0.0614 average growing season temperature – 0.00386 harvest rainfall

でも、同じウェブサイトには、別の回帰式も載っていて、こっちは貴殿の指摘した式になっています。(http://www.liquidasset.com/winedata.html )

Price = -12.145 + 0.00117 winter rainfall + 0.6164 average growing season temperature – 0.00386 harvest rainfall + 0.0239 number of years aged till 1983.

たぶんおっしゃる通り二番目のほうが正しい/正式なものなんでしょう。私は最初のを使いました。これはPrinceton Packetにも入っています。

ということで、実はエアーズのコピペミスですらない。http://www.liquidasset.com/winedata.html を見ると、Princeton Packet (学内誌みたい)の記事で、この段階で最終項がぬけていますね。この報道記事を書いたAbhi Raghunathanなる人物のコピペミスらしい。これがいちばんの原因らしゅうございます。これはぼくも意外な結果。

(とはいえ、このhttp://www.liquidasset.com/winedata.htmlを見ると、y切片のマイナス符合はちゃんと入ってますな。これはエアーズのコピペミス。*1つまり、二人が一つずつコピペミスをしていまの結果になっている模様)

もちろん、あらゆることで原論文はおろか、原データにまで遡って再現性をすべてチェックしたほうがいいんだろうけれど、そこまであらゆる話についてやれ、というのもいささか酷な話。でも、こうやって読者のチェックが入って、それがこうして訂正されるのはすばらしいことです。みなさん、ありがとうございます! で、本の方はどうすべきかなあ。どうしたいか、エアーズに打診中です。← なおしていいとのことなので、増刷が今後あれば直します。正誤表にも入れました




クリエイティブ・コモンズ・ライセンス
山形浩生の「経済のトリセツ」 by 山形浩生 Hiroo Yamagata is licensed under a Creative Commons 表示 - 継承 3.0 非移植 License.

*1:これをエアーズに指摘したら「いや、それはマイナスではなく、文脈から見てハイフンだと思う」とのお返事だが、それはちょっと苦しいと思う。