
- 作者: イアンエアーズ,Ian Ayres,山形浩生
- 出版社/メーカー: 文藝春秋
- 発売日: 2010/06/10
- メディア: 文庫
- 購入: 34人 クリック: 303回
- この商品を含むブログ (76件) を見る
上記の拙訳、ぼくの訳書のなかでも比較的売れ行きがよく、いまのビッグデータブームを先取りした本でもあるし、なかなかおもしろい。
で、その冒頭のところに、アッシェンフェルターによるワイン方程式が出てくる。
ワインの品質 = 12.145 + 0.00117×冬の降雨量
+ 0.0614 ×育成期平均気温
- 0.00386×収穫期降雨量
というもの。さて、最近いくつかのウェブサイトで、これがまちがってるという指摘が行われた(というかかなり前のやつもあるけどぼくが気がついたのが最近ということ)。以下の三つ:
- horioの雑記帳:ワイン方程式の論文とデータを見てみた (2015.1.16)
- テンメイのRUN&BIKE:「アッシェンフェルターのワイン方程式」の間違いと本物(原論文)〜『ハードナッツ』第5回(2014.7.24)
- Small Data Scientist Memorandum: アッシェンフェルターのワイン価格予測式をトレースしてみた (2013.05.10)
原データと論文にあたって正しい式を出してみると、以下のようになる、とのこと。
ln(あるビンテージの平均価格/1961年ビンテージの平均価格)
= -12.145 + 0.00117×冬の降雨量
+ 0.614 ×育成期平均気温
- 0.00386×収穫期降雨量
+ 0.0239 ×1983年基準でのワインの熟成年数
切片のマイナス符合がないし、最終項が入っていない。これはコピペミスじゃないの、ということだ。最初に疑われたのはもちろんこの訳者だけれど、エアーズの原著を見てもこの式になっている。つまり、イアン・エアーズがコピペをまちがえたんじゃないか、というのがだいたいの結論になっている。
おもしろかったので、この件を著者に問い合わせてみた。すると意外な返事がかえってきた。
Thanks for your email. Ashenfelter's liquidassets website has conflicting regression results.
His website has posted a page with the same regression results that I used in the book: http://www.liquidasset.com/feature1.html :Price = 12.145 + 0.00117 winter rainfall + 0.0614 average growing season temperature – 0.00386 harvest rainfall
But his website also includes a page with the regression results to which you refer (http://www.liquidasset.com/winedata.html ):
Price = -12.145 + 0.00117 winter rainfall + 0.6164 average growing season temperature – 0.00386 harvest rainfall + 0.0239 number of years aged till 1983.
I think you're right that the second result is likely to be the correct/authoritative one. I relied on the first source (which was also published in the Princeton Packet).
訳:
めーるありがとう。アッシェンフェルターのliquidassetsウェブサイトの回帰式がいくつか種類があるのですよ。ウェブサイトにあるのは、私があの本で使ったのと同じ回帰式の結果。http://www.liquidasset.com/feature1.html
Price = 12.145 + 0.00117 winter rainfall + 0.0614 average growing season temperature – 0.00386 harvest rainfall
でも、同じウェブサイトには、別の回帰式も載っていて、こっちは貴殿の指摘した式になっています。(http://www.liquidasset.com/winedata.html )
Price = -12.145 + 0.00117 winter rainfall + 0.6164 average growing season temperature – 0.00386 harvest rainfall + 0.0239 number of years aged till 1983.
たぶんおっしゃる通り二番目のほうが正しい/正式なものなんでしょう。私は最初のを使いました。これはPrinceton Packetにも入っています。
ということで、実はエアーズのコピペミスですらない。http://www.liquidasset.com/winedata.html を見ると、Princeton Packet (学内誌みたい)の記事で、この段階で最終項がぬけていますね。この報道記事を書いたAbhi Raghunathanなる人物のコピペミスらしい。これがいちばんの原因らしゅうございます。これはぼくも意外な結果。
(とはいえ、このhttp://www.liquidasset.com/winedata.htmlを見ると、y切片のマイナス符合はちゃんと入ってますな。これはエアーズのコピペミス。*1つまり、二人が一つずつコピペミスをしていまの結果になっている模様)
もちろん、あらゆることで原論文はおろか、原データにまで遡って再現性をすべてチェックしたほうがいいんだろうけれど、そこまであらゆる話についてやれ、というのもいささか酷な話。でも、こうやって読者のチェックが入って、それがこうして訂正されるのはすばらしいことです。みなさん、ありがとうございます! で、本の方はどうすべきかなあ。どうしたいか、エアーズに打診中です。← なおしていいとのことなので、増刷が今後あれば直します。正誤表にも入れました。

山形浩生の「経済のトリセツ」 by 山形浩生 Hiroo Yamagata is licensed under a Creative Commons 表示 - 継承 3.0 非移植 License.
*1:これをエアーズに指摘したら「いや、それはマイナスではなく、文脈から見てハイフンだと思う」とのお返事だが、それはちょっと苦しいと思う。