プログラムと統計

優れたハッカーのプログラムをデータとして統計的に処理することで、自分のプログラミングを洗練させる役に立てたい、と思っています。仮説として、優れたプログラムは作成者やその目的によらず、統計的にみると何らかの特徴があるのではないかと考えています。例えば、ユーティリティとしての短い関数が5%、読みやすい程度の長さの関数が80%、どうしても長くなってしまう関数が15%、といった具合です。ある程度のデータを集めれば、自分のプログラムを見直す際に、「この関数はちょっと長過ぎる気がする」と考える代わりに、「この長さの関数がxさん、yさんのプログラムに出てくる確率は0.5%だ」と考えるようになれるのではないでしょうか。