文化系文化系 (2011/09/07)


技術記事

久々に技術記事を書いたよ。 あんまし技術的じゃないけどね。 どっちかというと興味本位だけど。

本当は技術ネタもあるんだけど、まとめるのがめんどくさいんだよ。ヒジョーに。 opencv の話なんですが、もうね、Ruby 1.9対応で野良ビルドだし、 ときどき sigsegv で死ぬし、けっこうめんどくさくて手に負えないのでそのへんハショって書くと 読んだ方は役に立たないし。まあひとさまの役に立つような記事を書くというのは、 それは大変です。

上の記事は、文字列編集距離という概念(ある文字列と他の文字列がどれくらい近いか、 というはなしの一つ)と、 照明器具に入り込んだ虫のサイズの分布を調べた記事が面白かったので、 そこからの考察の話が主な話題かな。 虫の話は分布が巾分布というやつで、対象のサイズが \(x\) である確率が \(x^{-a}\) であるような 分布です。 この分布がおもしろいところは、 足切り線をどこに設定しても同じ形の分布になるところで、 つまり分布を特徴づけるサイズが無いところからスケールフリーな分布などと呼ばれる事もあります。

巾分布ぽいものがあったら累積分布を計算して(これは本質的にはサイズ順に並べる操作です) 両対数グラフにプロットしてみましょう。直線になったらビンゴです。

この両対数グラフの意味するところは案外深いものがあります。

対数なので比が等しいものが等距離に配置されるわけで(普通のグラフは 差が等しいものを等距離に配置します)、0点が無限遠にあるんですね。 グラフは右下がりの直線ですがどこまでいってもy軸の値は0には届かないので、 どんなに大きなメンバであっても出現確率は0にはなりません。 つまりどの巾分布にも有限の最大値というのはありません。

それじゃあなぜグラフが途中で終っているのかというと、それはたまたまです。 サイズが大きくなると出現確率は小さくなっていきますが、一方、サンプル数は有限なので、 出現数の期待値(サンプル数*出現確率)もどんどん小さくなって、 しまいにこれが1を切るあたりで個々のグラフは終りになるわけです。 ですが、同じ分布であるかぎり、調査範囲を拡大してサンプル数を増やすといくらでも大きなサンプルが出て来ます。

こういう面倒な性質がありますが、世の中には案外これがおおくて、私が見掛けた例でいうと

などがあります。金融商品の例とか、どうですか。 じつは先頃なくなった B. Mandelbrot さんの1960年代の仕事の一つに 金融商品の値動きがあります。 また金融商品の値動きで面白いのは、 タイムスケールの情報がないと、 一ヵ月ごとなのか5分ごとなのか、グラフを見ても判らないところです。 つまりある種の自己相似性を持っています。 このあたりは、昨年、会社をやめてから一時期為替の自動取り引きツールを作っていた頃にも、 わりと調べました。 こういう話も、そのうち書ける時も来るといいですね。

ということで、違うコーナーに書くべき内容になってしまいましたが、 まあかんべんしてください。 世の中にある数理構造にも、けっこう興味深いものは多いと思いませんか?

そして、 こういう課題を解決できる腕前を持つ人の多くは具体的なテーマに興味を持ってくれないものですが、 私の所属している会社なら全力で対応可能です。 もしこういった面倒な話に業務上でくわした方は、是非私に御一報下さい。 いま、たいへん暇で困っております。

2011/09/07

朝の散歩から

ぶんけいさいきょう

文化系の対義語って理科系の場合と体育会系の場合があって、 この二つをまとめて相手してる文化系って実は最強なんじゃないのか、 とふと思ったんですよ。

でもこの場合、非体育会系の理系は文化系理系となるわけで、それどっちやねんホンマわけわからんわ! とも思った文化系文化系のわしじゃった。あ。今気づいたけど、文化系は文化系に対する不動点オペレータですね。 やっぱ最強だわ、文化系。


過去の落書きリスト