のうみそモジュラリティと塗ぬ照て羅ら (2014/06/02)


2014/05/30

技術的な記事書いた.

自然言語処理の一つにトピック抽出というのがあって, けっきょくのところは線形代数を使った行列の次元圧縮なんですが, だいたいこういうのはそのままやったら計算が終わらないという非常にせこい制限があって, その限界を回避する方法として, やっぱし線形代数によるうまい回避法を見つけた, というような話です.

やってるときは, けっこうせっぱつまっていたので, そうなると俺の場合はいろいろ調べている余裕とか, あんましなくなってしまってひたすら脳内にすべてを詰め込んで考えるモードに入っちゃうわけです. どこかの誰かが考えた方法を読んで理解する, というのがすごい苦手でね.

俺は自分の力には自信もってるけど, 一方, 自分の計算にはまったく自信がないわけで, やっぱし人前に出す場合はそのまえになんか似たような事を先人がやってないかチェックする. 誰か偉い人が既に同じ計算やってたら, 安心できるやん. それにいまさら線形代数で, まさか俺が新しい定理発見するわけないから, とっくに解ってる自明なことをさも自分が考えたような顔してたらいくらなんでも恥ずかしいがな.

すると, 面白いことに opencv っていう画像処理ライブラリで, 同じアルゴリズム(計算のケチりかた)が使われてるんよ. 何が面白いことやねん, て思うかもしれんけど, つまりこういうことよ.

片方は言葉でかかれた文章のセットから, 特徴的な話題を計算によって特定する. もう片方は画像のなかから特徴を計算によって特定する. この二つは人間の脳ではまったく別の場所で別のやり方で行われてる機能なわけだ. 頭の中で血管が切れて, 言葉関係のところだけ脳みそが死んじゃって言葉が判らなくなったりしても, 人の顔も一緒に判らなくなったりはしない(逆のケースもある)し, MRIとかで, 脳みそのどのへんで顔や言葉を認識してるかも, けっこう判ってきてるからね.

ここで昔ながらの人工知能のひとだと, 中でどういう処理が行われてるかを解明してそれを実装しないと気が済まない, みたいなことになったりするのかもしれませんが(実際どういうかんじなのか知らないんですが), 最近はそういうのとは違うわけ. そこそこそれっぽいものが, そこそこのスピードで動いたそれで十分, というわけです. it worked thats fine です.

そういう立場からすると, この, 全然別のデータを扱う全然別の心的作用というか高次認知というか, 何て言うのか知りませんが, それらの機能が, まったく同じ数理構造で表現可能になる, という事が面白いわけです. わかってくださいよ. ブレードランナーの寿司屋久々.

逗子の花火

one size fits all syndrome

スイスアーミーナイフ的アプローチというかね, ありますよねそういうの. 何でも全部詰め込んでないと気が済まない, 的な.

あるいはナイフの柄がパイプになってて, その中にクスリとかおやつとか寝床とか, なんや知らんけどそういうものが, あれやこれや全部入ってる, みたいなの.

なんかの幼児性の発露だと思うねんけど, あれは何なんやろね.

もうね. one shot one kill 方式に尽きるよ. そういう確実無比な連中を集めて, 頓知を効かせてそいつらを組み合わせるところにすべての妙味があるんよ. 俺はそれを unix で学んだよ.

まぁでも ice axe というまれな例外はあるけどな. pick と adze と cane が一緒になってる, っていう.

ぬてら作った


過去の落書きリスト